Back to top

Autore Topic: robots.txt  (Letto 6539 volte)

Offline :: Matteo ::

  • Appassionato
  • ***
  • Post: 231
  • Top top!
    • Mostra profilo
robots.txt
« il: 15 Giu 2010, 18:37:39 »
Sto cercando di "risollevare" il mio sito nei motori di ricerca, e stò seguendo la vostra guida x il seo ecc.
Nell'usare i google webtools, ho notato che sarebbe utile un file robots.txt.
Ho visto che a seconda del risultato che si vuole si possono escludere/includere alcune pagine, allora la mia domanda è: per un sito "generico" fatto in Joomla quali impostazioni di base di devono usare anche per garantire una certa sicurezza?
che directory devo escludere?
grazie
(un file di esempio?)
Ciao!

Offline 56francesco

  • Fuori controllo
  • *
  • Post: 29585
  • Sesso: Maschio
    • Mostra profilo
Re:robots.txt
« Risposta #1 il: 15 Giu 2010, 18:42:12 »
lascialo come sta,  al massimo massimo se hai aperto nella root del sito  una cartella  con dentro dei files allora inserisci nella cartella una index.html  (pagina binca 77kb)  e il nome nel file robots

se vuoi sapere a cosa serve in rete non ti sarà difficile trovare molta documentazione, ma non centra niente con quello che vuoi fare
(uso XP perchè win98 non si installa) 
PS: non sono un dipendente dello sbonzor quindi è necessario un "per favore" alla richiesta e un "grazie" alla risposta, sempre! PPS: non scrivo mai per primo in MP, in caso contrario chiedimi una conferma, Grazie.

Offline :: Matteo ::

  • Appassionato
  • ***
  • Post: 231
  • Top top!
    • Mostra profilo
Re:robots.txt
« Risposta #2 il: 15 Giu 2010, 19:21:38 »
(innanzi tutto grazie...)

"inserisci nella cartella una index.html  (pagina binca 77kb)  e il nome nel file robots"
Dimmi se ho capito bene:
nella mia cartella che contiene i files devo mettere un file index.html vuoto
e devo aggiungere al file robots.txt (in disabilita) quella cartella?

Se la cartella ha i permessi 700 devo farlo uguale?
« Ultima modifica: 15 Giu 2010, 19:23:53 da :: Matteo :: »
Ciao!

Offline 56francesco

  • Fuori controllo
  • *
  • Post: 29585
  • Sesso: Maschio
    • Mostra profilo
Re:robots.txt
« Risposta #3 il: 15 Giu 2010, 19:26:05 »
Citazione
nella mia cartella che contiene i files devo mettere un file index.html vuoto
sempre, in tutte le cartelle nuove che apri, e anche in quelle delle estensioni  se non la tengono già, carenza molto frequente..
Citazione
e devo aggiungere al file robots.txt (in disabilita) quella cartella?
solo se apri una cartella nella root, 
se  apri una qualsiasi sottocartella in quelle di joomla non serve perchè l'istruzione disallow cartella comprende ovviamente tutte le sottocartelle e i files contenuti


« Ultima modifica: 15 Giu 2010, 19:29:36 da 56francesco »
(uso XP perchè win98 non si installa) 
PS: non sono un dipendente dello sbonzor quindi è necessario un "per favore" alla richiesta e un "grazie" alla risposta, sempre! PPS: non scrivo mai per primo in MP, in caso contrario chiedimi una conferma, Grazie.

Offline :: Matteo ::

  • Appassionato
  • ***
  • Post: 231
  • Top top!
    • Mostra profilo
Re:robots.txt
« Risposta #4 il: 15 Giu 2010, 19:37:58 »
ma che succede se non c'è l'index.html?
(dove lo prendo uno vuoto?)
Ciao!

Offline 56francesco

  • Fuori controllo
  • *
  • Post: 29585
  • Sesso: Maschio
    • Mostra profilo
Re:robots.txt
« Risposta #5 il: 15 Giu 2010, 19:42:54 »
succede che la cartella si apre  digitando l'indirizzo esatto nella barra e mostra il suo contenuto
non è una bella cosa, se ci fossero degli oggetti ad esempio dei  file  .pdf  .jpg  .avi ecc.  potrebbero essere tranquillamente aperti e scopiazzati ecc.. ecc..

quindi uno qualsiasi dei files .html che già ci stanno,  lo scarichi nel tuo pc e poi via ftp lo distribuisci dove serve..

(uso XP perchè win98 non si installa) 
PS: non sono un dipendente dello sbonzor quindi è necessario un "per favore" alla richiesta e un "grazie" alla risposta, sempre! PPS: non scrivo mai per primo in MP, in caso contrario chiedimi una conferma, Grazie.

Offline :: Matteo ::

  • Appassionato
  • ***
  • Post: 231
  • Top top!
    • Mostra profilo
Re:robots.txt
« Risposta #6 il: 15 Giu 2010, 19:53:10 »
ma anche se i permessi della cartella sono impostati su 700 serve l'index.html?
Ciao!

Offline 56francesco

  • Fuori controllo
  • *
  • Post: 29585
  • Sesso: Maschio
    • Mostra profilo
Re:robots.txt
« Risposta #7 il: 15 Giu 2010, 20:04:38 »
si  certo, la pagina bianca serve sempre magari fai dei test 
i permessi sono cosa diversa, inoltre 700 è abbastanza insolito,  se lo hai impostato tu ripristinalo  come era meglio non impicciarsi di certe cose della lamp  senza essere dei tecnici provetti


(uso XP perchè win98 non si installa) 
PS: non sono un dipendente dello sbonzor quindi è necessario un "per favore" alla richiesta e un "grazie" alla risposta, sempre! PPS: non scrivo mai per primo in MP, in caso contrario chiedimi una conferma, Grazie.

Offline :: Matteo ::

  • Appassionato
  • ***
  • Post: 231
  • Top top!
    • Mostra profilo
Re:robots.txt
« Risposta #8 il: 15 Giu 2010, 20:42:50 »
Possiamo fare una prova assieme?

riesci a leggere questa cartella:?
http://lnx.agliocchi.it/prova/
o a leggere questo file?
http://lnx.agliocchi.it/prova/gekko1.jpg

invece proviamo quest'altra:
http://lnx.agliocchi.it/prova2/
o a leggere questo file?
http://lnx.agliocchi.it/prova2/gekko1.jpg

Grazie!...
Ciao!

Offline 56francesco

  • Fuori controllo
  • *
  • Post: 29585
  • Sesso: Maschio
    • Mostra profilo
Re:robots.txt
« Risposta #9 il: 15 Giu 2010, 20:51:22 »
ma allora sei provetto..
 :D
è diverso, sposto nella sezione sviluppo..
(uso XP perchè win98 non si installa) 
PS: non sono un dipendente dello sbonzor quindi è necessario un "per favore" alla richiesta e un "grazie" alla risposta, sempre! PPS: non scrivo mai per primo in MP, in caso contrario chiedimi una conferma, Grazie.

Offline :: Matteo ::

  • Appassionato
  • ***
  • Post: 231
  • Top top!
    • Mostra profilo
Re:robots.txt
« Risposta #10 il: 15 Giu 2010, 20:57:31 »
come al solito non ho capito....cioè?
Ciao!

Offline 56francesco

  • Fuori controllo
  • *
  • Post: 29585
  • Sesso: Maschio
    • Mostra profilo
Re:robots.txt
« Risposta #11 il: 15 Giu 2010, 21:02:12 »
la sezione 1.5 è più generica e la la sezione sviluppo è per argomenti più avanzati, inoltre quel file non è specifico per joomla,  quindi  qui l'argomento troverà maggior seguito, almeno credo..
vedremo..
(uso XP perchè win98 non si installa) 
PS: non sono un dipendente dello sbonzor quindi è necessario un "per favore" alla richiesta e un "grazie" alla risposta, sempre! PPS: non scrivo mai per primo in MP, in caso contrario chiedimi una conferma, Grazie.

Offline mmleoni

  • Global Moderator
  • Instancabile
  • *****
  • Post: 5547
  • Sesso: Maschio
  • Just another *nix coder/sysadmin...
    • Mostra profilo
Re:robots.txt
« Risposta #12 il: 15 Giu 2010, 21:57:50 »
ciao,
 facciamo un po di chiarezza:

robots.txt è un protocollo di esclusione, quindi serve solo a dire al motore dove non andare. vi è però da dire che è invalsa la consuetudine di inserire in coda a tale file la direttiva Sitemap:, solo in questo caso si può dire che robots.txt serve ad includere delle pagine (ma si tratta di una sitemap, non di una pagina)

index.html serve ad impedire la visualizzazione del contenuto della directory ove non vi sia un altro 'default document'; ciò avverrebbe, comunque, solo se fosse indicata l'opzione indexes nella configurazione del server: cosa più unica che rara su un server di produzione.

permessi non c'entrano assolutamente niente con questo discorso (si parla di impedire il listing della directory, NON l'accesso alla stessa) quindi lasciali come stanno.

ciao,
marco
mmleoni web consulting - creazione siti web aziendali ed e-commerce avanzati - sviluppo moduli e componenti Joomla

Offline :: Matteo ::

  • Appassionato
  • ***
  • Post: 231
  • Top top!
    • Mostra profilo
Re:robots.txt
« Risposta #13 il: 16 Giu 2010, 12:19:13 »
come faccio a fare il listing di una directory?
Ho notato che se metto i permessi a 700 non mi fa accedere ai files che sono contenuti a meno di essere loggato. E quello per me è bene. Ma con i permessi a 700 posso listare la directory?
Ciao!

mau_develop

  • Visitatore
Re:robots.txt
« Risposta #14 il: 16 Giu 2010, 12:25:51 »
ma cos'è che vuoi fare?

sei partito cercando di sollevare le visite.. con il robots ??

il robots serve ai motori e agli spider per sapere come muoversi e dove non andare (ma possono non rispettare qs obbligo)

forse quello che serve a te è la mappa del sito, quella è una lista di directory e contenuti da indicizzare, la piantina di casa per chi ti visita.

il robots txt va bene così com'è e pure i permessi dei files/cartelle

M.

Offline :: Matteo ::

  • Appassionato
  • ***
  • Post: 231
  • Top top!
    • Mostra profilo
Re:robots.txt
« Risposta #15 il: 16 Giu 2010, 12:47:51 »
No, è che come si dice "da un discorso annamo a n'altro"
La questionde le robots.txt l'ho capita, ho iserito solo qualche divieto in più.
Adesso mi volevo concentrare sul discorso dell'accesso alle cartelle da parte di visitatori esterni non autorizzati...e volevo capire com interdire cartelle che sono in realtà dei depositi di files

shure as hell, i'm "off topic"!! però oramai la frittata è fatta!
Ciao!

mau_develop

  • Visitatore
Re:robots.txt
« Risposta #16 il: 16 Giu 2010, 13:06:11 »
occhio ai pasticci,... mai avuto qs problemi con joomla... semmai i problemi li causa il server.

per ciò che non deve essere listato joomla inserisce un index.html vuoto

qualsiasi componente che installi che offre contenuti riservati è dotato di scripting a protezione di quei contenuti, basta che quella cartella contenga un index.php con uno script che guarda se la richiesta è interna o esterna..

... consiglio mio... non giocare coi permessi.

M.

Offline :: Matteo ::

  • Appassionato
  • ***
  • Post: 231
  • Top top!
    • Mostra profilo
Re:robots.txt
« Risposta #17 il: 16 Giu 2010, 14:00:03 »
dove posso trovar euno di questi index.php con lo script??
"index.php con uno script che guarda se la richiesta è interna o esterna.."
Ciao!

mau_develop

  • Visitatore
Re:robots.txt
« Risposta #18 il: 16 Giu 2010, 14:33:45 »
aspetta però, perchè qs topic è abbastanza confusionario, si parla di mille cose e si rischia solo di fare confusione.

Se siamo qui sottointendo che si parli di Joomla e con joomla questa cosa la fa già lui o gli appropriati addons che installi.
Già durante l'installazione i permessi delle cartelle riservate e il loro accesso è gestito da joomla e dal server, tu non devi fare nulla.

Se nonstante tutto tu riesci ad accedere a contenuti protetti c'è qualcosa che non va e possono essere i permessi del server, ma dare numerini a caso senza sapere la conf del server non ha senso.

Altre cosucce possono essere fatte con l'htaccess.

M.

Offline :: Matteo ::

  • Appassionato
  • ***
  • Post: 231
  • Top top!
    • Mostra profilo
Re:robots.txt
« Risposta #19 il: 16 Giu 2010, 14:53:34 »
"Altre cosucce possono essere fatte con l'htaccess" Tipo?
Perchè adesso io l'ho impostato per il SEO/SEF, ed ho messo i settaggi della guida, (sottocartella ecc).
Il SEO/SEF funziona, ma se ti dovessi dire che ho capito come funziona l' htaccess... non saprei da dove cominciare.
Può essere usato per prevenire l'accesso ad alcune cartelle?

poi si stiamo parlando di joomla, nel senso che in questo spazio di jooma.it ci sono molte risorse, ed è fatto bene. Visto che è prassi installare joomla come sistema principale per i siti internet e parallelamente installare altri sistemi, (magari media wiki, oppure CRM vari) è interessante capire come proteggere i vari componenti garantendo un opportuna visibilità al sito.

Percui cose come robots.txt, gli index.html e .htaccess sono sì generiche ma se c'è la possibilità di spiegarle bene...è il caso di approfittarne perchè alcune cose tornano sempre utili!
Magari poi si raccoglono i contributi e si mettono in una guida sulla sicurezza...
« Ultima modifica: 16 Giu 2010, 14:59:56 da :: Matteo :: »
Ciao!

 



Web Design Bolzano Kreatif