Back to top

Autore Topic: robots.txt - limitazione cartelle e nomi sezioni/categorie  (Letto 2350 volte)

Offline andresb

  • Esploratore
  • **
  • Post: 185
    • Mostra profilo
Come da titolo, vorrei sapere se c'è qualcuno che sa spiegarmi esattamente come la limitazione dell'accesso alle cartelle specificata sul file robots.txt, possa influire sull'indicizzazione di sezioni, categorie e relativi articoli.

A quanto ne so io, è sconsigliato utilizzare per una sezione o categoria il nome di una cartella bloccata, pena la non indicizzazione della sezione/categoria stessa.
Ma la corrispondenza fra nomi deve essere perfetta, o basta che il nome della cartella comprenda quello della sezione/categoria?
Per spiegarmi meglio descrivo il mio caso:

In robots.txt compare come di default, fra gli altri

Disallow: /plugins

Ora, io ho sia una categoria (Notizie/plug-in) che una sezione (Plug-in) con questo nome, ma proprio per evitare la completa corrispondenza ho eliminato la "s" finale.
Per come la vedo io, così non dovrebbe bloccare l'indicizzazione (mentre credo avrebbe dovuta bloccarla nel caso contrario, ovvero se il nome del disallow fosse stato contenuto in quello di sezione/categoria), è giusto o sbaglio?

Nel caso blocchi l'indicizzazione, bloccherebbe l'indicizzazione anche di tutti gli articoli contenuti nella sezione/categoria?

E infine, questo rischio si presenta anche quando un termine bloccato (per esmpio, prendiamo la parola "media", per fare un altro esempio più diffuso) compare nel titolo di un singolo articolo?

grazie, scusate la lunghezza ma la questione se non spiegata bene può esser davvero poco chiara...
Suage
Charcot - Apéritif Pop

Offline sali40

  • Global Moderator
  • Instancabile
  • ********
  • Post: 4791
  • Sesso: Maschio
    • Mostra profilo
Re:robots.txt - limitazione cartelle e nomi sezioni/categorie
« Risposta #1 il: 22 Giu 2010, 13:12:46 »
no, quello che pensi tu è corretto.

Per identificare plugin e plugins, occorre che a plugin venga aggiunto * (plugin*? in questo caso tutto ciò che comincia con plugin vieno bloccato.

La corrispondenza, negli altri casi, deve essere perfetta, per bloccare con il robots.txt

Offline andresb

  • Esploratore
  • **
  • Post: 185
    • Mostra profilo
Re:robots.txt - limitazione cartelle e nomi sezioni/categorie
« Risposta #2 il: 22 Giu 2010, 15:07:38 »
Grazie.

Per quanto riguarda i titoli degli articoli sai nulla?
Ad esempio, (sempre considerando l'esempio Disallow: /plugins/):
Un articolo con una URL tipo questa, verrebbe indicizzato?

http://www.xxxx.it/nuovi-plugins-per-photoshop.html
Suage
Charcot - Apéritif Pop

Offline sali40

  • Global Moderator
  • Instancabile
  • ********
  • Post: 4791
  • Sesso: Maschio
    • Mostra profilo
Re:robots.txt - limitazione cartelle e nomi sezioni/categorie
« Risposta #3 il: 22 Giu 2010, 15:17:34 »
quella non è una cartella, ma un file che non sta in quella cartella e quindi non vedo perché dovrebbe venire bloccato  ;)

Offline andresb

  • Esploratore
  • **
  • Post: 185
    • Mostra profilo
Re:robots.txt - limitazione cartelle e nomi sezioni/categorie
« Risposta #4 il: 22 Giu 2010, 17:47:02 »
ok, grazie!
Suage
Charcot - Apéritif Pop

 



Web Design Bolzano Kreatif