Back to top

Autore Topic: Robots.txt  (Letto 2578 volte)

Offline Soundtek

  • Esploratore
  • **
  • Post: 78
  • Sesso: Maschio
    • Mostra profilo
Robots.txt
« il: 18 Dic 2010, 19:14:00 »
Ciao, ho aperto il robots.txt dalla mia home e ho preso un colpo! in pratica tutto è negato:

User-agent: *
Disallow: /administrator/
Disallow: /cache/
Disallow: /components/
Disallow: /images/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /libraries/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/
Disallow: /xmlrpc/


La cosa strana è che nei motori di ricerca sono tra i primi risultati (ok che non ho tanta concorrenza però..).
Il Friendly URL, mod_rewrite e il suffisso agli URL è tutto su on e funzionano senza problemi. Negli articoli uso le "Informazioni Metadata" come descritto in una guida di questo sito.

Dovrei per caso (e dico per caso ;D ;D) aprire un pò di più il sito hai bot o va bene così?

Offline maicolstaip

  • Global Moderator
  • Instancabile
  • ********
  • Post: 17623
  • Sesso: Maschio
    • Mostra profilo
Re:Robots.txt
« Risposta #1 il: 18 Dic 2010, 19:20:56 »
Ciao Soundtek,
al posto tuo lascerei così.
Non si risponde a PM tecnici. Postate sul forum. Grazie.

Offline Soundtek

  • Esploratore
  • **
  • Post: 78
  • Sesso: Maschio
    • Mostra profilo
Re:Robots.txt
« Risposta #2 il: 19 Dic 2010, 05:22:03 »
Ciao, dici di lasciare così? :o non è troppo chiuso? cioè praticamente dico hai bot ed agli spider che non possono "esaminare" niente del sito, ma proprio niente (neanche le immagini per google immagini per dirne una).

Con il friendly url il link si compone del nome della categoria quindi a rigor di logica i permessi del robot.txt non dovrebbero intaccare ma.. è effettivamente così?

Se su google faccio site:italiahummerclub.com compaiono 767 risultati (che tra l'altro mi chiedo da dove arrivino così tanti risultati perchè nel sito non ci sono così tante pagine effettivamente ;D ) quindi vuol dire che sono tutti indicizzati ma com'è possibile se dal robot.txt è vietato praticamente tutto? mi sfuggie sicuramente qualcosa ???
« Ultima modifica: 19 Dic 2010, 05:26:30 da Soundtek »

Offline taolo

  • Global Moderator
  • Instancabile
  • *****
  • Post: 3651
  • Sesso: Maschio
    • Mostra profilo
Re:Robots.txt
« Risposta #3 il: 19 Dic 2010, 12:40:44 »
Il tuo robot.txt è corretto.

Quelle cartelle bloccate è bene che non siano indicizzate.
Ogni tanto passo da Joomla Blog! Un blog su Joomla

Offline Soundtek

  • Esploratore
  • **
  • Post: 78
  • Sesso: Maschio
    • Mostra profilo
Re:Robots.txt
« Risposta #4 il: 19 Dic 2010, 14:20:56 »
Coma mai?

Nemmeno la cartella images per Google Immagini?

Offline taolo

  • Global Moderator
  • Instancabile
  • *****
  • Post: 3651
  • Sesso: Maschio
    • Mostra profilo
Re:Robots.txt
« Risposta #5 il: 20 Dic 2010, 00:35:57 »
Se non vuoi farti fregare le immagini, uno scopo di quel tipo di ricerca, Si!
Ogni tanto passo da Joomla Blog! Un blog su Joomla

 



Web Design Bolzano Kreatif