Back to top

Autore Topic: Chiarimento sul file robots.txt  (Letto 1799 volte)

Offline mazzius

  • Esploratore
  • **
  • Post: 90
    • Mostra profilo
Chiarimento sul file robots.txt
« il: 24 Apr 2011, 18:36:54 »
Volevo capire se il file robots predefinito di joomla č idoneo perche il sito venga indicizzato dai motori di ricerca

il file predefinito e questo:
User-agent: *
Disallow: /administrator/
Disallow: /cache/
Disallow: /components/
Disallow: /images/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /libraries/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/
Disallow: /xmlrpc/


Andato sugli strumenti per webmaster di google e aggiungendo la regola per googlebot mi crea questo file robots.txt, quindi volevo capire la differenza  e quale mi consigliate utilizzare

User-agent: *
Allow: /

User-agent: Googlebot
Allow: /


Che mi dite?

Offline ilvanni

  • Global Moderator
  • Instancabile
  • ********
  • Post: 7038
  • Sesso: Maschio
  • Giovanni Vacca
    • Mostra profilo
Re:Chiarimento sul file robots.txt
« Risposta #1 il: 24 Apr 2011, 20:16:46 »
Ciao e auguri di buona pasqua, poi per il robots.txt puoi lasciare tranquillamente quello "di fabbrica", unico suggerimento: crea una sitemap ed aggiungi alla fine del robots la seguente dicitura: Sitemap: http:quellochečiltuosito/index.php?option=com_xmap&sitemap=1&view=xml (se la mappa l'hai creata con xmap e il suo id č 1 - rimane 1 se non ci sono altre sitemap interne, come nella stragrande maggioranza dei casi) oppure Sitemap:http seguito dall'indirizzo sito contenente anche il percorso della sitemap xml o html, fai tu dipende dalla sitemap che hai, poi reinvia la sitemap negli strumenti di google per webmaster e controlla, tanto se c'č qualche errore te lo fa presente lui (google x webmaster), ciao.

Offline maxzilla

  • Appassionato
  • ***
  • Post: 620
  • Sesso: Maschio
    • Mostra profilo
Re:Chiarimento sul file robots.txt
« Risposta #2 il: 14 Mag 2011, 00:22:21 »
Ciao Mazzius
io aggiungo anche

User-agent: NetMechanic
Disallow: /

User-agent: EmailCollector
Disallow: /

User-agent: EmailSiphon
Disallow: /

User-agent: EmailWolf
Disallow: /

ecc ecc ecc

Non e' fattore fondamentale per google, ma escludendo tutti gli spider che generano traffico inutilmente, aiuta. Dovresti trovare in giro una lista aggiornata
Ciao
Ikonart Informatica - Trento

"Mangia prodotti italiani. W il made in Italy"

 



Web Design Bolzano Kreatif