Back to top

Autore Topic: Sito in Google, quanto tempo??  (Letto 8982 volte)

Offline cal0ger0

  • Nuovo arrivato
  • *
  • Post: 24
    • Mostra profilo
Re: Sito in Google, quanto tempo??
« Risposta #20 il: 23 Giu 2008, 01:28:06 »

3) creare un file robots.txt
Qui trovi un generatore automatico:

http://yellowpipe.com/yis/tools/robots.txt/
Questo impedisce l'accesso a spider non utili o dannosi, impedisce l'accesso agli script (rallenta il sito).

Dagli strumenti di google, risulta che ho gia un file robots.txt. Sono entrato da ftp nel server dove sta il sito, effetivamente c'è, ma non lo avevo creato io. Dentro il file c'è questo:
User-agent: *
Disallow: /administrator/
Disallow: /cache/
Disallow: /components/
Disallow: /images/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /libraries/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/
Disallow: /xmlrpc/

Quello che non capisco è cosa centra con l'indicizzazione. Mi spiego meglio: il mio robots.txt non permette l'accesso a nessun spider alle cartelle sopraindicate del mio sito. Questo non è un danno per l'indicizzazione?

In realtà che problemi avrei se permettessi la scansione di tutto il sito?
Come mi devo comportare con le cartelle da me create, nelle quali ho messo immagini e documenti, le blocco o le lascio aperte? 
/********************************************************
http://it.youtube.com/user/cal0ger0
http://calogerolombardo.altervista.org/ ********************************************************/

bsaett

  • Visitatore
Re: Sito in Google, quanto tempo??
« Risposta #21 il: 23 Giu 2008, 10:01:38 »
Per la sitemap utilizza XMAP: http://extensions.joomla.org/component/option,com_mtree/task,viewlink/link_id,3066/Itemid,35/

Poichè Joomla è un sito dinamico la sitemap deve essere aggiornata continuamente.

Per il robots.txt non è che non permette l'accesso a nessuno. Quel file dice a tutti i robots ( User-agent: * ) di non indicizzare alcune pagine del sito ( disallow: .... )
Le altre vengono lette tranquillamente. Considera che i contenuti del sito Joomla risiedono per lo più nel database non nelle cartelle che contengono gli script. Ed è meglio non dare l'accesso agli script, altrimenti i motori di ricerca rallenterebbero di molto il sito.
Se hai ulteriori cartelle che vuoi indicizzare (contenenti file), allora ti basta NON indicarle dopo un disallow, e vengono lette.

 



Web Design Bolzano Kreatif