Joomla.it Forum
Componenti per Joomla! => SEO => : valentino86 23 Nov 2009, 09:22:02
-
Con gli strumenti di webmaster di goggle ho trovato:
6 pdf nel mio sito con URL limitato da robots.txt. Perchè?
Questo è il mio robots:
Sitemap: http://www.meccanicaweb.it/index.php?option=com_xmap&sitemap=1&view=xml&no_html=1
User-agent: Googlebot
Disallow: /administrator/
Disallow: /cache/
Disallow: /components/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /libraries/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/
Disallow: /xmlrpc/
User-agent: Bullseye/1.0
User-agent: Black Hole
User-agent: bot
User-agent: bot-
User-agent: bot/
User-agent: CopyRightCheck
User-agent: CherryPicker
User-agent: crawl
User-agent: DittoSpyder
User-agent: DISCo Pump 3.1
User-agent: EmailCollector
User-agent: EmailSiphon
User-agent: EmailWolf
User-agent: ExtractorPro
User-agent: hloader
User-agent: humanlinks
User-agent: LexiBot .
User-agent: LinkWalker
User-agent: Microsoft URL
User-agent: Microsoft URL Control - 5.01.4511
User-agent: Microsoft URL Control - 6.00.8169
User-agent: NetAttache
User-agent: NetAttache Light 1.1
User-agent: NetMechanic
User-agent: Offline Explorer
User-agent: robot
User-agent: Spider
User-agent: SuperBot
User-agent: SuperBot/2.6
User-agent: Teleport
User-agent: Titan
User-agent: Voila
User-agent: WebBandit
User-agent: WebCopier
User-agent: webcopy
User-agent: Web Image Collector
User-agent: webmirror
User-agent: WebReaper
User-agent: website extractor
User-agent: WinHTTrack
User-agent: shinchakubin
Disallow: /
E' un problema dei pdf?!
-
i pdf dove sono allocati fisicamente nella tua root?
-
Se sono "copie" di pagine html li escluderei tutte dall'indicizzazione. ;)
-
sono in varie sottocartelle all'interno di /images
No non sono copie.
-
sono in varie sottocartelle all'interno di /images
No non sono copie.
Allora togli da robot la cartella in questione. O meglio, specifica quale in essa non vuoi fare indizzare tipo stories ad esempio. - /images/stories -. Sii più specifico nel tuo robot :)
-
sono in varie sottocartelle all'interno di /images
No non sono copie.
Allora togli da robot la cartella in questione. O meglio, specifica quale in essa non vuoi fare indizzare tipo stories ad esempio. - /images/stories -. Sii più specifico nel tuo robot :)
infatti se vedi bene non ho messo nel robot tutta la cartella /images è per questo che mi sembra strano
-
Non avevo fatto caso; partivo dal presupposto che avevi il robot nativo.
Penso che la mancata indicizzazione possa dipendere dal fattore tempo e dai pochi link che puntano a quei file. Prova a linkarne qualcuno dalla home del tuo sito o da qualche pagina rilevante esterna ad esso. Vedi cosa succede e tienici informati.
Non posso a questo punto che linkarti la serp di google sull'argomento anche se, bada bene, molte delle istruzioni che troverai sono datate.
http://www.google.it/search?hl=it&q=ottimizzare+pdf&sourceid=navclient-ff&rlz=1B3GGGL_itIT352IT353&ie=UTF-8
-
forse il fattore tempo perche li ho messi in settimana. PErò già qualche link ci arriva, vabbè aspetterò
-
niente ancora non li vede ??? ???