Joomla.it Forum

Joomla! 1.5.x (versione con supporto terminato) => Joomla! 1.5 => : EmoArt 20 Dec 2011, 16:47:27

: file robot.txt per accesso indicizzazioni immagini
: EmoArt 20 Dec 2011, 16:47:27
Ho notato facendo una ricerca per immagini sul mio sito emoart.altervista che appaiono solo poche immagini in confronte a quante ne ho inserito, ho modificatotempo fà il file robot ma non vedo risultati.
Settato così è corretto? forse salto qualche passaggio?
:
User-agent: *
Disallow: /images/banners/
Disallow: /images/M_images/
Disallow: /images/smilies/
Disallow: /administrator/
Disallow: /cache/
Disallow: /components/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /libraries/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/
Disallow: /xmlrpc/
Premetto che la cartella delle immagini è quella predefinita da joomla.
: Re:file robot.txt per accesso indicizzazioni immagini
: apagano 21 Dec 2011, 10:28:39
Ciao Emoart, nel file robot che hai postato si evidenzia il consenso negato per le cartelle
:
Disallow: /images/banners/

Disallow: /images/M_images/
Disallow: /images/smilies/

Disallow: /administrator/
quindi non è questo il problema che hai con la cartella images o images/stories.
Ciao.
: Re:file robot.txt per accesso indicizzazioni immagini
: EmoArt 21 Dec 2011, 19:29:16
non capisco allora perchè le immagini non sono indicizzate su google,pur avendo affettuato mesi fà questa modifica al robot. Altri consigli? potrebbe esserci qualche altro problema che mi sfugge?
: Re:file robot.txt per accesso indicizzazioni immagini
: apagano 21 Dec 2011, 19:47:26
Non è facile a dirsi su due piedi. Una prima cosa da verificare e che non sia impedito l'utilizzo delle immagini a domini esterni sul htaccess. Guarda se hai codice tipo questo



:
RewriteEngine on
RewriteCond %{HTTP_REFERER}!^$
RewriteCond %{HTTP_REFERER}!^http://(www\.)?miosito.com/.*$ [NC]
RewriteRule .*\.(jpg|jpeg|gif|png|bmp)$ - [F]


controlla anche eventuali errori di accesso con strumenti per webmaster di google.
Dopo aver fatto qualche controllo prova a ripostare i risultati e se non risolvi proviamo ad andare oltre.
Spero di esserti stato utile.
: Re:file robot.txt per accesso indicizzazioni immagini
: giusebos 22 Dec 2011, 00:30:00
Per fare accedere gli spider dei motori alla tua cartella images devi inserire "allow", l'esatto contrario di ciò che hai indicato, e cioè "disallow".

Quindi per far si che le immagini del tuo sito vengono indicizzate:

:
allow: /images/cartella_mie_immagini/
: Re:file robot.txt per accesso indicizzazioni immagini
: EmoArt 22 Dec 2011, 10:35:19
:
#  Can be commented out if causes errors, see notes above.
# Options +FollowSymLinks

#
#  mod_rewrite in use

[glow=red,2,300]RewriteEngine On[/glow]

########## Begin - Rewrite rules to block out some common exploits
## If you experience problems on your site block out the operations listed below
## This attempts to block the most common type of exploit `attempts` to Joomla!
#
## Deny access to extension xml files (uncomment out to activate)
#<Files ~ "\.xml$">
#Order allow,deny
#Deny from all
#Satisfy all
#</Files>
## End of deny access to extension xml files
RewriteCond %{QUERY_STRING} mosConfig_[a-zA-Z_]{1,21}(=|\%3D) [OR]
# Block out any script trying to base64_encode crap to send via URL
RewriteCond %{QUERY_STRING} base64_encode.*\(.*\) [OR]
# Block out any script that includes a <script> tag in URL
RewriteCond %{QUERY_STRING} (\<|%3C).*script.*(\>|%3E) [NC,OR]
# Block out any script trying to set a PHP GLOBALS variable via URL
RewriteCond %{QUERY_STRING} GLOBALS(=|\[|\%[0-9A-Z]{0,2}) [OR]
# Block out any script trying to modify a _REQUEST variable via URL
RewriteCond %{QUERY_STRING} _REQUEST(=|\[|\%[0-9A-Z]{0,2})
# Send all blocked request to homepage with 403 Forbidden error!
RewriteRule ^(.*)$ index.php [F,L]
#
########## End - Rewrite rules to block out some common exploits

#  Uncomment following line if your webserver's URL
#  is not directly related to physical file paths.
#  Update Your Joomla! Directory (just / for root)

 RewriteBase /


########## Begin - Joomla! core SEF Section
#
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteCond %{REQUEST_URI} !^/index.php
RewriteCond %{REQUEST_URI} (/|\.php|\.html|\.htm|\.feed|\.pdf|\.raw|/[^.]*)$  [NC]
RewriteRule (.*) index.php
RewriteRule .* - [E=HTTP_AUTHORIZATION:%{HTTP:Authorization},L]
#
########## End - Joomla! core SEF Section

# # av:Toolbar
SetEnv AV_TOOLBAR 1
ErrorDocument 404 /
Ho controllato, a parte una stringa che ho evidenziato sembra tutto apposto, premetto che non conosco il significato di tutte le stringhe. Google non mi segnala nessun errore in merito ad eccessi bloccati ne pagine non raggiungibili. Per quanto riguarda il comando ALLOW non ha senso inserirlo nel file robots, perchè esso stesso serve solo per impedire gli accessi,per contro tutto quello che non è indicato dal file ha libero accesso.
: Re:file robot.txt per accesso indicizzazioni immagini
: giusebos 22 Dec 2011, 11:15:17

Ho controllato, a parte una stringa che ho evidenziato sembra tutto apposto, premetto che non conosco il significato di tutte le stringhe. Google non mi segnala nessun errore in merito ad eccessi bloccati ne pagine non raggiungibili. Per quanto riguarda il comando ALLOW non ha senso inserirlo nel file robots, perchè esso stesso serve solo per impedire gli accessi,per contro tutto quello che non è indicato dal file ha libero accesso.

Credo tu sia confuso.

Se blocchi la visita degli spider alla cartella image, come puoi pretendere che le cartelle al suo interno vengano visitate semplicemente perchè alle sottocartelle non è stato indicato niente??

puoi anche eliminare dal file robots tutte le stringhe che fanno riferimento alla cartella images, li lo spider farà da padrone indicizzando anche i file degli smiles e delle icone........
: Re:file robot.txt per accesso indicizzazioni immagini
: EmoArt 22 Dec 2011, 20:44:14
 ;)  ok provo.