Back to top

Autore Topic: file robot.txt per accesso indicizzazioni immagini  (Letto 2966 volte)

Offline EmoArt

  • Appassionato
  • ***
  • Post: 266
  • Sesso: Maschio
    • Mostra profilo
file robot.txt per accesso indicizzazioni immagini
« il: 20 Dic 2011, 16:47:27 »
Ho notato facendo una ricerca per immagini sul mio sito emoart.altervista che appaiono solo poche immagini in confronte a quante ne ho inserito, ho modificatotempo fà il file robot ma non vedo risultati.
Settato così è corretto? forse salto qualche passaggio?
Codice: [Seleziona]
User-agent: *
Disallow: /images/banners/
Disallow: /images/M_images/
Disallow: /images/smilies/
Disallow: /administrator/
Disallow: /cache/
Disallow: /components/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /libraries/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/
Disallow: /xmlrpc/
Premetto che la cartella delle immagini è quella predefinita da joomla.
Finchè ci credi è reale.

Offline apagano

  • Appassionato
  • ***
  • Post: 392
  • Sesso: Maschio
  • Il futuro lo si crea, non lo si subisce
    • Mostra profilo
Re:file robot.txt per accesso indicizzazioni immagini
« Risposta #1 il: 21 Dic 2011, 10:28:39 »
Ciao Emoart, nel file robot che hai postato si evidenzia il consenso negato per le cartelle
Codice: [Seleziona]
Disallow: /images/banners/

Disallow: /images/M_images/
Disallow: /images/smilies/

Disallow: /administrator/
quindi non è questo il problema che hai con la cartella images o images/stories.
Ciao.
Guarda i nostri lavori e chiedi un preventivo gratuito per il tuo sito professionale: http://digedit.it/siti-web-realizzati.html. Sconti per le web agency.
Guarda i nostri video-tutorial per joomla: www.youtube.com/user/digedit2011

Offline EmoArt

  • Appassionato
  • ***
  • Post: 266
  • Sesso: Maschio
    • Mostra profilo
Re:file robot.txt per accesso indicizzazioni immagini
« Risposta #2 il: 21 Dic 2011, 19:29:16 »
non capisco allora perchè le immagini non sono indicizzate su google,pur avendo affettuato mesi fà questa modifica al robot. Altri consigli? potrebbe esserci qualche altro problema che mi sfugge?
Finchè ci credi è reale.

Offline apagano

  • Appassionato
  • ***
  • Post: 392
  • Sesso: Maschio
  • Il futuro lo si crea, non lo si subisce
    • Mostra profilo
Re:file robot.txt per accesso indicizzazioni immagini
« Risposta #3 il: 21 Dic 2011, 19:47:26 »
Non è facile a dirsi su due piedi. Una prima cosa da verificare e che non sia impedito l'utilizzo delle immagini a domini esterni sul htaccess. Guarda se hai codice tipo questo



Codice: [Seleziona]
RewriteEngine on
RewriteCond %{HTTP_REFERER}!^$
RewriteCond %{HTTP_REFERER}!^http://(www\.)?miosito.com/.*$ [NC]
RewriteRule .*\.(jpg|jpeg|gif|png|bmp)$ - [F]


controlla anche eventuali errori di accesso con strumenti per webmaster di google.
Dopo aver fatto qualche controllo prova a ripostare i risultati e se non risolvi proviamo ad andare oltre.
Spero di esserti stato utile.
Guarda i nostri lavori e chiedi un preventivo gratuito per il tuo sito professionale: http://digedit.it/siti-web-realizzati.html. Sconti per le web agency.
Guarda i nostri video-tutorial per joomla: www.youtube.com/user/digedit2011

Offline giusebos

  • Fuori controllo
  • *
  • Post: 21748
  • Sesso: Maschio
  • Giuseppe Serbelloni Mazzanti Viendalmare
    • Mostra profilo
Re:file robot.txt per accesso indicizzazioni immagini
« Risposta #4 il: 22 Dic 2011, 00:30:00 »
Per fare accedere gli spider dei motori alla tua cartella images devi inserire "allow", l'esatto contrario di ciò che hai indicato, e cioè "disallow".

Quindi per far si che le immagini del tuo sito vengono indicizzate:

Codice: [Seleziona]
allow: /images/cartella_mie_immagini/
su www.icagenda.it guide e tutorial con esempi di chronoforms e chronoconnectivity

Offline EmoArt

  • Appassionato
  • ***
  • Post: 266
  • Sesso: Maschio
    • Mostra profilo
Re:file robot.txt per accesso indicizzazioni immagini
« Risposta #5 il: 22 Dic 2011, 10:35:19 »
Codice: [Seleziona]
#  Can be commented out if causes errors, see notes above.
# Options +FollowSymLinks

#
#  mod_rewrite in use

[glow=red,2,300]RewriteEngine On[/glow]

########## Begin - Rewrite rules to block out some common exploits
## If you experience problems on your site block out the operations listed below
## This attempts to block the most common type of exploit `attempts` to Joomla!
#
## Deny access to extension xml files (uncomment out to activate)
#<Files ~ "\.xml$">
#Order allow,deny
#Deny from all
#Satisfy all
#</Files>
## End of deny access to extension xml files
RewriteCond %{QUERY_STRING} mosConfig_[a-zA-Z_]{1,21}(=|\%3D) [OR]
# Block out any script trying to base64_encode crap to send via URL
RewriteCond %{QUERY_STRING} base64_encode.*\(.*\) [OR]
# Block out any script that includes a <script> tag in URL
RewriteCond %{QUERY_STRING} (\<|%3C).*script.*(\>|%3E) [NC,OR]
# Block out any script trying to set a PHP GLOBALS variable via URL
RewriteCond %{QUERY_STRING} GLOBALS(=|\[|\%[0-9A-Z]{0,2}) [OR]
# Block out any script trying to modify a _REQUEST variable via URL
RewriteCond %{QUERY_STRING} _REQUEST(=|\[|\%[0-9A-Z]{0,2})
# Send all blocked request to homepage with 403 Forbidden error!
RewriteRule ^(.*)$ index.php [F,L]
#
########## End - Rewrite rules to block out some common exploits

#  Uncomment following line if your webserver's URL
#  is not directly related to physical file paths.
#  Update Your Joomla! Directory (just / for root)

 RewriteBase /


########## Begin - Joomla! core SEF Section
#
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteCond %{REQUEST_URI} !^/index.php
RewriteCond %{REQUEST_URI} (/|\.php|\.html|\.htm|\.feed|\.pdf|\.raw|/[^.]*)$  [NC]
RewriteRule (.*) index.php
RewriteRule .* - [E=HTTP_AUTHORIZATION:%{HTTP:Authorization},L]
#
########## End - Joomla! core SEF Section

# # av:Toolbar
SetEnv AV_TOOLBAR 1
ErrorDocument 404 /
Ho controllato, a parte una stringa che ho evidenziato sembra tutto apposto, premetto che non conosco il significato di tutte le stringhe. Google non mi segnala nessun errore in merito ad eccessi bloccati ne pagine non raggiungibili. Per quanto riguarda il comando ALLOW non ha senso inserirlo nel file robots, perchè esso stesso serve solo per impedire gli accessi,per contro tutto quello che non è indicato dal file ha libero accesso.
Finchè ci credi è reale.

Offline giusebos

  • Fuori controllo
  • *
  • Post: 21748
  • Sesso: Maschio
  • Giuseppe Serbelloni Mazzanti Viendalmare
    • Mostra profilo
Re:file robot.txt per accesso indicizzazioni immagini
« Risposta #6 il: 22 Dic 2011, 11:15:17 »

Ho controllato, a parte una stringa che ho evidenziato sembra tutto apposto, premetto che non conosco il significato di tutte le stringhe. Google non mi segnala nessun errore in merito ad eccessi bloccati ne pagine non raggiungibili. Per quanto riguarda il comando ALLOW non ha senso inserirlo nel file robots, perchè esso stesso serve solo per impedire gli accessi,per contro tutto quello che non è indicato dal file ha libero accesso.

Credo tu sia confuso.

Se blocchi la visita degli spider alla cartella image, come puoi pretendere che le cartelle al suo interno vengano visitate semplicemente perchè alle sottocartelle non è stato indicato niente??

puoi anche eliminare dal file robots tutte le stringhe che fanno riferimento alla cartella images, li lo spider farà da padrone indicizzando anche i file degli smiles e delle icone........
su www.icagenda.it guide e tutorial con esempi di chronoforms e chronoconnectivity

Offline EmoArt

  • Appassionato
  • ***
  • Post: 266
  • Sesso: Maschio
    • Mostra profilo
Re:file robot.txt per accesso indicizzazioni immagini
« Risposta #7 il: 22 Dic 2011, 20:44:14 »
 ;)  ok provo.
Finchè ci credi è reale.

 



Web Design Bolzano Kreatif