Back to top

Autore Topic: Semplice info sul file robots.txt  (Letto 2383 volte)

Offline 71^sec.design

  • Appassionato
  • ***
  • Post: 474
  • Sesso: Femmina
  • www.webinword.com
    • Mostra profilo
Semplice info sul file robots.txt
« il: 17 Ott 2013, 15:47:12 »
Ciao,
nel mio file robots.txt trovo questo:



User-agent: *
Disallow: /administrator/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /images/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /libraries/
Disallow: /logs/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/


mi chiedevo solo se tutti quei disallow sono regolari.
Il sito è questo, è appena stato rimesso online, prima era offline per lavori.
Grazie
« Ultima modifica: 18 Ott 2013, 08:50:53 da 71^sec.design »
WebinWord.com | Google Partner

Offline tonicopi

  • Global Moderator
  • Instancabile
  • ********
  • Post: 12790
  • Sesso: Maschio
    • Mostra profilo
Re:Semplice info sul file robots.txt
« Risposta #1 il: 17 Ott 2013, 15:54:00 »
Quello è il tipico file robots.txt di default presente in joomla.
Direi che va bene. Salvo che dovresti togliere la riga che disabilita le immagini se vuoi farle indicizzare.
Io normalmente lo faccio perchè anche la ricerca per imamgini qualche visita la porta.
Se togli la riga elimina anche lo spazio vuoto:
Disallow: /components/
Disallow: /includes/
Disallow: /installation/

 ;)
edit: togli anche la cartella installation che neppure c'è...
« Ultima modifica: 17 Ott 2013, 15:55:36 da tonicopi »
joomlacsszengarden.com = il giardino dei css di Joomla!
L'attesa del piacere è essa stessa... piacere!

Offline 71^sec.design

  • Appassionato
  • ***
  • Post: 474
  • Sesso: Femmina
  • www.webinword.com
    • Mostra profilo
Re:Semplice info sul file robots.txt
« Risposta #2 il: 17 Ott 2013, 15:58:17 »
Mamma mia che bella info che mi hai dato.
Grazie Tonicopi.
Fammi capire bene perchè non vorrei fare stupidaggini.
Quelle 3 righe che mi hai elencato
Disallow: /components/
Disallow: /includes/
Disallow: /installation/
sono quelle che dovrei eliminare per far si che si possano indicizzare anche le immagini?
WebinWord.com | Google Partner

Offline 71^sec.design

  • Appassionato
  • ***
  • Post: 474
  • Sesso: Femmina
  • www.webinword.com
    • Mostra profilo
Re:Semplice info sul file robots.txt
« Risposta #3 il: 17 Ott 2013, 16:06:09 »
No scusa ho detto una cavolata.
ho tolto semplicemente la riga delle immagini
se tolgo anche la riga:
Disallow: /installation/
siamo sicuri che non succede nulla?
WebinWord.com | Google Partner

Offline tonicopi

  • Global Moderator
  • Instancabile
  • ********
  • Post: 12790
  • Sesso: Maschio
    • Mostra profilo
Re:Semplice info sul file robots.txt
« Risposta #4 il: 17 Ott 2013, 16:14:20 »
Certo che no. La cartella installation non c'è più nella root, questa è una certezza altrimenti il sito mica girerebbe. Il tuo file deve diventare così:
User-agent: *
Disallow: /administrator/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /includes/
Disallow: /language/
Disallow: /libraries/
Disallow: /logs/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/
naturalmente se hai delle sottocartelle che non vuoi fare indicizzare devi aggiungerle. Talvolta si tiene un intero sito sotto la cartella vecchio_sito e non credo avresti piacere che quelle pagine venissero indicizzate. Oppure una cartella documenti o una tua cartella di foto_private dentro la cartella images.
Se tu volessi far indicizzare tutte le immagini, ma non quelle, dovresti aggiungere la riga:
Disallow: /images/foto_private/
 ;)
joomlacsszengarden.com = il giardino dei css di Joomla!
L'attesa del piacere è essa stessa... piacere!

Offline 71^sec.design

  • Appassionato
  • ***
  • Post: 474
  • Sesso: Femmina
  • www.webinword.com
    • Mostra profilo
Re:Semplice info sul file robots.txt
« Risposta #5 il: 17 Ott 2013, 16:24:50 »
Ora capisco.
Ma non è che tutti questi disallow non mi fanno indicizzare proprio il sito, cioè, io voglio che le pagine e le immagini del mio sito siano indicizzate.
Come faccio a sapere se le pagine sono realmente indicizzate?
WebinWord.com | Google Partner

Offline 71^sec.design

  • Appassionato
  • ***
  • Post: 474
  • Sesso: Femmina
  • www.webinword.com
    • Mostra profilo
Re:Semplice info sul file robots.txt
« Risposta #6 il: 17 Ott 2013, 16:39:31 »
Perchè ora vi spiego.
se faccio una ricerca su google scrivendo ellio...............tel.it (che sarebbe il link del sito) il primo risultato che trovo è www.ellio............tel.it/installation/index.php
Naturalmente è la pagina SBAGLIATA!
Voglio che sia la home o un'altra pagina principale del sito, allora ho provato a rimuovere la riga riguardante installation nel file robots.txt, come consigliato da te tonicopi.
Ho cancellato la cache e se rifaccio la ricerca mi visualizza sempre quel risultato.
WebinWord.com | Google Partner

Offline tonicopi

  • Global Moderator
  • Instancabile
  • ********
  • Post: 12790
  • Sesso: Maschio
    • Mostra profilo
Re:Semplice info sul file robots.txt
« Risposta #7 il: 17 Ott 2013, 16:57:51 »
Ma non pensaerai davvero di cambiare i risultati della ricerca di google cambiando un file, così al volo!
Google può impiegare mesi a cancellare le pagine che ha in cache.
Se esce quel risultato vuol dire che in quel sito è stata presente la cartella installation invece che procedere all'installazione e poi cancellarla. E quella pagina è stata stranamente indicizzata da google. Fai un redirect di quell'errore e mandalo in home.  Stai tranquilla che quei disallow vanno bene e non danneggiano per nulla il sito. E lascia pure in disallow anche la cartella installation, per quel che serve....
joomlacsszengarden.com = il giardino dei css di Joomla!
L'attesa del piacere è essa stessa... piacere!

Offline 71^sec.design

  • Appassionato
  • ***
  • Post: 474
  • Sesso: Femmina
  • www.webinword.com
    • Mostra profilo
Re:Semplice info sul file robots.txt
« Risposta #8 il: 17 Ott 2013, 17:09:20 »
E anche su questo hai ragione. Possiamo dire quindi che è solo questione di tempo.
Ho ancora una domanda da farti, spero l'ultima. Mi hai detto << Fai un redirect di quell'errore e mandalo in home. >>
Come faccio a trovare quella pagina e fare il redirect?
WebinWord.com | Google Partner

Offline tonicopi

  • Global Moderator
  • Instancabile
  • ********
  • Post: 12790
  • Sesso: Maschio
    • Mostra profilo
Re:Semplice info sul file robots.txt
« Risposta #9 il: 17 Ott 2013, 17:35:29 »
Per esempio scrivendo questa riga nel file .htaccess
Redirect 301 /installation/index.php indirizzo_pagina_dove_direzionare
o anche utilizzando la componente redirect presente di default in joomla2.5:
http://www.joomla.it/video-guide/7247-video-corso-base-joomla-componente-redirect-e-quello-di-ricerca.html
« Ultima modifica: 17 Ott 2013, 17:53:25 da tonicopi »
joomlacsszengarden.com = il giardino dei css di Joomla!
L'attesa del piacere è essa stessa... piacere!

Offline 71^sec.design

  • Appassionato
  • ***
  • Post: 474
  • Sesso: Femmina
  • www.webinword.com
    • Mostra profilo
Re:Semplice info sul file robots.txt
« Risposta #10 il: 17 Ott 2013, 17:38:48 »
Che altro dire, Grazie!
Solo un piacere ti chiedo, potresti rimuovere il link www.ellio........tel.it del tuo ultimo post?
Saluti
WebinWord.com | Google Partner

Offline tonicopi

  • Global Moderator
  • Instancabile
  • ********
  • Post: 12790
  • Sesso: Maschio
    • Mostra profilo
Re:Semplice info sul file robots.txt
« Risposta #11 il: 17 Ott 2013, 17:54:16 »
Ok fatto
joomlacsszengarden.com = il giardino dei css di Joomla!
L'attesa del piacere è essa stessa... piacere!

Offline il_kreatore

  • Esploratore
  • **
  • Post: 148
  • Sesso: Maschio
    • Mostra profilo
Re:Semplice info sul file robots.txt
« Risposta #12 il: 17 Ott 2013, 21:42:29 »
Che altro dire, Grazie!
Solo un piacere ti chiedo, potresti rimuovere il link www.ellio........tel.it del tuo ultimo post?
Saluti
Ti conviene cancellarlo anche dal tuo primo post  ::)

Gavino

 



Web Design Bolzano Kreatif