Back to top

Autore Topic: [RISOLTO]Impedire l'indicizzazione di un sito  (Letto 1583 volte)

Offline gallogallo

  • Nuovo arrivato
  • *
  • Post: 26
    • Mostra profilo
[RISOLTO]Impedire l'indicizzazione di un sito
« il: 07 Mar 2014, 16:26:51 »
Ciao a tutti, so che può sembrare paradossale ma vorrei sapere come posso fare per evitare che un sito entri nei motori di ricerca. Mi spiego meglio: ho "appoggiato" un sito su un host gratuito per farlo vedere e per farmi indicare dal proprietario eventuali modifiche da apportare. Nel frattempo però non vorrei che il sito venga indicizzato o che entri nelle liste dei motori di ricerca.
Spulciando tra le vecchie discussioni e leggendo su internet ho letto che bisognerebbe modificare il file robot.txt . Per cui ad esempio per escludere che tutti i robot scansionino directory del sito chiamate vendite e immagini, viene utilizzata la seguente sintassi:
User-agent: * Disallow: /vendite/ Disallow: /immagini/ 
Per far si che l'intero sito venga "ignorato" devo elencare tutte le cartelle? o non è questo il metodo giusto?
Grazie a tutti in anticipo
« Ultima modifica: 07 Mar 2014, 17:26:17 da gallogallo »

Offline maicolstaip

  • Global Moderator
  • Instancabile
  • ********
  • Post: 17623
  • Sesso: Maschio
    • Mostra profilo
Re:Impedire l'indicizzazione di un sito
« Risposta #1 il: 07 Mar 2014, 16:40:43 »
Ciao gallogallo,
se metti
Codice: [Seleziona]
Disallow: /lo spider non indicizza nulla.

Non si risponde a PM tecnici. Postate sul forum. Grazie.

Offline gallogallo

  • Nuovo arrivato
  • *
  • Post: 26
    • Mostra profilo
Re:Impedire l'indicizzazione di un sito
« Risposta #2 il: 07 Mar 2014, 16:55:57 »
Ciao Maicolstaip,
grazie per la risposta. Devo inserire il comando all'inizio o alla fine del txt?

Offline maicolstaip

  • Global Moderator
  • Instancabile
  • ********
  • Post: 17623
  • Sesso: Maschio
    • Mostra profilo
Re:Impedire l'indicizzazione di un sito
« Risposta #3 il: 07 Mar 2014, 17:21:00 »
Ciao gallogallo,
il file deve essere così:

Codice: [Seleziona]
# If the Joomla site is installed within a folder such as at
# e.g. www.example.com/joomla/ the robots.txt file MUST be
# moved to the site root at e.g. www.example.com/robots.txt
# AND the joomla folder name MUST be prefixed to the disallowed
# path, e.g. the Disallow rule for the /administrator/ folder
# MUST be changed to read Disallow: /joomla/administrator/
#
# For more information about the robots.txt standard, see:
# http://www.robotstxt.org/orig.html
#
# For syntax checking, see:
# http://www.sxw.org.uk/computing/robots/check.html

User-agent: *
Disallow: /
Non si risponde a PM tecnici. Postate sul forum. Grazie.

Offline gallogallo

  • Nuovo arrivato
  • *
  • Post: 26
    • Mostra profilo
Re:Impedire l'indicizzazione di un sito
« Risposta #4 il: 07 Mar 2014, 17:26:00 »
Grazie Mille MS!

Offline maicolstaip

  • Global Moderator
  • Instancabile
  • ********
  • Post: 17623
  • Sesso: Maschio
    • Mostra profilo
Re:[RISOLTO]Impedire l'indicizzazione di un sito
« Risposta #5 il: 07 Mar 2014, 17:31:47 »
E mi raccomando, quando metti il sito in produzione non dimenticare di rimettere il Robots.txt originale altrimenti hai problemi grandissimi di indicizzazione...

Ciao!
Non si risponde a PM tecnici. Postate sul forum. Grazie.

 



Web Design Bolzano Kreatif