Back to top

Autore Topic: Joomla e robots.txt  (Letto 2520 volte)

Offline giggioman00

  • Appassionato
  • ***
  • Post: 293
    • Mostra profilo
Joomla e robots.txt
« il: 03 Ago 2015, 03:34:44 »
Salve, mi è arrivata questa email da google

Citazione
Di recente, i sistemi di Google hanno rilevato un problema con la tua home page che influisce negativamente sulla visualizzazione e sull'indicizzazione dei tuoi contenuti da parte dei nostri algoritmi. Nello specifico, Googlebot non può accedere ai tuoi file JavaScript e/o CSS a causa delle limitazioni del tuo file robots.txt. Questi file aiutano Google a comprendere se il tuo sito web funziona correttamente, pertanto bloccare l'accesso a questi asset può causare ranking inferiori a quelli ottimali.

Nei robots, infatti, c'è la linea:

Disallow: /components/

E nella cartella components si trovano i css e i js dei vari componenti. Quindi come fare? Non mi sembra una buona idea eliminare il disallow della cartella components per motivi di sicurezza, ma tenerlo e poi crollare nei motori di ricerca non mi sembra una valida alternativa

Offline tomtomeight

  • Global Moderator
  • Fuori controllo
  • ********
  • Post: 32046
  • Sesso: Maschio
  • Gli automatismi aiutano ma non insegnano nulla.
    • Mostra profilo
Re:Joomla e robots.txt
« Risposta #1 il: 03 Ago 2015, 07:40:57 »
Il file robots.txt non compromette nessuna sicurezza, leggi

http://forum.joomla.it/index.php/topic,253392.0.html

Offline giggioman00

  • Appassionato
  • ***
  • Post: 293
    • Mostra profilo
Re:Joomla e robots.txt
« Risposta #2 il: 03 Ago 2015, 14:23:48 »
Beh, però se lasci indicizzare le cartelle del sito tipo components, la gente può sapere tutti i componenti che hai installato (anche quelli disattivati) e può essere un problema, no?

Ho letto alla veloce quella discussione, ma non c'è un modo per far accedere ai file css e js di tutto il sito senza togliere la disattivazione di tutta la cartella?
E poi... A me dice che non riesce ad accedere nemmeno ai file di font

Offline giovi

  • Instancabile
  • ******
  • Post: 9835
  • Sesso: Maschio
    • Mostra profilo
Re:Joomla e robots.txt
« Risposta #3 il: 03 Ago 2015, 14:37:57 »
Se il componente piazza quel materiale all'interno delle cartelle in cui è contenuta la business logic e non nelle cartelle dedicate come "images" o "media" non è un componente scritto bene. Ad ogni modo google indicizza solo ciò che è linciato su internet, non si permette di andare a ricercare con un algoritmo bruteforce tutto ciò che c'è sul sito. Lui consulta quel file solo se trova un link e solo per sapere se può indicizzarlo o meno. E' una convenzione, potrebbe benissimo ignorarlo ed indicizzare quello che gli capita a tiro.


Il problema di sicurezza non è se un utente scopre che hai un certo componente installato ma il fatto in se che lo hai installato. Se il componente non presenta vulnerabilità non corri alcun un problema di sicurezza.


Come ti ha spiegato tomtomeight, se il tuo sito è aggiornato e ben strutturato, non c'è nulla da temere a livello di sicurezza modificando il file robot.txt.


Guarda il file robot.txt in questo modo: è un cartello messo vicino ad una bancarella piena di gioielli preziosi con su scritto "non toccare"...


edit: perdonate i termini apparentemente fuori luogo ma la correzione grammaticale del mio computer è peggio della mia professoressa di lettere e corregge tutti i termini stranieri con quelli che più gli assomigliano...
« Ultima modifica: 03 Ago 2015, 14:39:44 da giovi »

Offline tomtomeight

  • Global Moderator
  • Fuori controllo
  • ********
  • Post: 32046
  • Sesso: Maschio
  • Gli automatismi aiutano ma non insegnano nulla.
    • Mostra profilo
Re:Joomla e robots.txt
« Risposta #4 il: 03 Ago 2015, 14:49:20 »
Citazione
Beh, però se lasci indicizzare le cartelle del sito tipo components, la gente può sapere tutti i componenti che hai installato (anche quelli disattivati) e può essere un problema, no?

Non c'è mica bisogno del file robots.tht per conoscere e leggere quali file .cs, .js e cartelle  nel tuo sito, basta firebug per i .css e .js e un motore di scansione per leggere tutta la struttura del tuo sito anche se ovviamente non sarà possibile leggere i  .php. Quindi la sicurezza sta da tutt'altra parte.

Offline giusebos

  • Fuori controllo
  • *
  • Post: 21748
  • Sesso: Maschio
  • Giuseppe Serbelloni Mazzanti Viendalmare
    • Mostra profilo
Re:Joomla e robots.txt
« Risposta #5 il: 03 Ago 2015, 15:28:50 »
Citazione
edit: perdonate i termini apparentemente fuori luogo ma la correzione grammaticale del mio computer è peggio della mia professoressa di lettere e corregge tutti i termini stranieri con quelli che più gli assomigliano...

Io come correttore inglese italiano uso cataldo software ;D

dailymotion.com/video/x1r1h7_prof-d-inglese_fun
su www.icagenda.it guide e tutorial con esempi di chronoforms e chronoconnectivity

Offline giggioman00

  • Appassionato
  • ***
  • Post: 293
    • Mostra profilo
Re:Joomla e robots.txt
« Risposta #6 il: 03 Ago 2015, 17:12:42 »
Quindi consigliate di rimuovere quella linea?

Perché ho provato ad inserire:
User-Agent: Googlebot
Allow: /*.css$
Allow: /*.js$

Ma secondo google webmaster sembra non funzionare, sembra che google dia comunque la precedente al Disallow: /components/

Offline giovi

  • Instancabile
  • ******
  • Post: 9835
  • Sesso: Maschio
    • Mostra profilo
Re:Joomla e robots.txt
« Risposta #7 il: 03 Ago 2015, 17:37:03 »
Perché ho provato ad inserire:
User-Agent: Googlebot
Allow: /*.css$
Allow: /*.js$
Anche tu utilizzi cataldo software per imparare la programmazione?

Offline giggioman00

  • Appassionato
  • ***
  • Post: 293
    • Mostra profilo
Re:Joomla e robots.txt
« Risposta #8 il: 03 Ago 2015, 17:47:12 »
Anche tu utilizzi cataldo software per imparare la programmazione?

Ehm... C'è scritto qui: https://support.google.com/webmasters/answer/6062596?hl=it

Citazione
File di un tipo specifico (ad esempio, .gif):
User-agent: Googlebot
Disallow: /*.gif$


Tra l'altro è il link che è stato linkato anche nel topic qui sopra.
E comunque no, se uso joomla e non un cms fatto in casa evidentemente non me ne intendo di programmazione.

Offline giovi

  • Instancabile
  • ******
  • Post: 9835
  • Sesso: Maschio
    • Mostra profilo
Re:Joomla e robots.txt
« Risposta #9 il: 03 Ago 2015, 18:26:56 »
Ma li c'è scritto disallow

Offline giggioman00

  • Appassionato
  • ***
  • Post: 293
    • Mostra profilo
Re:Joomla e robots.txt
« Risposta #10 il: 04 Ago 2015, 18:31:13 »
Ok, ho sistemato il file robots, ora riesce ad accedere a tutto il sito senza problemi. Ora google se ne accorge da solo o devo fare qualcosa per dirgli dei cambiamenti?

Offline giovi

  • Instancabile
  • ******
  • Post: 9835
  • Sesso: Maschio
    • Mostra profilo
Re:Joomla e robots.txt
« Risposta #11 il: 04 Ago 2015, 23:40:27 »
Sarebbe interessante sapere come lo hai sistemato.
Google se ne accorge da solo ma puoi dargli un input richiedendo la scansione parziale o completa (ma non è vincolante per lui e ne hai un tot massimo a disposizione)

Offline Palbi

  • Nuovo arrivato
  • *
  • Post: 16
    • Mostra profilo
Re:Joomla e robots.txt
« Risposta #12 il: 05 Ago 2015, 01:05:56 »
Che la cartella components debba comparire nel robots non ci piove, quello che trovo strano è che all'interno di questa tu abbia le cartelle e i relativi files CSS e JS, di solito quelle utilizzate dal sito dovrebbero trovarsi in www.tuosito.xxx"/templates/tuotemplate/".

Offline giovi

  • Instancabile
  • ******
  • Post: 9835
  • Sesso: Maschio
    • Mostra profilo
Re:Joomla e robots.txt
« Risposta #13 il: 05 Ago 2015, 08:38:09 »
Qualche componente (molte volte proveniente da  altre piattaforme) posiziona i CSS insieme ai file della view anziché nella cartella media (non templates perché quella è dedicata solo alla grafica del templare) al fine di rendere più veloce l'integrazione e la realizzazione. Bisognerebbe contattare lo sviluppatore per richiedere la correzione

Offline giggioman00

  • Appassionato
  • ***
  • Post: 293
    • Mostra profilo
Re:Joomla e robots.txt
« Risposta #14 il: 06 Ago 2015, 02:52:58 »
Sarebbe interessante sapere come lo hai sistemato.
Google se ne accorge da solo ma puoi dargli un input richiedendo la scansione parziale o completa (ma non è vincolante per lui e ne hai un tot massimo a disposizione)

Ho semplicemente cancellato la cartella components dal file robots

 



Web Design Bolzano Kreatif