Back to top

Autore Topic: Come evitare i contenuti duplicati nel tuo sito. Prima parte  (Letto 24661 volte)

Offline ZioPal

  • Abituale
  • ****
  • Post: 806
  • Sesso: Maschio
  • SWM - Servizi Web Marketing Roma
    • Mostra profilo
La creazione di contenuti duplicati nel web è una cosa naturale e CMS evoluti come Joomla ne possono creare davvero molti, i motori di ricerca non li apprezzano e ti possono portare fino alla penalizzazione. Dopo il mio intervento al JoomlaDay o pensato di riportare i miei appunti in articoli, per trattare l'argomento in maniera più esaustiva.

Maurizio ZioPal

Link all'articolo: http://www.joomla.it/articoli-community-16-e-17-tab/6254-come-evitare-i-contenuti-duplicati-nel-tuo-sito-prima-parte.html
« Ultima modifica: 16 Ott 2012, 14:27:25 da alexred »
Realizzazione e posizionamento siti web Roma
Realizzazione Siti Web Roma Twitter: @ZioPal Facebook: Maurizio Palermo

Offline snipershady

  • Esploratore
  • **
  • Post: 123
    • Mostra profilo
Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
« Risposta #1 il: 17 Ott 2012, 10:34:33 »
se correggi un GRAVE errore di grammatica nell'articolo, tutto il resto va bene :D

Offline ZioPal

  • Abituale
  • ****
  • Post: 806
  • Sesso: Maschio
  • SWM - Servizi Web Marketing Roma
    • Mostra profilo
Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
« Risposta #2 il: 17 Ott 2012, 10:56:40 »
bhe dimmello, se lo avessi visto lo avrei corretto. :)
Realizzazione e posizionamento siti web Roma
Realizzazione Siti Web Roma Twitter: @ZioPal Facebook: Maurizio Palermo

Offline snipershady

  • Esploratore
  • **
  • Post: 123
    • Mostra profilo
Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
« Risposta #3 il: 17 Ott 2012, 12:52:18 »
Citazione
Dopo il mio intervento al JoomlaDay o pensato di riportare i miei appunti in articoli, per trattare l'argomento in maniera più esaustiva.


corretto l'errore sentitevi liberi di  eliminare questi ultimi 3 messaggi :D
l'importante è che venga corretto, non che ci sia il post "da monito" ;)
« Ultima modifica: 17 Ott 2012, 12:54:17 da snipershady »

Offline ZioPal

  • Abituale
  • ****
  • Post: 806
  • Sesso: Maschio
  • SWM - Servizi Web Marketing Roma
    • Mostra profilo
Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
« Risposta #4 il: 17 Ott 2012, 13:34:17 »
Grazie
ho capito e ho corretto. :)
Realizzazione e posizionamento siti web Roma
Realizzazione Siti Web Roma Twitter: @ZioPal Facebook: Maurizio Palermo

Offline etnatracker

  • Esploratore
  • **
  • Post: 117
  • Chi ha paura, muore ogni giorno
    • Mostra profilo
Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
« Risposta #5 il: 17 Ott 2012, 15:29:37 »
Io ho investito molto tempo sia nella ricerca che nell'eliminazione di contenuti sul mio sito principale. Per trovarli uso praticamente tutti i tool che hai suggerito tu.

Per eliminarli, in passato ho usato massicciamente i redirect di apache, ma da un pò di tempo ho scoperto un componente fondamentale: si chiama TagMeta, attendo il tuo prossimo articolo sulle modalità di risoluzione per inserire la mia esperienza al riguardo
"Tutto ciò che la natura ha di grande,tutto ciò che ha di piacevole,tutto ciò che ha di terribile,
si può paragonare all'Etna. E l'Etna non si può paragonare a nulla"
http://www.etnatracking.com

Offline ZioPal

  • Abituale
  • ****
  • Post: 806
  • Sesso: Maschio
  • SWM - Servizi Web Marketing Roma
    • Mostra profilo
Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
« Risposta #6 il: 17 Ott 2012, 16:08:56 »
Ciao etnatracker,
il redirect è per me il modo più efficace di gestire i duplicati, purtroppo si finisce con doverli gestire tutti a mano ed è davvero dura, il rel canonical dovrebbe essere la soluzione migliore, minimamente automatizzabile e ti permette di tenere diverse versioni delle pagina.

La seconda parte sarà a breve, devo anche lavorare un po'.  :)

 Maurizio ZioPal
Realizzazione e posizionamento siti web Roma
Realizzazione Siti Web Roma Twitter: @ZioPal Facebook: Maurizio Palermo

Offline etnatracker

  • Esploratore
  • **
  • Post: 117
  • Chi ha paura, muore ogni giorno
    • Mostra profilo
Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
« Risposta #7 il: 17 Ott 2012, 16:45:29 »
Allora sono sicuro che apprezzerai TagMeta, mi ha risparmiato ore e ore di lavoro su componenti ostici come i forum (nel mio caso, ninjaboard) che generano tantissimi url che puntano alle stesse pagine e che ho neutralizzato con poche direttive.

Ho installato il feed rss, quindi il tuo prossimo articolo non mi sfuggirà!

A presto
"Tutto ciò che la natura ha di grande,tutto ciò che ha di piacevole,tutto ciò che ha di terribile,
si può paragonare all'Etna. E l'Etna non si può paragonare a nulla"
http://www.etnatracking.com

Offline ZioPal

  • Abituale
  • ****
  • Post: 806
  • Sesso: Maschio
  • SWM - Servizi Web Marketing Roma
    • Mostra profilo
Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
« Risposta #8 il: 17 Ott 2012, 16:55:15 »
si @etnatracker, ho dato una scorsa veloce e mi pare interessate, non capisco perchè nella JED un aspetto importante come il Rel Canonical debba essere legato alla gestione dei metadat che invece sono diventati del tutto secondari.

La base dell'articolo successivo è praticamente fatta am se riesco a dare un occhiata al componente lo cito. ;)

Maurizio ZioPal
Realizzazione e posizionamento siti web Roma
Realizzazione Siti Web Roma Twitter: @ZioPal Facebook: Maurizio Palermo

Offline green12

  • Esploratore
  • **
  • Post: 151
  • Sesso: Maschio
    • Mostra profilo
Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
« Risposta #9 il: 17 Ott 2012, 19:14:38 »
Grazie per l'articolo, molto utile. In particolare ho trovato utilissimo il sito suggerito http://www.searchmasters.co.nz/redirect-check/ che fornisce il codice da inserire nel file .htaccess
anche se su alcuni siti trova un "index.pl" con errore 403 Forbidden response che non capisco da dove viene o cosa sia visto che non lo vedo nella root.
Comunque grazie ancora  :)

Offline ZioPal

  • Abituale
  • ****
  • Post: 806
  • Sesso: Maschio
  • SWM - Servizi Web Marketing Roma
    • Mostra profilo
Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
« Risposta #10 il: 17 Ott 2012, 22:28:35 »
Grazie a te green12,
credo che i file .pl siano file in Perl, spesso si trovano nei vari hosting in cui è possibile gestire questo linguaggio.

Maurizo ZioPal
Realizzazione e posizionamento siti web Roma
Realizzazione Siti Web Roma Twitter: @ZioPal Facebook: Maurizio Palermo

Offline green12

  • Esploratore
  • **
  • Post: 151
  • Sesso: Maschio
    • Mostra profilo
Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
« Risposta #11 il: 18 Ott 2012, 08:22:14 »
con le modifiche apportate al file htaccess però non riesco più ad entrare in amministrazione del sito, ricaricando il vecchio file tutto funziona... non capisco dov'è l'impiccio. di seguito il codice che ho inserito:

Codice: [Seleziona]
RewriteEngine on
RewriteCond %{HTTP_HOST} !^www\.xxxxxxx\.net
RewriteRule (.*) http://www.xxxxxx.net/$1 [R=301,L]
Options +FollowSymLinks
RewriteCond %{THE_REQUEST} ^.*/index\.php
RewriteRule ^(.*)index.php$ http://www.xxxxx.net/$1 [R=301,L]

dove è l'errore?
grazie

Offline ZioPal

  • Abituale
  • ****
  • Post: 806
  • Sesso: Maschio
  • SWM - Servizi Web Marketing Roma
    • Mostra profilo
Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
« Risposta #12 il: 18 Ott 2012, 10:15:31 »
Ciao green12,
a me non sembra esserci nulla di strano, ma la sintassi del .htaccess è così particolare e io non la conosco così bene. :)

Maurizio ZioPal
Realizzazione e posizionamento siti web Roma
Realizzazione Siti Web Roma Twitter: @ZioPal Facebook: Maurizio Palermo

Offline green12

  • Esploratore
  • **
  • Post: 151
  • Sesso: Maschio
    • Mostra profilo
Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
« Risposta #13 il: 18 Ott 2012, 17:30:12 »
non saprei, forse perchè reindirizza tutti i files index.php e quindi anche ..administrator/index.php
Non succede a nessun'altro su joomla 1.5.26?
Da un lato non mi dispiace perchè sarebbe una ulteriore protezione per evitare accessi indesiderati in amministrazione... però è troppo noioso dover sovrascrivere l'htaccess ogni volta via ftp.



Offline ZioPal

  • Abituale
  • ****
  • Post: 806
  • Sesso: Maschio
  • SWM - Servizi Web Marketing Roma
    • Mostra profilo
Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
« Risposta #14 il: 19 Ott 2012, 09:58:21 »
Ciao green12,
fai un semplice test inserendo un index.php in una qualsiasi cartella e vedi come si comporta.

Maurizio ZioPal

Realizzazione e posizionamento siti web Roma
Realizzazione Siti Web Roma Twitter: @ZioPal Facebook: Maurizio Palermo

Offline Gioacchino Cipriano

  • Appassionato
  • ***
  • Post: 409
  • Sesso: Maschio
    • Mostra profilo
Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
« Risposta #15 il: 23 Ott 2012, 18:27:58 »
Molto interessante l'articolo ma ho lo stesso problema:
Inserendo il codice fornito da http://www.searchmasters.co.nz/redirect-check/
Codice: [Seleziona]
RewriteEngine on
RewriteCond %{HTTP_HOST} !^www\.miosito\.it
RewriteRule (.*) http://www.miosito.it/$1 [R=301,L]
Options +FollowSymLinks
RewriteCond %{THE_REQUEST} ^.*/index\.php
RewriteRule ^(.*)index.php$ http://www.miosito.it/$1 [R=301,L]
non permette di accedere all'amministrazione.
Forse una nuova condizione su htaccess, ma non so come fare.
tipo ?:
Codice: [Seleziona]
RewriteCond %{THE_REQUEST} ^.*/administrator/index\.php
RewriteRule ^(.*)administrator/index.php$ http://www.miosito.it/administrator/$1 [R=301,L]
Gioacchino
« Ultima modifica: 23 Ott 2012, 18:30:41 da Gioacchino Cipriano »
Grazie
Gioacchino Cipriano

Offline etnatracker

  • Esploratore
  • **
  • Post: 117
  • Chi ha paura, muore ogni giorno
    • Mostra profilo
Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
« Risposta #16 il: 29 Ott 2012, 20:36:05 »
Ciao a tutti,

per evitare il problema del mancato accesso alla parte admin, occorre mettere la seguente condizione:

RewriteCond %{THE_REQUEST} ^[A-Z]{3,9}\ /\ HTTP/
RewriteCond %{THE_REQUEST} !^[A-Z]{3,9}\ /.*administrator/index\.php\ HTTP/
RewriteRule ^(.*)$ /it [R=301,L]

Io redirigo su etnatracking/it, ma si puà fare verso qualunque url

Ciao

Etnatracker


"Tutto ciò che la natura ha di grande,tutto ciò che ha di piacevole,tutto ciò che ha di terribile,
si può paragonare all'Etna. E l'Etna non si può paragonare a nulla"
http://www.etnatracking.com

Offline Gioacchino Cipriano

  • Appassionato
  • ***
  • Post: 409
  • Sesso: Maschio
    • Mostra profilo
Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
« Risposta #17 il: 30 Ott 2012, 12:56:53 »
Ciao a tutti,

per evitare il problema del mancato accesso alla parte admin, occorre mettere la seguente condizione:

RewriteCond %{THE_REQUEST} ^[A-Z]{3,9}\ /\ HTTP/
RewriteCond %{THE_REQUEST} !^[A-Z]{3,9}\ /.*administrator/index\.php\ HTTP/
RewriteRule ^(.*)$ /it [R=301,L]

Io redirigo su etnatracking/it, ma si puà fare verso qualunque url

Ciao

Etnatracker
Ciao Etnatracker,
ho provato il codice che mi hai indicato, ma il problema rimane.
Non mi è chiaro come modificare il codice partendo da questo:
Codice: [Seleziona]

 RewriteEngine on
RewriteCond %{HTTP_HOST} !^www\.miosito\.it
RewriteRule (.*) http://www.miosito.it/$1 [R=301,L]
Options +FollowSymLinks
RewriteCond %{THE_REQUEST} ^.*/index\.php
RewriteRule ^(.*)index.php$ http://www.miosito.it/$1 [R=301,L]
Grazie
Gioacchino Cipriano

Offline etnatracker

  • Esploratore
  • **
  • Post: 117
  • Chi ha paura, muore ogni giorno
    • Mostra profilo
Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
« Risposta #18 il: 30 Ott 2012, 14:34:09 »

Ciao Gioacchino,


scusami per la risposta di ieri, ero di fretta e non era completa.


Partendo dal tuo codice, quello che occorre fare è inserire una condizione che escluda administrator/index.php, nella fattispecie io uso la seguente:


Codice: [Seleziona]
RewriteCond %{THE_REQUEST} !^[A-Z]{3,9}\ /.*administrator/index\.php\ HTTP/


Il punto esclamativo indica l'esclusione. La tua condizione dunque diventa:


Codice: [Seleziona]
RewriteCond %{HTTP_HOST} !^www\.miosito\.it
RewriteRule (.*) http://www.miosito.it/$1 [R=301,L]
Options +FollowSymLinks
RewriteCond %{THE_REQUEST} ^.*/index\.php
RewriteCond %{THE_REQUEST} !^[A-Z]{3,9}\ /.*administrator/index\.php\ HTTP/
RewriteRule ^(.*)index.php$ http://www.miosito.it/$1 [R=301,L]


A volte ho dovuto cancellare i cookie per fargli prendere le modifiche, anche se non so perchè.


Ne approfitto per introdurre un altro problema che si può verificare a causa dell'inserimento di questo redirect:


Alcuni componenti hanno dei redirect interni che vengono disturbati dal redirect che stiamo mettendo noi. E' il caso del componente per la registrazione base di Joomla 1.5, ma anche di altri.


Per evitare malfunzionamenti, ho dunque dovuto inserire altre condizioni in negazione; di seguito riporto il pezzo integrale di file che uso io:


Codice: [Seleziona]
RewriteCond %{THE_REQUEST} ^[A-Z]{3,9}\ /.*index\.php\ HTTP/
RewriteCond %{THE_REQUEST} !^[A-Z]{3,9}\ /.*administrator/index\.php\ HTTP/
RewriteCond %{QUERY_STRING} !^.*?no_redirect=true?$
RewriteCond %{QUERY_STRING} !option=com_user&view=reset&layout=confirm
RewriteRule ^(.*)index\.php$ /it$1 [R=301,L]


La prima querystring negata si riferisce a un parametro che ho inserito io, modificandone il codice, in alcuni plugin che non funzionavano più
La seconda riga di querystring negata si riferisce al reset password, che anch'esso con quel redirect non funzionava più


In sintesi... ci ho perso un mare di tempo, ma adesso è a posto. Ci sono tanti aspetti che vengono impattati da quel semplce redirect.


Attendo feedback


Ciao


Etnatracker
"Tutto ciò che la natura ha di grande,tutto ciò che ha di piacevole,tutto ciò che ha di terribile,
si può paragonare all'Etna. E l'Etna non si può paragonare a nulla"
http://www.etnatracking.com

Offline Gioacchino Cipriano

  • Appassionato
  • ***
  • Post: 409
  • Sesso: Maschio
    • Mostra profilo
Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
« Risposta #19 il: 30 Ott 2012, 17:02:07 »
Ciao etnatracker (conterraneo? from Cefalù),
grazie mille, ho inserito il tuo codice nel modo seguente e mi pare che funzioni (non so se c'è qualche rindondanza nelle prime due linee dopo le Options +FollowSymLinks).
Codice: [Seleziona]
RewriteBase /
 RewriteCond %{HTTP_HOST}   ^miosito\.it [NC]
 RewriteRule (.*) http://www.miosito.it/$1 [R=301,L]
 RewriteCond %{HTTP_HOST} !^www\.miosito\.it
 RewriteRule (.*) http://www.miosito.it/$1 [R=301,L]
 Options +FollowSymLinks
 RewriteCond %{THE_REQUEST} ^.*/index\.php
 RewriteCond %{THE_REQUEST} ^[A-Z]{3,9}\ /.*index\.php\ HTTP/
 RewriteCond %{QUERY_STRING} !option=com_user&view=reset&layout=confirm
 RewriteCond %{THE_REQUEST} !^[A-Z]{3,9}\ /.*administrator/index\.php\ HTTP/
 RewriteRule ^(.*)index.php$ http://www.miosito.it/$1 [R=301,L]
 
Riaspetto contro-feedback  :)
Gioacchino
Grazie
Gioacchino Cipriano

 



Web Design Bolzano Kreatif