Joomla.it Forum

Forum traduzioni italiano => Le traduzioni e le informazioni della community => Articoli della community => Topic aperto da: ZioPal - 28 Ott 2012, 19:29:47

Titolo: Contenuti Duplicati. Gli strumenti - Parte Terza
Inserito da: ZioPal - 28 Ott 2012, 19:29:47
Con quali strumenti si possono combattere i contenuti duplicati, in particolare con quali strumenti posso combatterli in Joomla?

Dopo aver visto cosa sono i contenuti duplicati e quali effetti negativi possono avere sul tuo sito web, dopo aver visto come si deve intervenire, questa era la domanda spontanea che tutti si sono fatti. Ora che so cosa sono, che so come scovarli e come devo intervenire, mi serviranno degli strumenti specifici? Visto che parliamo di Joomla esistono degli strumenti nativi, plugin o componenti?

In questo terzo articolo dedicato all'intervento del Joomla Day cercherò di offrire una panoramica di quelli che sono gli strumenti utilizzabili per prevenire, canonicalizzare o rimuovere i contenuti duplicati da un sito realizzato in Joomla. nell'articolo si fa riferimento a componenti ed estensioni per la versione 2.5 di Joomla ma ci sarà spazio anche per un'importante novità che riguarda la nuova versione 3.0.x

Maurizio ZioPal

Link all'articolo: http://www.joomla.it/articoli-community-16-e-17-tab/6747-contenuti-duplicati-gli-strumenti-terza-parte.html (http://www.joomla.it/articoli-community-16-e-17-tab/6747-contenuti-duplicati-gli-strumenti-terza-parte.html)
Titolo: Re:Contenuti Duplicati. Gli strumenti - Paerte Terza
Inserito da: giusebos - 29 Ott 2012, 10:43:40
Hai fatto davvero un utile "trilogia"! :)


Titolo: Re:Contenuti Duplicati. Gli strumenti - Paerte Terza
Inserito da: Mariano Uberti - 29 Ott 2012, 10:50:13
Sono un utente principiante e poco esperto, e ringrazio sentitamente Maurizio ZioPal per questi 3 articoli sui contenuti duplicati: sono un utilissimo riepilogo molto ben strutturato che aiuta molto a capire il problema. Grazie!  :)

Però, sempre da principiante, ho una domanda molto importante: di preciso cosa devo fare per eliminare i contenuti duplicati?!

Visto che sono poco esperto mi serve una procedura semplice, non importa se da ripetere manualmente un url alla volta, ma semplice.
Da questo terzo articolo mi interessa la possibilità di usare il Gestione Redirect, ma ... funziona? Scelgo quello o qualcos'altro? Io preferirei un'estensione già compresa che provare alla cieca un componente nuovo.
Insomma ... che devo fare?

Preciso che il mio intento è far sparire da "Strumenti per i webmaster / ottimizzazione / miglioramenti HTML" tutte le segnalazioni di errore legate a "Meta descrizioni duplicate", nella speranza che una volta ripuliti questi problemi Google mi premi portandomi più visite.
Se questa è una falsa speranza ditemelo  ;)
Titolo: Re:Contenuti Duplicati. Gli strumenti - Paerte Terza
Inserito da: giusebos - 29 Ott 2012, 12:11:29
Lo puoi fare solo a mano nel senso di url per url.

da strumenti per webmaster/ottimizzazione/miglioramenti, clicchi nei link delle pagine duplicate, stabilisci quale delle pagine è un link duplicato, copi il link e con il componente redirect di joomla gestisci il link:

da http://indirizzo.duplicato a http://indirizzo.canonico
Titolo: Re:Contenuti Duplicati. Gli strumenti - Paerte Terza
Inserito da: Mariano Uberti - 29 Ott 2012, 12:21:28
Grazie  :) , questa mi sembra una procedura semplice e chiara.

Avete anche esperienza di quanto sia efficace?
Nel senso: sapete di solito in quanto tempo Google si accorge del cambiamento e toglie l'url reindirizzata dalla lista dei problemi?

Dopo aver fatto questo per tutti gli url duplicati devo fare altro?

Comincio subito a reindirizzare.


Titolo: Re:Contenuti Duplicati. Gli strumenti - Parte Terza
Inserito da: ZioPal - 29 Ott 2012, 13:21:27
Ciao Giusebos, ciao Mariano,
grazie per i complimenti, adesso la soddisfaione sarebbe che gli articoli servano a qualcuno. :)

A Mariano darei questo suggerimento: Installa JoomSEF Free e MetaGenerator, il primo ti permetterà di riscrivere le URL e gestire più comodamente le meta descrizioni e i titoli duplicati, il secondo lo utilizzi solo per la gestione del Rel Canonical.

Tieni presente che i suggerimenti di Strumenti per Webmaster indicano Titoli e Descrizioni duplicate, questo è un importante indicatore ma non significa che siano davvero Contenuti Duplicati quindi vanno gestiti in modo differente (JoomSEF qui ti aiuta).

Comunque il Redirect funziona benissimo e JoomSEF non è proprio semplice da configurare, quindi fai le tue valutazioni.
 
Maurizio ZioPal
Titolo: Re:Contenuti Duplicati. Gli strumenti - Parte Terza
Inserito da: giusebos - 29 Ott 2012, 14:26:15
Questi articoli della community a prescindere l'argomento di cui trattano sono delle validissime guide, sia che si parli di moduli slideshow, sia che si tratti di argomenti complessi come quello che hai trattato. Scritto in un linguaggio comprensibile anche per chi non sa assolutamente niente di siti. Sono un valido aiuto per chi è alle prime armi, ma anche a chi ha un ottima padronanza di joomla.

Questò è per me il vero spirito di condivisione di un forum o di una community......ma qui rispondo solo a tutti quelli che gli viene l'orticaria quando gli si consiglia di cercare.... ;)
Titolo: Re:Contenuti Duplicati. Gli strumenti - Parte Terza
Inserito da: ZioPal - 29 Ott 2012, 15:15:13
Personalmente non mi infastidisce chi non cerca, ma chi scrive in privato chiedendo la soluzione del problema. Non è per il disturbo ma è la negazione totale del forum (della condivisione), significa che pensi solo a prendere e non ti preoccupi neanche di condividere la soluzione che altri ti hanno aiutato a trovare.

Maurizio ZioPal
Titolo: Re:Contenuti Duplicati. Gli strumenti - Parte Terza
Inserito da: giusebos - 29 Ott 2012, 16:18:19
questo è un altro problema delle richieste in privato...se potessi avere 1 ero per ogni richiesta!
Non rispondo, punto. Condivido con te il pensiero sulla negazione del forum, ma avrei altri pensieri cattivi da aggiungere. 8)

Per quanto riguarda la ricerca, quando la consiglio sottintendo sempre che con un minimo di volontà la risposta è li che ti aspetta....ma sto notando chè è una prerogativa tutta Italiana quella di saper chiedere ma non saper cercare.

Ritornando all'articolo, ti faccio anche i complimenti per come li hai strutturati a livello SEO ;) .
Da prendere in considerazione anche per questo, un articolo nell'articolo......
Titolo: Re:Contenuti Duplicati. Gli strumenti - Parte Terza
Inserito da: ZioPal - 29 Ott 2012, 16:36:16
Citazione
Ritornando all'articolo, ti faccio anche i complimenti per come li hai strutturati a livello SEO (http://forum.joomla.it/Smileys/default/wink.gif) .

era il minimo che potessi fare  ;D

Maurizio ZioPal
Titolo: Re:Contenuti Duplicati. Gli strumenti - Paerte Terza
Inserito da: etnatracker - 29 Ott 2012, 18:15:49
Grazie  :) , questa mi sembra una procedura semplice e chiara.

Avete anche esperienza di quanto sia efficace?
Nel senso: sapete di solito in quanto tempo Google si accorge del cambiamento e toglie l'url reindirizzata dalla lista dei problemi?

Dopo aver fatto questo per tutti gli url duplicati devo fare altro?

Comincio subito a reindirizzare.

Ciao Mariano,

come ha scritto ZioPal nell'articolo, io sono un appassionato di TagMeta. Devo dire che mi ha letteralmente cambiato la vita nella gestione del sito.

Mi permetto di darti due dritte per i redirect, credo che l'approccio di farlo un url alla volta non sia il massimo dell'efficienza.

Io eseguo i redirect solo quando cambio un url e non voglio perdere i dati di indicizzazione di google o i link che da altri siti puntano alle mie pagine. In questo caso, l'unica cosa è effettivamente farlo pagina per pagina.

Ma per gli url duplicati, adotto una strategia diversa: utilizzo TagMeta e metto un bel noIndex tra i metatag.

Faccio l'esempio di NinjaBoard: per ogni topic, crea decine di url tutti diversi che contengono gli stessi contenuti. A Google e a tutti i motori di ricerca dico di indicizzare solo uno di questi url, il principale. In tutti gli altri, metto noIndex e il risultato sembra ottimo. Non ho più metadesc duplicate nè title, ogni pagina è univoca.

Bisogna sbattersi un pò per trovare le espressioni regolari corrette e fare qualche test, ma alla fine con poco sforzo si riesce in un'impresa titanica.

Sottolineo che io inserisco il noIndex, ma allo stesso identico modo si potrebbe inserire il Canonical. La differenza sta nel fatto che io con 2 espressioni regolari ho eliminato tutti gli url duplicati di tutti i post ninjaboard, mentre se dovessi usare il canonical dovrei inserire un'espressione regolare per ogni gruppo di url legati a un singolo post.

Ciao

Etnatracker
Titolo: Re:Contenuti Duplicati. Gli strumenti - Parte Terza
Inserito da: giusebos - 29 Ott 2012, 18:23:17
Ciao Etnatracker,
puoi farci qualche esempio di "espressioni regolari" per i contenuti duplicati?

questi sono due link canonici

http://www.miosito/mammiferi/cani/pastoremaremmano.html
http://www.miosito/mammiferi/cani/gold-terrier.html

questi i link antagonisti duplicati duplicati

http://www.miosito/mammiferi/cani/items/pastoremaremmano.html
http://www.miosito/mammiferi/items/cani/gold-terrier.html

Titolo: Re:Contenuti Duplicati. Gli strumenti - Parte Terza
Inserito da: etnatracker - 29 Ott 2012, 19:25:26
Ciao Giusebos,

occorre analizzare i casi del proprio sito. Negli esempi che hai fatto, ipotizzo che tutti gli url che contengono la parola "mammiferi" e la parola "item" siano da non indicizzare. Con TagMeta, basta mettere la seguente URI:

^(.*)/mammiferi(.*)/item/(.*)html$

Inserisco l'attributo noIndex e sono a posto. Con Ninjaboard, che mi stava combinando un bel casino, ho usato qualcosa di un pò più complesso (ma neanche troppo):

^(.*)/forum/(main|1-forum)$
^(.*)/forum/(.*)/([0-9]+)$
^(.*)/layout/default$

Tre items TagMeta con le tre uri di cui sopra e ho sistemato. Lo stesso ho fatto con altri componenti non proprio amichevoli nella gestione degli url
Titolo: Re:Contenuti Duplicati. Gli strumenti - Parte Terza
Inserito da: giusebos - 29 Ott 2012, 22:24:25
Grazie, sto cercando di risolvere questo problema, ma ancora brancolo nel buio!
Provo e ti faccio sapere. ;)
Titolo: Re:Contenuti Duplicati. Gli strumenti - Parte Terza
Inserito da: ZioPal - 29 Ott 2012, 22:53:17
Questo TagMeta sembra davvero molto potente dovrò provarlo seriamente. :)

Maurizio ZioPal
Titolo: Re:Contenuti Duplicati. Gli strumenti - Parte Terza
Inserito da: etnatracker - 30 Ott 2012, 12:03:51
Io ho iniziato a usarlo per rendere univoci i title delle varie pagine nelle viste Blog, poi ho esteso all'eliminazione dei duplicati.


Quello che non so è quanto sia valido l'approccio noIndex rispetto all'approccio Canonical.


Se hai 10 url diversi che hanno gli stessi contenuti, ci sono molti più link interni che puntano a quella pagina. Se si imposta il canonical, questi link interni non si perdono. Se si mette il noIndex, sì. Solo Google sa la risposta, anche se nel mio sito ho buoni risultati  ;)


Però il noIndex è molto più semplice da gestire. Nell'esempio di prima che ha fatto GiuseBos, con una sola espressione regolare risolve il problema.
Se invece vuole gestire il canonical, deve mettere una regola per ogni blocco di duplicazioni e diventa ingestibile.


Ciao


Etnatracker
Titolo: Re:Contenuti Duplicati. Gli strumenti - Parte Terza
Inserito da: ZioPal - 30 Ott 2012, 12:52:43
Io credo che il Canonical sia migliore se le pagine presentano delle vere differenze se pur minime, fermo restando che l'obbiettivo è abbattere i duplicati.

Per i link invece non mi preoccuperei il NoIndex inibisce l'indicizzazione della pagina non il Follow.

Forse la confusione nasce dal fatto che generalmente si tende a considerare l'accopiata NoIndex, NoFollow ma è sufficente non specificare il secondo e i link vengono seguiti, se mai il problema si ripresenta perché se le pagine sono duplicate sono duplicati anche i link che se diventano troppi puzzano di spam.

Maurizio ZioPal
Titolo: Re:Contenuti Duplicati. Gli strumenti - Parte Terza
Inserito da: giusebos - 31 Ott 2012, 20:50:56
ho iniziato a guardare tagmeta, così ho notato che ha qualcosa a che fare con ReDJ....non sono sicuro, ma mi sembra lo stesso sviluppatore, inoltre noto che le istruzioni (poche), su espressioni regolari, sono pari pari a ReDj. Per adesso non aggiungo altro perchè ho veramente avuto poco tempo per fare qualche test decente.

invece ho un problema con un sito in cui utilizzo il template elastica leggermente modificato.
Ho installato metagenerator, questo è configurato in modo che le pagine abbiano il rel=canonical inoltre come "rinforzino" (citazione da amici miei  ;) ) non ho messo mezz'etto di stracchino, ma sto utilizzando seoboss.

Controllano il sito con virante.org ho questo messaggio di allert:

Citazione
Your site is not returning a 301 redirect from www to non-www or vice versa. This means that Google may cache both versions of your site, causing sitewide duplicate content penalties

Ora considerando il fatto che sugli strumenti per webmaster ho impostato la lettura del sito su WWW, mi chiedo il perchè di questo messaggio.

Titolo: Re:Contenuti Duplicati. Gli strumenti - Parte Terza
Inserito da: etnatracker - 31 Ott 2012, 21:34:26
Controllano il sito con virante.org ho questo messaggio di allert:

Ora considerando il fatto che sugli strumenti per webmaster ho impostato la lettura del sito su WWW, mi chiedo il perchè di questo messaggio.

Virante non lo può sapere cosa hai impostato negli strumenti per i webmaster :)

Per evitare quel messaggio, devi mettere il redirect in htaccess, nel mio caso è il seguente:

Codice: [Seleziona]
RewriteCond %{HTTP_HOST} !^www\.etnatracking\.com [NC]
RewriteRule ^(.*)$ http://www.etnatracking.com/$1 [L,R=301]
Titolo: Re:Contenuti Duplicati. Gli strumenti - Parte Terza
Inserito da: giusebos - 01 Nov 2012, 00:18:52
Avevo fatto quella prova, ma per sicurezza ho riprovato:

quello che succede è che cliccando nel pulsante della home esce fuori il messaggio del server Forbiden non hai i permessi per accedere al serever.....

pensavo di aver scritto male il codice, ma tu mi hai confermato che non c'è nessun errore.....

per adesso ho  modificando il link nel template da così
Codice: [Seleziona]
<h1><a href="index.php" title="<?php echo $siteName?>"><span><?php echo $logoText?></span></a></h1>
a così

Codice: [Seleziona]
<h1><a href="http://www.miosi.to" title="<?php echo $siteName?>"><span><?php echo $logoText
Non so se è la soluzione, richiamando la pagina miosito.index.php questa ti arriva comunque....

nel codice il rel="canonical" c'è
Titolo: Re:Contenuti Duplicati. Gli strumenti - Parte Terza
Inserito da: etnatracker - 01 Nov 2012, 09:01:21
Credo che si stiano mischiando cose diverse
1) l'errore che ti arriva dovrebbe essere dovuto a un errore di sintassi nell'htaccess
2) l'unico modo per evitare la doppia indicizzazione con e senza www é utilizare il pezzp di htaccess che ho postato prima
3) la soluzione che hai adottato va bene ma é puntuale, solo per quel link. Ci saranno molti componenti che puntano a index.php
4) l'attributo canonical non influenza i redirect
5) conviene provare prima con un redirect di test singolo nell'htaccess, potrebbero anche esserci dei vincoli nell'installazione di apache
6) consiglio di usare httpfox per controllare la catena dei redirect

Scusate ma sto scrivendo con lo smartphone... Servirebbero degli esempi.
Ciao
Titolo: Re:Contenuti Duplicati. Gli strumenti - Parte Terza
Inserito da: giusebos - 04 Nov 2012, 14:42:03
ho rilevato che il server va in timeout, inoltre spesso restituisce la pagina senza leggere il file css......attendo cosa mi dice l'assistenza.
Titolo: Re:Contenuti Duplicati. Gli strumenti - Parte Terza
Inserito da: Mariano Uberti - 11 Gen 2013, 11:10:55
Aggiornamento sintetico sulla mia operazione di pulizia dei contenuti duplicati: non sembra stia funzionando molto.

Dopo aver letto l'articolo stavo per mettermi all'opera quando ho visto che magicamente i contenuti duplicati (numero di meta descrizioni duplicate segnalate dagli Strumenti per webmaster di Google) sono cominciati a diminuire da soli senza che io facessi nulla. Diminuzione lenta e costante.
A cui ovviamente poi è seguito un incremento.

Ho provato ad usare il redirect di Joomla (ho la versione 1.6.4) ma non mi sono trovato molto bene.
Ho quindi installato ReDJ e ho reindirizzato permanentemente tutti gli url che si erano creati da soli verso le pagine corrette.

Ho molti esempi di questo tipo:

url duplicato che si è creato da solo
http://www.uberti.eu/100-destinazioni/europa/bulgaria.html

pagina corretta che ho creato io
http://www.uberti.eu/destinazioni/europa/bulgaria.html  (http://www.uberti.eu/destinazioni/europa/bulgaria.html)

Adesso rimandano alla pagina corretta, però alla successiva scansione di Google queste duplicazioni non sono scomparse (e ne sono arrivate di nuove). Ci vuole forse tempo perché spariscano?

A parte usare il redirect non so bene cosa potrei fare, visto che quegli url non corrispondono a pagine realmente esistenti. In particolare non so dove poter mettere il "noindex".
Ho provato a vedere TagMeta, ma io sono veramente un principiante e mi sembra un pò complicato.
Avevo pensato di segnalare la rimozione url tramite strumenti per webmaster, ma dovrebbe essere un errore 404, invece quei link rimandano comunque ad una pagina visualizzabile.

Cosa potrei fare? (che non sia troppo complicato e alla portata delle mie capacità)

Voglio risolvere questo problema nella speranza che una volta sistemato Google mi mandi più visitatori.



Titolo: Re:Contenuti Duplicati. Gli strumenti - Parte Terza
Inserito da: etnatracker - 11 Gen 2013, 11:35:31
Ciao Mariano,


nella tua mail ci sono tanti temi. Vediamoli uno alla volta.


url duplicato che si è creato da solo: fidati, non si creano da soli... da qualche parte nel tuo sito c'è un link a quell'url, oppure nella sitemap. A volte sono in moduli che non sospetti, come la breadcrumb o Jcomment, magari li hai abilitati per un pò e poi disabilitati, ma una volta che Google li becca...


alla successiva scansione di Google queste duplicazioni non sono scomparse: ti confermo che ci vuole parecchio tempo affinché vengano eliminate tutte, non basta una singola scansione. A volte nel mio caso ci ha messo mesi interi


A parte usare il redirect non so bene cosa potrei fare: come ho scritto in un altro post, il redirect funziona e ti preserva i link esterni, il pagerank ecc, ma è un massacro perché devi gestire un url alla volta. Nel tuo caso suppongo che ad esempio tutte gli url che contengono "/100-destinazioni/" non debbano essere indicizzate, potresti risolvere tutto con una sola espressione regolare usando Tagmeta e inserendo il no-index


...nella speranza che una volta sistemato Google mi mandi più visitatori: per ottenere questo risultato c'è molto più lavoro che non la sola eliminazione dei contenuti. Ad esempio, ho analizzato una delle tue pagine con PageSpeed di Google e vengono segnalati ben 5 elementi critici sulle performance:


Anche la scelta del title non è ottimale... c'è scritto solo "Bulgaria". Dovresti metterci qualcosa di più attinente... insomma, c'è tutto un mondo.

Ciao

Etnatracker



Titolo: Re:Contenuti Duplicati. Gli strumenti - Parte Terza
Inserito da: Mariano Uberti - 11 Gen 2013, 11:42:12
ciao Etnatracker,
grazie per la risposta  :)

Non ho problemi nel fare tanto lavoro manuale: preferisco ripetere a mano un'operazione semplice 100 volte che dovermi avventurare in terreni ancora ardui al momento con le mie capacità.

E se Google ci mette tanto allora non mi preoccupo e aspetto.

Ho però un problema collaterale: dei 132 contenuti duplicati con la stessa duplicazione Google me ne mostra solo 30, gli altri 102 non so come trovarli ... come si fa?

Mi rendo conto che ci vogliono tante cose per aumentare i visitatori, questo è uno dei tanti pezzettini dell'opera.

Adesso mi guardo PageSpeed di Google.

GRAZIE per le indicazioni  :)
Titolo: Re:Contenuti Duplicati. Gli strumenti - Parte Terza
Inserito da: etnatracker - 11 Gen 2013, 12:04:51
[size=78%]Ho però un problema collaterale: dei 132 contenuti duplicati con la stessa duplicazione Google me ne mostra solo 30, gli altri 102 non so come trovarli ... come si fa?[/size]

Questo non lo so... dovrei vedere la console degli strumenti per i webmaster.

Per quanto riguarda l'espressione regolare, te la imposto io in cambio di un link al sito che metto in firma, che del resto parla di viaggi :)

Ciao

Etnatracker