Joomla.it Forum

Forum traduzioni italiano => Le traduzioni e le informazioni della community => Articoli della community => : ZioPal 16 Oct 2012, 14:17:03

: Come evitare i contenuti duplicati nel tuo sito. Prima parte
: ZioPal 16 Oct 2012, 14:17:03
La creazione di contenuti duplicati nel web è una cosa naturale e CMS evoluti come Joomla ne possono creare davvero molti, i motori di ricerca non li apprezzano e ti possono portare fino alla penalizzazione. Dopo il mio intervento al JoomlaDay (http://www.joomladay.it/notizie/45-video-e-slide-joomladay-2012.html?showall=&start=10) o pensato di riportare i miei appunti in articoli, per trattare l'argomento in maniera più esaustiva.

Maurizio ZioPal

Link all'articolo: http://www.joomla.it/articoli-community-16-e-17-tab/6254-come-evitare-i-contenuti-duplicati-nel-tuo-sito-prima-parte.html
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: snipershady 17 Oct 2012, 10:34:33
se correggi un GRAVE errore di grammatica nell'articolo, tutto il resto va bene :D
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: ZioPal 17 Oct 2012, 10:56:40
bhe dimmello, se lo avessi visto lo avrei corretto. :)
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: snipershady 17 Oct 2012, 12:52:18
Dopo il mio intervento al JoomlaDay (http://www.joomladay.it/notizie/45-video-e-slide-joomladay-2012.html?showall=&start=10) o pensato di riportare i miei appunti in articoli, per trattare l'argomento in maniera più esaustiva.


corretto l'errore sentitevi liberi di  eliminare questi ultimi 3 messaggi :D
l'importante è che venga corretto, non che ci sia il post "da monito" ;)
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: ZioPal 17 Oct 2012, 13:34:17
Grazie
ho capito e ho corretto. :)
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: etnatracker 17 Oct 2012, 15:29:37
Io ho investito molto tempo sia nella ricerca che nell'eliminazione di contenuti sul mio sito principale. Per trovarli uso praticamente tutti i tool che hai suggerito tu.

Per eliminarli, in passato ho usato massicciamente i redirect di apache, ma da un pò di tempo ho scoperto un componente fondamentale: si chiama TagMeta (http://extensions.joomla.org/extensions/site-management/seo-a-metadata/meta-data/7124), attendo il tuo prossimo articolo sulle modalità di risoluzione per inserire la mia esperienza al riguardo
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: ZioPal 17 Oct 2012, 16:08:56
Ciao etnatracker,
il redirect è per me il modo più efficace di gestire i duplicati, purtroppo si finisce con doverli gestire tutti a mano ed è davvero dura, il rel canonical dovrebbe essere la soluzione migliore, minimamente automatizzabile e ti permette di tenere diverse versioni delle pagina.

La seconda parte sarà a breve, devo anche lavorare un po'.  :)

 Maurizio ZioPal
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: etnatracker 17 Oct 2012, 16:45:29
Allora sono sicuro che apprezzerai TagMeta, mi ha risparmiato ore e ore di lavoro su componenti ostici come i forum (nel mio caso, ninjaboard) che generano tantissimi url che puntano alle stesse pagine e che ho neutralizzato con poche direttive.

Ho installato il feed rss, quindi il tuo prossimo articolo non mi sfuggirà!

A presto
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: ZioPal 17 Oct 2012, 16:55:15
si @etnatracker, ho dato una scorsa veloce e mi pare interessate, non capisco perchè nella JED un aspetto importante come il Rel Canonical debba essere legato alla gestione dei metadat che invece sono diventati del tutto secondari.

La base dell'articolo successivo è praticamente fatta am se riesco a dare un occhiata al componente lo cito. ;)

Maurizio ZioPal
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: green12 17 Oct 2012, 19:14:38
Grazie per l'articolo, molto utile. In particolare ho trovato utilissimo il sito suggerito http://www.searchmasters.co.nz/redirect-check/ (http://www.searchmasters.co.nz/redirect-check/) che fornisce il codice da inserire nel file .htaccess
anche se su alcuni siti trova un "index.pl" con errore 403 Forbidden response che non capisco da dove viene o cosa sia visto che non lo vedo nella root.
Comunque grazie ancora  :)
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: ZioPal 17 Oct 2012, 22:28:35
Grazie a te green12,
credo che i file .pl siano file in Perl, spesso si trovano nei vari hosting in cui è possibile gestire questo linguaggio.

Maurizo ZioPal
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: green12 18 Oct 2012, 08:22:14
con le modifiche apportate al file htaccess però non riesco più ad entrare in amministrazione del sito, ricaricando il vecchio file tutto funziona... non capisco dov'è l'impiccio. di seguito il codice che ho inserito:

:
RewriteEngine on
RewriteCond %{HTTP_HOST} !^www\.xxxxxxx\.net
RewriteRule (.*) http://www.xxxxxx.net/$1 [R=301,L]
Options +FollowSymLinks
RewriteCond %{THE_REQUEST} ^.*/index\.php
RewriteRule ^(.*)index.php$ http://www.xxxxx.net/$1 [R=301,L]

dove è l'errore?
grazie
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: ZioPal 18 Oct 2012, 10:15:31
Ciao green12,
a me non sembra esserci nulla di strano, ma la sintassi del .htaccess è così particolare e io non la conosco così bene. :)

Maurizio ZioPal
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: green12 18 Oct 2012, 17:30:12
non saprei, forse perchè reindirizza tutti i files index.php e quindi anche ..administrator/index.php
Non succede a nessun'altro su joomla 1.5.26?
Da un lato non mi dispiace perchè sarebbe una ulteriore protezione per evitare accessi indesiderati in amministrazione... però è troppo noioso dover sovrascrivere l'htaccess ogni volta via ftp.


: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: ZioPal 19 Oct 2012, 09:58:21
Ciao green12,
fai un semplice test inserendo un index.php in una qualsiasi cartella e vedi come si comporta.

Maurizio ZioPal

: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: Gioacchino Cipriano 23 Oct 2012, 18:27:58
Molto interessante l'articolo ma ho lo stesso problema:
Inserendo il codice fornito da http://www.searchmasters.co.nz/redirect-check/ (http://www.searchmasters.co.nz/redirect-check/)
:
RewriteEngine on
RewriteCond %{HTTP_HOST} !^www\.miosito\.it
RewriteRule (.*) http://www.miosito.it/$1 [R=301,L]
Options +FollowSymLinks
RewriteCond %{THE_REQUEST} ^.*/index\.php
RewriteRule ^(.*)index.php$ http://www.miosito.it/$1 [R=301,L]
non permette di accedere all'amministrazione.
Forse una nuova condizione su htaccess, ma non so come fare.
tipo ?:
:
RewriteCond %{THE_REQUEST} ^.*/administrator/index\.php
RewriteRule ^(.*)administrator/index.php$ http://www.miosito.it/administrator/$1 [R=301,L]
Gioacchino
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: etnatracker 29 Oct 2012, 20:36:05
Ciao a tutti,

per evitare il problema del mancato accesso alla parte admin, occorre mettere la seguente condizione:

RewriteCond %{THE_REQUEST} ^[A-Z]{3,9}\ /\ HTTP/
RewriteCond %{THE_REQUEST} !^[A-Z]{3,9}\ /.*administrator/index\.php\ HTTP/
RewriteRule ^(.*)$ /it [R=301,L]

Io redirigo su etnatracking/it, ma si puà fare verso qualunque url

Ciao

Etnatracker


: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: Gioacchino Cipriano 30 Oct 2012, 12:56:53
Ciao a tutti,

per evitare il problema del mancato accesso alla parte admin, occorre mettere la seguente condizione:

RewriteCond %{THE_REQUEST} ^[A-Z]{3,9}\ /\ HTTP/
RewriteCond %{THE_REQUEST} !^[A-Z]{3,9}\ /.*administrator/index\.php\ HTTP/
RewriteRule ^(.*)$ /it [R=301,L]

Io redirigo su etnatracking/it, ma si puà fare verso qualunque url

Ciao

Etnatracker
Ciao Etnatracker,
ho provato il codice che mi hai indicato, ma il problema rimane.
Non mi è chiaro come modificare il codice partendo da questo:
:

 RewriteEngine on
RewriteCond %{HTTP_HOST} !^www\.miosito\.it
RewriteRule (.*) http://www.miosito.it/$1 [R=301,L]
Options +FollowSymLinks
RewriteCond %{THE_REQUEST} ^.*/index\.php
RewriteRule ^(.*)index.php$ http://www.miosito.it/$1 [R=301,L]
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: etnatracker 30 Oct 2012, 14:34:09

Ciao Gioacchino,


scusami per la risposta di ieri, ero di fretta e non era completa.


Partendo dal tuo codice, quello che occorre fare è inserire una condizione che escluda administrator/index.php, nella fattispecie io uso la seguente:


:
RewriteCond %{THE_REQUEST} !^[A-Z]{3,9}\ /.*administrator/index\.php\ HTTP/


Il punto esclamativo indica l'esclusione. La tua condizione dunque diventa:


:
RewriteCond %{HTTP_HOST} !^www\.miosito\.it
RewriteRule (.*) http://www.miosito.it/$1 [R=301,L]
Options +FollowSymLinks
RewriteCond %{THE_REQUEST} ^.*/index\.php
RewriteCond %{THE_REQUEST} !^[A-Z]{3,9}\ /.*administrator/index\.php\ HTTP/
RewriteRule ^(.*)index.php$ http://www.miosito.it/$1 [R=301,L]


A volte ho dovuto cancellare i cookie per fargli prendere le modifiche, anche se non so perchè.


Ne approfitto per introdurre un altro problema che si può verificare a causa dell'inserimento di questo redirect:


Alcuni componenti hanno dei redirect interni che vengono disturbati dal redirect che stiamo mettendo noi. E' il caso del componente per la registrazione base di Joomla 1.5, ma anche di altri.


Per evitare malfunzionamenti, ho dunque dovuto inserire altre condizioni in negazione; di seguito riporto il pezzo integrale di file che uso io:


:
RewriteCond %{THE_REQUEST} ^[A-Z]{3,9}\ /.*index\.php\ HTTP/
RewriteCond %{THE_REQUEST} !^[A-Z]{3,9}\ /.*administrator/index\.php\ HTTP/
RewriteCond %{QUERY_STRING} !^.*?no_redirect=true?$
RewriteCond %{QUERY_STRING} !option=com_user&view=reset&layout=confirm
RewriteRule ^(.*)index\.php$ /it$1 [R=301,L]


La prima querystring negata si riferisce a un parametro che ho inserito io, modificandone il codice, in alcuni plugin che non funzionavano più
La seconda riga di querystring negata si riferisce al reset password, che anch'esso con quel redirect non funzionava più


In sintesi... ci ho perso un mare di tempo, ma adesso è a posto. Ci sono tanti aspetti che vengono impattati da quel semplce redirect.


Attendo feedback


Ciao


Etnatracker
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: Gioacchino Cipriano 30 Oct 2012, 17:02:07
Ciao etnatracker (conterraneo? from Cefalù),
grazie mille, ho inserito il tuo codice nel modo seguente e mi pare che funzioni (non so se c'è qualche rindondanza nelle prime due linee dopo le Options +FollowSymLinks).
:
RewriteBase /
 RewriteCond %{HTTP_HOST}   ^miosito\.it [NC]
 RewriteRule (.*) http://www.miosito.it/$1 [R=301,L]
 RewriteCond %{HTTP_HOST} !^www\.miosito\.it
 RewriteRule (.*) http://www.miosito.it/$1 [R=301,L]
 Options +FollowSymLinks
 RewriteCond %{THE_REQUEST} ^.*/index\.php
 RewriteCond %{THE_REQUEST} ^[A-Z]{3,9}\ /.*index\.php\ HTTP/
 RewriteCond %{QUERY_STRING} !option=com_user&view=reset&layout=confirm
 RewriteCond %{THE_REQUEST} !^[A-Z]{3,9}\ /.*administrator/index\.php\ HTTP/
 RewriteRule ^(.*)index.php$ http://www.miosito.it/$1 [R=301,L]
 
Riaspetto contro-feedback  :)
Gioacchino
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: Gioacchino Cipriano 30 Oct 2012, 17:46:57
Ops,
riesco ad accedere nel ammistrazione, ma non mi funziona l'accesso da front-end. :'(
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: etnatracker 30 Oct 2012, 19:13:21
Ciao Gioacchino (io sono etneo, ma emigrato da alcuni anni),

la seguente riga è superflua:

:
RewriteCond %{THE_REQUEST} ^.*/index\.php
Ho controllato la lista dei file che ho modificato per sistemare i redirect, il login da front-end è proprio uno di questi. Occorre modificare l'action nei form nel file seguente:

\templates\ja_purity\html\mod_login\default.php Inserendo al posto di

:
action=index.phpla seguente stringa:

:
action=index.php?no_redirect=true E infine inserire nella condizione dei redirect la query string lcome avevo indicato:
:
RewriteCond %{QUERY_STRING} !^.*?no_redirect=true?$Rendere un sito Joomla 1.5 davvero Seo Friendly è stata dura  :)
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: Gioacchino Cipriano 30 Oct 2012, 19:35:12
Ciao etnatracker,
nel template che sto usando o nel template ja_purity? Secondo me dovrebbe essere nel template che sto usando (solo che non ho la cartella .....\html\mod_login)  :o
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: etnatracker 30 Oct 2012, 19:40:30
Eh, bisogna trovare il tuo modulo di login e controllare le ACTION. Io uso il template JAPurity e quindi il file è quello...
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: Gioacchino Cipriano 30 Oct 2012, 19:58:15
 :-[ :'(
ho modificato tutti i file dei mod_login con quella action, ma nada de nada.
Domani riguardo.
Sarà mica perchè uso un componente SEF?
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: etnatracker 30 Oct 2012, 20:22:51
Non saprei; per scoprire se ci sono dei redirect che non si vedono, puoi usare httpfox. Eventualmente girami il link che provo a dare un'occhiata anche io
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: Gioacchino Cipriano 31 Oct 2012, 10:05:08
Ok.
Ho copiato la cartella mod_login da ja_purity all'interno della cartella template/html del mio template e pare funzionare (in locale) appena posso provo online.

In alternativa si potrebbe modificare il file nella cartella modules/mod_login/default.php, ma l'output dell'action diventa
:
'no_redirecttrue anzichè
:
'index.php?no_redirect=true. Quindi non so.
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: Gioacchino Cipriano 31 Oct 2012, 10:38:49
Penso si possa fare, ma occorre modificare l'action di tutte le pagine/moduli che abbiano l'action="index.php"
Alcuni:
com_user view login, logout ecc.
com_qualsiasi con form la cui action è index.php.
Ciao
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: etnatracker 31 Oct 2012, 10:44:42
Penso si possa fare, ma occorre modificare l'action di tutte le pagine/moduli che abbiano l'action="index.php"
Alcuni:
com_user view login, logout ecc.
com_qualsiasi con form la cui action è index.php.
Ciao


Corretto.


Io ho incontrato questo problema solo nel modulo di login e nel reset password. Il modulo di login è stato il più ostico in quanto la action non ha parametri in querystring che identifichino l'azione effettuata e quindi ho dovuto modificarlo. Credo che anche JVoteSystem, un componente che uso per i sondaggi, possa avere lo stesso problema.


Ma alla fine il risultato è ottimo. Io ho un sito con oltre mille pagine, forum, commenti, sezioni e categorie varie e al momento ho solamente 6 title duplicati e tutti gli url univoci, devo dire che Google sembra premiare un sito "pulito"
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: Gioacchino Cipriano 31 Oct 2012, 10:48:09
In effetti gli altri hanno un'action simile
:
action="<?php echo JRoute::_'index.php',ecc.
Forse anche nel file System/offline.php
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: Gioacchino Cipriano 31 Oct 2012, 11:10:57
Quindi da quello che ho capito sostituire solo le action="index.php", mentre quelle che hanno dei parametri si possono lasciare. Esempio action="index.php?option...ecc." si può lasciare.
Il fatto che il form funzioni anche senza la
:
RewriteCond %{QUERY_STRING} !^.*?no_redirect=true?$ penso sia normale, ma per il SEF va lasciata, corretto?
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: etnatracker 31 Oct 2012, 12:42:54
In generale, occorre aggiungere un pezzo di querystring a quei form che puntano secchi a index.php e quindi inserire nell' htaccess la condizione che escluda dal redirect gli url che contengono il pezzo di querystring che tu hai inserito.


L'importante è che vengano fatte entrambe le cose; il SEF non dovrebbe entrarci
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: Gioacchino Cipriano 31 Oct 2012, 12:59:06
In generale, occorre aggiungere un pezzo di querystring a quei form che puntano secchi a index.php e quindi inserire nell' htaccess la condizione che escluda dal redirect gli url che contengono il pezzo di querystring che tu hai inserito.


L'importante è che vengano fatte entrambe le cose; il SEF non dovrebbe entrarci
Ciao, ho notato questo: http://forum.joomla.it/index.php/topic,172198.msg781199.html#msg781199 (http://forum.joomla.it/index.php/topic,172198.msg781199.html#msg781199)
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: beertod 11 Nov 2012, 15:30:52
Grazie per i suggerimenti ZioPal!
Comunque ho inserito questo codice:

:
RewriteCond %{HTTP_HOST} !^www\.lavitacongusto\.it
RewriteRule (.*) http://www.lavitacongusto.it/$1 [R=301,L]

come suggerito da searchmasters in .httacces per il redirect check ma facendo nuovamente il test (anche su virante) mi da sempre lo stesso errore (WWW/NonWWW Header Check: FAILED)
come mai?

Inoltre proprio ora mi accorgo che nei webmaster tools mi dice che ci sono 2 pagine con tag title duplicati:

/component/users/?view=registration

 /component/users/?view=reset

 
il sito è quello in firma
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: etnatracker 12 Nov 2012, 09:56:31
[size=78%]Comunque ho inserito questo codice: [/size]

:
RewriteCond %{HTTP_HOST} !^www\.lavitacongusto\.it
RewriteRule (.*) http://www.lavitacongusto.it/$1 [R=301,L]

come suggerito da searchmasters in .httacces per il redirect check ma facendo nuovamente il test (anche su virante) mi da sempre lo stesso errore (WWW/NonWWW Header Check: FAILED)
come mai?


Verifica di avere attivato il redirect su Apache. Non c'è bisogno di usare tool esterni per fare il test,  basta scrivere "lavitacongusto.it" come url nel browser per vedere che succede e nel tuo caso risulta proprio irraggiungibile, quindi non è un problema di doppia url ma è qualcosa di diverso. Verifica se il redirect è attivo in apache, togli la direttiva che hai scritto e testa con "lavitacongusto.it" per vedere se almeno il sito si vede. Eventualmente contatta l'hosting


Inoltre proprio ora mi accorgo che nei webmaster tools mi dice che ci sono 2 pagine con tag title duplicati:

/component/users/?view=registration

 /component/users/?view=reset



Questo è dovuto al fatto che il modulo di login ha lo stesso title per tutte le pagine. Io ho risolto con TagMeta, ho messo un bel no-index in tutte le pagine con url "component/users" che tanto a google non interessano
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: beertod 12 Nov 2012, 10:19:57
Ciao Etnatracker e grazie per il tuo aiuto.
Se faccio il test come mi hai detto, inserendo nel brwser lavitacongusto.it, mi ritrovo su www.lavitacongusto.it, questo è il mio httacces:

:
##
# @package        Joomla
# @copyright    Copyright (C) 2005 - 2012 Open Source Matters. All rights reserved.
# @license        GNU General Public License version 2 or later; see LICENSE.txt
##

##
# READ THIS COMPLETELY IF YOU CHOOSE TO USE THIS FILE!
#
# The line just below this section: 'Options +FollowSymLinks' may cause problems
# with some server configurations.  It is required for use of mod_rewrite, but may already
# be set by your server administrator in a way that dissallows changing it in
# your .htaccess file.  If using it causes your server to error out, comment it out (add # to
# beginning of line), reload your site in your browser and test your sef url's.  If they work,
# it has been set by your server administrator and you do not need it set here.
##

## Can be commented out if causes errors, see notes above.
# Options +FollowSymLinks

## Mod_rewrite in use.

RewriteEngine On


## Begin - Rewrite rules to block out some common exploits.
# If you experience problems on your site block out the operations listed below
# This attempts to block the most common type of exploit `attempts` to Joomla!
#
# Block out any script trying to base64_encode data within the URL.
RewriteCond %{QUERY_STRING} base64_encode[^(]*\([^)]*\) [OR]
# Block out any script that includes a <script> tag in URL.
RewriteCond %{QUERY_STRING} (<|%3C)([^s]*s)+cript.*(>|%3E) [NC,OR]
# Block out any script trying to set a PHP GLOBALS variable via URL.
RewriteCond %{QUERY_STRING} GLOBALS(=|\[|\%[0-9A-Z]{0,2}) [OR]
# Block out any script trying to modify a _REQUEST variable via URL.
RewriteCond %{QUERY_STRING} _REQUEST(=|\[|\%[0-9A-Z]{0,2})
# Return 403 Forbidden header and show the content of the root homepage
RewriteRule .* index.php [F]
#
## End - Rewrite rules to block out some common exploits.



## Begin - Custom redirects
#
# If you need to redirect some pages, or set a canonical non-www to
# www redirect (or vice versa), place that code here. Ensure those
# redirects use the correct RewriteRule syntax and the [R=301,L] flags.
#
## End - Custom redirects

##
# Uncomment following line if your webserver's URL
# is not directly related to physical file paths.
# Update Your Joomla! Directory (just / for root).
##

RewriteBase /

## Begin - Joomla! core SEF Section.
#
RewriteRule .* - [E=HTTP_AUTHORIZATION:%{HTTP:Authorization}]
#
# If the requested path and file is not /index.php and the request
# has not already been internally rewritten to the index.php script
RewriteCond %{REQUEST_URI} !^/index\.php
# and the request is for something within the component folder,
# or for the site root, or for an extensionless URL, or the
# requested URL ends with one of the listed extensions
RewriteCond %{REQUEST_URI} /component/|(/[^.]*|\.(php|html?|feed|pdf|vcf|raw))$ [NC]
# and the requested path and file doesn't directly match a physical file
RewriteCond %{REQUEST_FILENAME} !-f
# and the requested path and file doesn't directly match a physical folder
RewriteCond %{REQUEST_FILENAME} !-d
# internally rewrite the request to the index.php script
RewriteRule .* index.php [L]
#
## End - Joomla! core SEF Section.

Per quanto riguarda i tag title duplicati, dato che non ho mai usato tagmeta, il risultato è lo stesso se nel robots.txt inserisco?:
disallow: /component/users/?view=registration
disallow:  /component/users/?view=reset
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: etnatracker 12 Nov 2012, 10:36:19
Ciao beertod,


ho visto il tuo htaccess, non ho trovato la regola di redirect. Io dal mio pc non riesco ad accedere a "lavitacongusto.it", mi dà errore dns, mentre accedo a "www.lavitacongusto.it". Comunque, se tu inserendo la regola di redirect (che è corretta, è uguale a quella che uso io su etnatracking.com) hai verificato che funziona, sei a posto così. Virante credo che controlli anche se google ha indicizzato pagine con e senza www, l'esito negativo del test automatico può dipendere da quello.


Per il secondo problema: puoi anche fare come hai scritto tu, ma per dirla in dialetto catanese "ti perdi dalla casa", ti imbarchi in una cosa immane, dato che di quegli url te ne spunteranno decine, se non centinaia. Quindi ad ogni url indicizzato da google in quel settore, dovresti inserire la direttiva. E' troppo complesso... con tagMeta puoi usare le espressioni regolari e inserire con una sola direttiva la direttiva "noindex" in un intero gruppo di pagine. Dacci un'occhiata, installalo, poi ti dò due dritte su come inserire la direttiva.


Ciao


Etnatracker
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: beertod 12 Nov 2012, 11:06:16

ho visto il tuo htaccess, non ho trovato la regola di redirect. Io dal mio pc non riesco ad accedere a "lavitacongusto.it", mi dà errore dns, mentre accedo a "www.lavitacongusto.it (http://www.lavitacongusto.it)". Comunque, se tu inserendo la regola di redirect (che è corretta, è uguale a quella che uso io su etnatracking.com) hai verificato che funziona, sei a posto così. Virante credo che controlli anche se google ha indicizzato pagine con e senza www, l'esito negativo del test automatico può dipendere da quello.

 Dici che non dovrei fare piu' niente? Ma per il dominio duplicato resta il problema?
Comunque per scrupolo ho fatto un test su searchmasters e mi da questi errori:
:
http://www.lavitacongusto.it returns a HTTP/1.1 500 Server Error responsehttp://lavitacongusto.it returns a 200 (OK) response. PR N/Ahttp://www.lavitacongusto.it/index.php returns a HTTP/1.1 500 Server Error responsehttp://lavitacongusto.it/index.php returns a 404 not-found responsehttp://www.lavitacongusto.it/index.htm returns a HTTP/1.1 500 Server Error responsehttp://lavitacongusto.it/index.htm returns a 404 not-found responsehttp://www.lavitacongusto.it/index.html returns a HTTP/1.1 500 Server Error responsehttp://lavitacongusto.it/index.html returns a 200 (OK) response. PR N/Ahttp://www.lavitacongusto.it/index.shtml returns a 404 not-found responsehttp://lavitacongusto.it/index.shtml returns a 404 not-found responsehttp://www.lavitacongusto.it/index.asp returns a 404 not-found responsehttp://lavitacongusto.it/index.asp returns a 404 not-found responsehttp://www.lavitacongusto.it/default.asp returns a 404 not-found responsehttp://lavitacongusto.it/default.asp returns a 404 not-found responsehttp://www.lavitacongusto.it/index.aspx returns a 404 not-found responsehttp://lavitacongusto.it/index.aspx returns a 404 not-found responsehttp://www.lavitacongusto.it/index.cfm returns a 404 not-found responsehttp://lavitacongusto.it/index.cfm returns a 404 not-found responsehttp://www.lavitacongusto.it/index.pl returns a 404 not-found responsehttp://lavitacongusto.it/index.pl returns a 404 not-found responsehttp://www.lavitacongusto.it/default.htm returns a HTTP/1.1 500 Server Error responsehttp://lavitacongusto.it/default.htm returns a 404 not-found response
Questa la spiegazione:
Potential problems on this site

Per il secondo problema: puoi anche fare come hai scritto tu, ma per dirla in dialetto catanese "ti perdi dalla casa", ti imbarchi in una cosa immane, dato che di quegli url te ne spunteranno decine, se non centinaia. Quindi ad ogni url indicizzato da google in quel settore, dovresti inserire la direttiva. E' troppo complesso... con tagMeta puoi usare le espressioni regolari e inserire con una sola direttiva la direttiva "noindex" in un intero gruppo di pagine. Dacci un'occhiata, installalo, poi ti dò due dritte su come inserire la direttiva.


Ho seguito il tuo consiglio, ho installato tagmeta, sono andato su "rules" ma poi non riesco piu' ad andare avanti  :) . Poresti darmi una dritta per inserire il noindex su quelle pagine? Grazie!
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: etnatracker 12 Nov 2012, 11:28:26
Problema redirect: sono due problemi distinti e secondo il test che hai fatto, non ne hai risolto neanche uno :-)
Entrambi i tuoi url (con e senza www) restituiscono esito 200, mentre quello senza www dovrebbe restituire un 301 e reindirizzare all'altro. Del resto, nel tuo htaccess il redirect non l'hai messo!
Il secondo problema redirect che ti segnala il tuo test è legato al fatto che secondo lui dovresti re-indirizzare anche altre url, ma questo è più complesso e per il momento lascerei perdere.


Per tagmeta: crea una direttiva, pubblicala, inserisci come URI la seguente stringa


:
^(.*)/component/users

Vai nel riquadro Robots in alto a destra, seleziona l'opzione "no" per il campo index. Salva, vai in un url del tuo sito che contiene la scritta component/users, controlla il sorgente: dovresti trovare il metatag seguente:


:
<meta name="robots" content="noindex" />

Stai attento ad eventuali cache della pagina, se c'è il noindex dovrai attendere qualche giorno o settimana, vedrai che l'avviso di google sparirà.


Ricordati che TUTTI gli url che contengono la scritta component/users non verranno indicizzati.


ciao


Etnatracker
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: beertod 12 Nov 2012, 12:06:55
Problema redirect: sono due problemi distinti e secondo il test che hai fatto, non ne hai risolto neanche uno :-)
Entrambi i tuoi url (con e senza www) restituiscono esito 200, mentre quello senza www dovrebbe restituire un 301 e reindirizzare all'altro. Del resto, nel tuo htaccess il redirect non l'hai messo!


Ora ho messo il redirect come suggerito da loro:

:
RewriteEngine On
RewriteCond %{HTTP_HOST} !^www\.lavitacongusto\.it
RewriteRule (.*) http://www.lavitacongusto.it/$1 [R=301,L]

ma siamo al punto di partenza, facendo il test mi da lo stesso errore, il problema è capire perchè non funziona  :'(

ho impostato tagmeta come hai detto (ti allego l'immagine) ma nel codice sorgente di
http://www.lavitacongusto.it/component/users/?view=registration
non vedo
:
<meta name="robots" content="noindex" />

[allegato eliminato da un amministratore essendo vecchio più di un anno]
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: etnatracker 12 Nov 2012, 12:19:46
Per il redirect, stasera dò un'occhiata al tuo sito da casa e ti faccio sapere.

Per tagmeta: perdonami, mi sono dimenticato di dirti che devi anche attivare il plugin System - Tag Meta.


Ciao


Etnatracker
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: beertod 12 Nov 2012, 12:28:32
Grazie davvero per la tua disponibilità.
Ho attivato il plugin.
Ciao


: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: etnatracker 13 Nov 2012, 00:03:35


Ciao beertod,


ho controllato con httpfox, un plugin gratuito di firefox. Ho scritto "lavitacongusto.it" sul browser, il risultato è un errore di type "NS_ERROR_UNKNOWN_HOST", come puoi vedere in allegato ("redirect_non_corretto.png"). A questo punto non so perchè, viene fatto un redirect automatico alla home page. Questo è il motivo per cui becchi l'errore con il test automatico, in quanto occorre che l'esito sia un codice 301.


Ti consiglio di fare un'ultima prova, con il seguente codice di redirect:


:
RewriteCond %{HTTP_HOST} !^www\.lavitacongusto\.it [NC]
RewriteRule ^(.*)$ http://www.lavitacongusto.it/$1 [L,R=301]


Rispetto a quello di prima, c'è in più la direttiva NC che rende la condizione "case insensitive", questa è esattamente quella che uso io, se a te non funziona devi parlare con chi ti hosta il sito.


Per quanto riguarda TagMeta: non ci siamo ancora, non hai l'attributo noindex tra i metadati.


Guarda ad esempio la seguente pagina:


:
www.etnatracking.com/it/forum/main

Se guardi il sorgente, noterai la seguente riga:


:
<meta name="robots" content="noindex" />

Può darsi che non hai impostato correttamente il componente (io l'ho usato per joomla 1.5, tu credo stia usando una versione più nuova), oppure può darsi che hai la cache impostata e che fin quando non la pulisci o non scade, le pagine restano con il vecchio html. Per guardare questa cosa, dovrei entrare nel pannello di amministrazione (eventualmente fammi un account admin temporaneo e mi invii le credenziali in privato)


Ciao


Etnatracker



[allegato eliminato da un amministratore essendo vecchio più di un anno]
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: beertod 13 Nov 2012, 10:27:11
Ciao etnatracker,
ho inserito il codice modificato ma l'errore è sempre quello!  :'(
Anche il problema di tagmeta rimane...inoltre ho anche un altro title duplicato:
http://www.lavitacongusto.it/categorie

Ti mando i dati via messaggio, se gentilmente vuoi dare un'occhiata, grazie!!

: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: etnatracker 13 Nov 2012, 12:22:32
[size=78%]ho inserito il codice modificato ma l'errore è sempre quello! [/size] :'( [size=78%] [/size]
Anche il problema di tagmeta rimane...inoltre ho anche un altro title duplicato:
http://www.lavitacongusto.it/categorie (http://www.lavitacongusto.it/categorie)

Mamma mia, stavo impazzendo... ma chi è che si inventa certe diavolerie?
Nel tuo sito c'è installato un simpatico plugin che si chiama "byebyegenerator" che eliminava tutti i metatag di tipo Robot, per cui tag meta li metteva e lui li toglieva. Tutto ciò è molto strano, perchè il plugin di TagMeta l'avevo messo per ultimo.
Mi sono permesso di cambiare le configurazioni di quel plugin e ora c'è il no-index.

Ho messo due regole su tagMeta: una per evitare l'indicizzazione di tutte le pagine che contengono l'url "component/users" e uno per modificare la descrizione e il title nella pagina "categorie".

Comunque, tra i tuoi plugin c'è altra roba strana, ma questo esula dal forum. Ho notato che c'è un altro plugin, Canonicalization, che si occupa in teoria di far raggiungere il sito da un solo host, potrebbe essere questo il problema del tuo mancato redirect.

Fai questa prova: inserisci nell'htaccess la riga seguente:

:
redirect 301  /pippo http://www.lavitacongusto.it/categorieDigita l'url seguente:
:
www.lavitacongusto.it/pippoE almeno vedi se il modulo di redirect funziona correttamente (prendi httpfox e verifica che ci sia in effetti un codice 301 nella risposta con redirect). Se non funziona, parla con l'hosting oppure con chi ti ha fatto il sito e gli chiedi se ci sono plugin che possono interferire sul redirect come faceva byebyegenerator con i metatag.


Ciao


Etnatracker
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: beertod 13 Nov 2012, 14:29:13
Purtroppo c'e' ancora il problema di title duplicato sulle categorie, guarda tu stesso:
http://www.lavitacongusto.it/categorie

Per quanto riguardo i plugin la maggior parte erano solo di prova, ora provvedo a rimuoverli.




Fai questa prova: inserisci nell'htaccess la riga seguente:

:
redirect 301  /pippo http://www.lavitacongusto.it/categorie
Ho appena fatto il test, è questo redirect funziona, httpfox mi da 301...perchè allora gli altri non funzionano??  :-[

: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: etnatracker 13 Nov 2012, 14:39:05
Grazie per l'aiuto etnatracker, comunque il title in categorie purtroppo è ancora duplicato, guarda tu stesso:
http://www.lavitacongusto.it/categorie (http://www.lavitacongusto.it/categorie)

E' duplicato nel senso che c'è scritta due volte la stessa cosa, ma io ti in coda ho aggiunto la parola "Categorie".
Se google te lo segnala duplicato, è perchè ce n'è un altro con lo stesso title, io te l'ho cambiato quindi ora è univoco. Se il problema era nella duplicazione in se stessa... occorre fare altro. Puoi farlo tu stesso nella regola tagmeta che ti ho definito, è davvero semplice.
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: beertod 13 Nov 2012, 14:46:26
In pratica nel sorgente http://www.lavitacongusto.it/categorie (http://www.lavitacongusto.it/categorie) ( e nella barra blue di firefox in alto) viene fuori:
:

  <meta name="title" content="La vita con gusto - lo shopping online economico etico e vegan - La vita con gusto -  lo shopping online economico etico e vegan - Categorie" />   <meta name="description" content=" - Categorie" />   <title>La vita con gusto - lo shopping online economico etico e vegan - La vita con gusto -  lo shopping online economico etico e vegan - Categorie</title>

ripete due volte il title, non capisco perchè e non so nemmeno come fare per sistemarlo...
: Re:Come evitare i contenuti duplicati nel tuo sito. Prima parte
: beertod 14 Nov 2012, 19:57:24
Grazie a etnatracking ho risolto buona parte dei miei problemi!