Contenuti Duplicati & SEO: Conoscerli per sconfiggerli

Contenuti Duplicati & SEO: Conoscerli per sconfiggerli

contenuti duplicati seo

Cosa sono i Contenuti Duplicati?

Eccoti subito una definizione di “contenuti duplicati”, si tratta essenzialmente di contenuto che appare sul web in più di una posizione. Per “posizione” intendo URL di pagina, dunque se lo stesso contenuto testuale appare su più di un indirizzo (URL) allora, amico mio, hai un problema di contenuti duplicati.


Se lavori in ambito web e SEO i contenuti duplicati sono un po” come il lunedì mattina: fastidiosi e ripetitivi.Ecco perché devi conoscerli meglio e sapere come contrastarli in maniera efficace e definitiva.Allora caro mio, se vuoi davvero aumentare le visite al sito da buon consulente seo non mi resta che invitarti a proseguire nella lettura perché sei capitato proprio nel posto giusto. In questa guida voglio portarti a conoscere da vicino proprio i contenuti duplicati, quelli che sono paragonabili ai “Voldemort della SEO”. Ma visto che la faccia da Harry Potter proprio non ce l”hai sappi che non potrai usare la bacchetta magica per liberartene definitivamente.

Contenuti duplicati: il principale problema SEO

Posso riassumere e semplificare la questione così come segue: sebbene i contenuti duplicati non possano generare “penalizzazioni algoritmiche” essi possono certamente impattare pesantemente sul posizionamento sui motori di ricerca del tuo sito web.Questo accade principalmente perché quando Google trova quelli che chiama “contenuti evidentemente simili” (appreciably similar content), in diversi indirizzi web, diventa difficile per lui difficile decidere quale versione di questi documenti – troppo similari – possa essere di fatto la più rilevante per una determinata ricerca degli utenti.

Perché i contenuti duplicati sono così importanti?

Per i motori di ricerca i contenuti duplicati possono portare a 3 problemi principali:

  1. I crawlers dei motori di ricerca non sono proprio dei geni, nemmeno quelli di Google! Per questo non sono in grado di riconoscere quale versione dei contenuti troppo simili è da indicizzare, includere o escludere dai risultati.
  2. I crawlers non sono capaci di dirigere in modo appropriato tutte le metriche derivanti dai link che puntano a un contenuto (trust, autorità, anchor text, link equity) e separare queste metriche tra le diverse versioni dello stesso.
  3. Di fronte ad un problema di contenuti duplicati i crawlers non riescono a capire quale versione del contenuto vada posizionata per le domande di ricerca correlate (query).

Per i webmaster, quando è presente contenuto duplicato, possono verificarsi perdite di ranking e quindi di traffico. Queste perdite sono ascrivibili a due problemi principali:

  • Problema N°1: Al fine di offrire la migliore esperienza di ricerca possibile, i motori di ricerca raramente mostrano versioni multiple di uno stesso contenuto, sono dunque forzati a scegliere autonomamente la versione migliore da mostrare nei risultati. Il perché di questo comportamento è semplice: scegliere un solo contenuto limita la visibilità dei risultati duplicati nelle SERP.
  • Problema N°2: La link equity o link juice (come anche viene chiamata) potrebbe trovarsi diluita a causa del fatto che i siti che scelgono di linkare un certo contenuto potrebbero selezionare per errore il duplicato. Di conseguenza invece di avere tutti i tuoi bei link che puntano allo stesso contenuto conferendo autorità alla pagina, ti ritroveresti con una serie di duplicati con bassa potenza da link equity.

Ora il quadro dei rischi del contenuto duplicato dovrebbe risultarti più chiaro.Ma quando avrai smaltito le sensazioni da brividi che ne dici se ti spiego cosa causa più frequentemente i contenuti duplicati

Contenuti duplicati: le cause più frequenti

Nella stragrande maggioranza dei casi i webmaster non creano intenzionalmente contenuti duplicati, ma questo non significa che essi non siano presenti. Alcune stime dicono che circa il 29% dell”intero word wide web potrebbe essere composto da contenuti duplicati.contenuti duplicati ricerca raven toolMa ora voglio farti conoscere alcuni dei modi più comuni che portano alla formazione di contenuto duplicato in maniera non intenzionale.

#1 Persistenza contemporanea di HTTP e HTTPS

Se il tuo sito ha due versioni separate una in http:// e l”altra in https:// e lo stesso contenuto si trova su ambedue le versioni del sito hai certamente un problema di contenuti duplicati!Lo stesso accade nel caso in cui il tuo sito abbia una versione www.nomesito.it e un”altra solo nomesito.it (senza www). Se gli stessi contenuti sono presenti su ambedue le versioni allora stai dando in pasto al bot contenuti duplicati.TIPS: Per scongiurare questo rischio devi reindirizzare tutto ciò che è HTTP verso HTTPS preferibilmente attraverso la modifica del file HTACCESS così da elaborare lato server tutti i reindirizzamenti.Vuoi fare da te? Eccoti il codice necessario:

RewriteEngine OnRewriteBase /RewriteCond %{HTTPS} offRewriteCond %{HTTP:X-Forwarded-Proto} !httpsRewriteRule ^(.*)$ https://%{HTTP_HOST}%{REQUEST_URI} [L,R=301]

Contatta Roberto
la prima consulenza web è sempre gratuita!

#2 Presenza di parametri nelle tue URL

I parametri URL, come il tracciamento dei click e alcuni codici di analytics, possono causare problemi di contenuto duplicato. In questo caso il problema non nasce soltanto a causa dei parametri stessi, ma nel modo in cui i parametri appaiono nelle url.Ecco alcuni esempi pratici:

  • www.tuosito.com/pagina-prodotto?colore=blu – potrebbe essere un duplicato di: www.tuosito.com/pagina-prodotto
  • www.tuosito.com/pagina-prodotto?colore=blu&categoria=3 – potrebbe essere un duplicato di: www.tuosito.com/pagina-prodotto?categoria=3&colore=blu

Allo stesso modo se sul sito stai utilizzando un sistema per applicare un certo ID alla sessione degli utenti questo può generare contenuti duplicati. Questo problema si verifica quando alla sessione di ciascun utente è assegnato un ID differente che viene immagazzinato nell”URL. Il concetto di base è che qualunque parametro presente nelle url può essere causa di un contenuto duplicato.COME RISOLVERE: In questi casi l”intervento è quasi sempre custom e risolvibile attraverso l”inserimento di un link rel=canonical nelle pagine varianti.

#3 Contenuti copiati o “grattati”

Quando si parla di “contenuti” duplicati si include in questo insieme non solo i blog post o il contenuto editoriale, ma anche le informazioni delle pagine prodotto, ad esempio di un eventuale e-commerce. I copioni che fanno “scraping” (come si dice in gergo) o copiano il contenuto di un sito possono causare problemi di comprensione al bot.In questo senso c”è un problema che si ripete spesso in tantissimi e-commerce: quando un prodotto è molto comune i webmaster tendono a copiare la descrizione dello stesso esattamente come fornita sul sito del produttore.  Questo atteggiamento come capirai comporta la creazione di contenuti duplicati perfettamente identici in molti luoghi del web.COME RISOLVERE: Qui c”è davvero poca trippa per gatti, la maggior parte delle volte dovrai metterti l”anima in pace e riscrivere al meglio tutte le schede prodotto. Sono tantissime e non sai come fare? Prendi certamente in considerazione l”idea di pagare qualcuno 🙂

Contenuti duplicati: soluzioni semplici a problemi difficili

Eccoci al punto nodale del discorso. Ora ti spiego come risolvere i problemi che derivano dai contenuti duplicati, quindi non preoccuparti troppo, in fondo i sistemi che ti spiegherò sono solo un pelino più complessi rispetto alla teoria della relatività di Einstein, quindi non hai nulla di che preoccuparti ;).

Tutto si risolve applicando un principio di massima: specificare al bot quale dei vari contenuti duplicati è quello giusto/originale.
Quando molte pagine che potenzialmente possono rankare bene vengono combinate in una sola, allora smettono di competere l”una con l”altra e liberano il loro vero potenziale. L”impatto positivo sulle pagine che vuoi far posizionare sarà sbalorditivo.Ti stai già sfregando le mani eh? Ecco qui le contromisure che cercavi contro i contenuti duplicati:

1) Redirect 301: il principale antidoto ai contenuti duplicati

In molti casi il modo migliore per risolvere i problemi da contenuto duplicato è realizzare un redirect 301 dal contenuto duplicato alla pagine con il contenuto originale.Così facendo le diverse pagine combinano il loro potenziale di ranking in una sola e non solo smetteranno di competere tra di loro, ma creano anche un segnale di rilevanza e popolarità più forte a livello generale. Questo, infine, impatterà le possibilità di un buon posizionamento della pagina target.

2) Abbatti i contenuti duplicati sfruttando il rel=”canonical”

Altra opzione valida per sfrondare i contenuti duplicati viene dall”attributo rel=canonical. Questo comunica al motore di ricerca che una certa pagina deve essere trattata come una copia di una specifica URL e tutti i suoi link, metriche e potere di posizionamento possono essere accreditati a un altra URL specificata.Il rel=canonical è parte dell”head di una pagina HTML e se ti stai chiedendo come aggiungerlo ecco come fare:

<head>...[altro codice che potrebbe trovarsi nel tuo documento HTML]...<link href="URL DELLA PAGINA CANONICA" rel="canonical" />...[altro codice che potrebbe trovarsi nel tuo documento HTML]...</head>

L”attributo rel=canonical dovrebbe essere aggiunto nell”head di qualsiasi pagina duplicata con la parte “URL DELLA PAGINA CANONICA” che deve contenere la URL della pagina obiettivo (mantenendo sempre le virgolette mi raccomando ;).

Pss… Vuoi saperne di più sulla canonicalizzazione delle tue URL?Leggi l”approfondimento: Rel Canonical, cosa è e perché non puoi farne a meno lato SEO

3) Specificare il “dominio preferito” in Search Console

La Search Console di Google ancora una volta si rivela utilissima anche per i contenuti duplicati. Permette infatti di selezionare il “preferred domain” del proprio sito e specificare che il bot debba scansionare i diversi parametri URL in maniera differente.dominio preferito su search console

Il problema principale di questa soluzione è che funziona soltanto per Google e non per i bot degli altri motori di ricerca tipo Bing, quindi è consigliata soltanto se proprio non te ne frega una cippa fritta degli altri motori di ricerca!

4) Togli ai contenuti duplicati ogni pretesa grazie al noindex

Abbiamo poi un meta tag preistorico ma ancora valido che può tornarti particolarmente utile per affrontare i contenuti duplicati ed è il meta tag robots,  quando è utilizzato con la dicitura “noindex, follow”.Anche questo meta tag deve essere applicato nella sezione head dell”HTML di ogni singola pagina da te individuata come contenuto duplicato. Così facendo escluderai quel contenuto dall”indice del motore di ricerca.Ecco come si presenta il meta tag robots:

<head>...[altro codice che potrebbe trovarsi nel tuo documento HTML]...<meta name="robots" content="noindex,follow">...[altro codice che potrebbe trovarsi nel tuo documento HTML]...</head>

In questo modo ti assicuri che la pagina sia ancora “scansionabile” dal bot, ma non indicizzata. Questa è la soluzione migliore specialmente nei problemi di contenuto duplicato dovuti alla paginazione.

Ocio al rispetto del crawl budget, se utilizzi il meta no index su una pagina assicurati che quest”ultima venga poi esclusa a sua volta dalla tua Sitemap, al contrario genererai un errore dovuto dal fatto che inviti Google a visitare il tuo appartamento facendogli trovare poi le porte delle stanze chiuse a chiave.

Contenuti duplicati: individua quelli presenti nel tuo sito grazie a SiteLiner

Molto bene, ora dovresti avere le idee più chiare giusto? So bene che una mano d”aiuto non guasta mai e per questo eccoti il mio tool preferito per controllare la presenza di contenuti duplicati all”interno del tuo sito web.siteliner per controllare la presenza di contenuti duplicati allVai su siteliner.com, inserisci la url del sito che vuoi controllare ed in un batter d”occhio ti troverai di fronte allo stato d”arte del tuo sito web!siteliner guida 

Addio contenuti duplicati? Forse…

Se avevi un problema di contenuti duplicati o temi di esserne vittima un giorno o l”altro, ora hai 4 assi nella manica che puoi giocarti per mantenere il controllo della situazione.Solo i siti che ottimizzano aspetti come questo riescono a dialogare alla pari con Google e possono porre le giuste basi per un posizionamento solido e duraturo nel tempo.Come hai compreso però, affrontare i contenuti duplicati può essere complesso da un punto di vista tecnico, per questo se non te la senti di mettere le mani in pasta, lascia che lo faccia un professionista al posto tuo. Molto spesso è questa la soluzione migliore, altrimenti si rischia solo di impasticciare ancora di più le cose. Se poi dovessi scegliere proprio me sappi che ne sarei felice 😀

Fai marketing ascoltando, non strillando.
Un abbraccio.

Scelti per te algoritmicamente

Google Tag Manager Questo articolo è stato scritto da Matteo Zambon, responsabile del progetto Tag Manager Italia. Come, non sai cos’è Google Tag Manager? Se non sai c...
Perché gli imprenditori sbagliano a fare da consulente SEO per la propria Aziend... Una domanda: Vuoi fare l'imprenditore o il consulente SEO? Nel marasma totale di nozioni che girano per la rete ne emergono spesso due incredibilment...
E se domani la SEO fosse rimpiazzata da Robot? Ieri parlavo con un Francesca, una ragazza che mi a ha contattato perché io l'aiutassi a far apparire il suo sito su Google. Voleva lanciare il suo pr...
+17 cose sulla tua SEO on page che Google ti direbbe ora Molto bene, se sei qui immagino che hai fatto ed indicizzato il tuo sito, magari messo su un blog, e ora, visto che il traffico scarseggia, vuoi capir...
Come indicizzare un PDF ottimizzandolo per Google Search E così, a differenza della maggior parte delle persone che cerca come indicizzare un sito tu hai cercato una guida per indicizzare PDF!Bene, quest...
+16 cose da sapere se vuoi indicizzare un sito come farebbe un SEO Perché indicizzare un sito? Se vuoi guadagnare traffico dai motori di ricerca, ricevere contatti o magari vendere i tuoi prodotti o servizi devi assic...

Che mi racconti di bello?