Se vuoi evitare duplicati delle tue pagine su Google, il tag canonical è lo strumento da conoscere. In
questo articolo, vediamo bene come funziona e come utilizzarlo al meglio
Se sei qui, molto probabilmente stai cercando di
ottimizzare il tuo sito web perché sia
visualizzato correttamente sui motori di ricerca e, possibilmente,
sia posizionato da Google nella parte alta del suo indice,
dove potrà essere trovato. Ti sarai certamente reso conto, allora, che - insieme
all'
ottimizzazione dei contenuti - bisogna considerare una serie di
interventi tecnici che manifestano a
Google
quali pagine del sito vorremmo fossero indicizzate.
Abbiamo parlato, infatti, di altri
due strumenti fondamentali da utilizzare per comunicare con GoogleBot
(il crawler che Google utilizza per l'indicizzazione): la
sitemap
e il file
robots.txt.
In quest'articolo completiamo questo argomento spiegandoti come utilizzare il
tag rel="canonical", molto
utile quando si vuole
evitare la presenza di pagine duplicate su Google. Se non ne hai mai sentito
parlare non preoccuparti, ti sarà tutto più chiaro dopo la lettura di questa guida.
Per prima cosa, cerchiamo di dare una
definizione di URL canonico.
Che cos'è un URL canonico
Secondo la
definizione ufficiale di Google "un URL canonico è l'URL della pagina che Google ritiene
più rappresentativo tra un insieme di pagine duplicate sul tuo sito". Si tratta perciò, dell'
URL che Google
indicizza tra le varie versioni di una stessa pagina web con contenuto identico o solo leggermente
diverso.
Sappiamo già quale domanda hai in testa a questo punto:
ma come può accadere che il mio sito web
abbia pagine duplicate se io creo solo una versione per ogni pagina?
Te lo spieghiamo subito. Può accadere che si creino delle pagine duplicate del tuo sito web per
diversi motivi.
Ad esempio, può essere richiamato dal browser il tuo sito sia nella versione con e senza "www",
oppure nelle versioni "http" e "https". Oppure, soprattutto nella gestione dei permalink dinamici, può
capitare che, a seconda delle occasioni, le stesse pagine vengano mostrate con un URL diverso.
Trovi di seguito una
lista non esaustiva di URL duplicati di esempio:
-
Versioni htttp e htttps:
https://www.sitoesempio.com/categoria-a/
http://www.sitoesempio.com/categoria-a/
-
Senza www:
https://sitoesempio.com/categoria-a/
-
Versione mobile:
https://m.sitoesempio.com/categoria-a/
-
Sintassi leggermente diversa:
https://www.sitoesempio.com/categoria-a
https://www.sitoesempio.com/categoria-A/
-
URL dinamici (utilizzati per pagine che, ad esempio, prevedono filtri di ricerca):
https://www.sitoesempio.com/products?category=shoes&color=blue
-
Post salvati in più sezioni nelle categorie di un blog:
https://www.sitoesempio.com/categoria-a/post-1
https://www.sitoesempio.com/categoria-b/post-1
Tutti questi risultati, per Google,
rappresentano pagine diverse e costituiscono
duplicati. Uno o più di
questi risultati potrebbero venire, perciò, indicizzati al posto di quello che noi consideriamo l'URL
principale. Per risolvere questo problema il modo migliore è quello di comunicare a Google
qual è l'URL canonico,
ed effettuare quindi la
"canonicalizzazione" dell'URL. Vediamo insieme
come si fa.
Come comunicare a Google l'URL canonico
Per
comunicare al crawler l'URL canonico, bisogna includere nel tag della pagina la
stringa seguente:
<link rel="canonical" href="https://www.sitoesempio.com/categoria-a/" />
In questo modo il crawler sarà in grado di distinguere quali, tra i vari URL presenti,
sono considerati
come maggiormente rappresentativi dal gestore del sito web, e muoversi di conseguenza.
Nell'effettuare questa
"canonicalizzazione" dell'URL bisogna tenere in considerazione i seguenti
accorgimenti:
-
È opportuno inserire gli URL canonici anche nel file sitemap.xml;
-
Non è indicato, invece, l'utilizzo del file robots.txt e dell'attributo "noindex" per l'esclusione delle pagine canoniche;
-
Per l'eclusione degli URL non canonici, non bisogna utilizzare lo strumento di rimozione
degli URL di Google Search Console;
-
Per gli URL canonici, gli URL con HTTPS sono da preferire;
-
Ogni pagina deve avere un solo tag rel="canonical";
-
L'URL canonical non è una direttiva che il crawler utilizza obbligatoriamente, ma di
un’indicazione, un suggerimento che il motore di ricerca può decidere di non utilizzare;
-
Puoi verificare l'URL canonical nello strumento di controllo degli URL di Google Search Console;
-
L'URL canonical è uno strumento diverso dal redirect 301, chne invece serve per trasferire il
traffico e link da una pagina obsoleta a un'altra più nuova.
Perché è importante utilizzare il tag "canonical"
Ora che hai visto
come utilizzare correttamente il tag canonical, di seguito trovi alcuni
motivi per cui dovresti utilizzarli:
-
Per avere una presenza più "pulita" e coerente nel motore di ricerca con possibilità di
analizzare al meglio le proprie performance;
-
Per ottimizzare le risorse di crawling (crawl budget): infatti, le pagine canoniche vengono
scansionate dal crawler più frequentemente rispetto alle pagine duplicate.
Vuoi approfondire?
Ora che hai imparato
come utilizzare il tag rel="canonical", la
gestione delle pagine duplicate su Google
non ha più segreti per te. Se vuoi approfondire, abbiamo scritto qualcosa in più su come
agevolare l'indicizzazione del proprio sito web su Google e
scrivere un articolo ottimizzato per Google
sul tuo
blog aziendale.
Non dimenticare, inoltre, che
Google aggiorna continuamente il proprio algoritmo e
c'è sempre
qualcosa di nuovo da scoprire. Di recente, abbiamo parlato del nuovo aggiornamento
Google Page Experience.
Ne hai mai sentito parlare?
Se ancora non ti basta,
noi siamo qui. I nostri
consulenti sono
sempre a disposizione per parlare delle
opportunità offerte dal SEO e analizzare con te
i migliori strumenti di web marketing per cogliere
tutte le opportunità offerte dal digital.
Contattaci