Web Agency a Verona - Studio grafica e agenzia di comunicazione
Web Agency Verona

< Torna al Blog

Sitemap.xml: cos'è e come crearla correttamente

25 marzo 2022

Condividi

Grazie al file Sitemap.xml, possiamo comunicare a Google quali pagine sono presenti nel nostro sito e altre preziose informazioni utili all'indicizzazione del nostro sito web nei motori di ricerca. In questo articolo ti insegniamo cos'è e come utilizzarla correttamente

Se vuoi che Google indicizzi correttamente le pagine del tuo sito dominio, sito web o e-commerce, tra i vari metodi per indicizzare il tuo sito web uno dei più efficaci è la sitemap.xml. Non sai come funziona? Sei nel posto giusto. Mettiti comodo: ti diciamo tutto quello che c'è da sapere. Quando avrai letto questo articolo sarai un vero esperto di sitemap! Per prima cosa, definiamo cosa è precisamente un file sitemap.xml.

Cos'è il file sitemap.xml

La sitemap è un file, con estensione ".html" o ".xml", che contiene al suo interno tutti gli url delle pagine di un sito web. Proprio come l'indice di un libro, la sitemap elenca tutti i contenuti che sono presenti nel nostro sito web, mettendoli in ordine gerarchico.

Ci sono diverse funzioni cui la sitemap può assolvere. In primo luogo, può essere utile per una rapida consultazione dei contenuti del sito web da parte degli utenti. In questo caso, una sitemap in formato html, semplice da utilizzare e dall'interfaccia intuitiva, può fare al caso nostro. Se, invece, l'obiettivo è quello di comunicare a Google e ad altri motori di ricerca quali sono i contenuti da indicizzare del nostro sito web, la nostra sitemap dovrà essere in formato xml.

Sitemap.xml: scopriamo come funziona

Come abbiamo appena detto, se vogliamo comunicare a Google e ad altri motori di ricerca quali sono le pagine del nostro sito perché queste siano aggiornate più velocemente nell'indice del motore di ricerca, una sitemap in formato ".xml" fa al caso nostro. La sitemap.xml, infatti, è stata inventata proprio da Google nel 2005 per ottimizzare la navigazione del proprio crawler.

Inserire un file sitemap.xml nel nostro sito web rappresenta, perciò, il metodo più efficace per comunicare a Google quali contenuti del nostro sito web vogliamo siano indicizzati, includendo una serie di informazioni aggiuntive, come importanza della pagina, frequenza di modifica e ultimo aggiornamento.

Perché dovresti inserire un file sitemap.xml nel tuo sito?

L'inserimento di una sitemap nel tuo sito ti dà accesso a una serie di vantaggi. Non solo Google indicizzerà con maggior precisione le pagine del tuo sito, ma avrà uno strumento per la corretta interpretazione e scansione di:
  • Siti nuovi, che non sono ancora stati "notati" dal crawler di Google;
  • Siti che vengono aggiornati con molta frequenza, come i siti di notizie;
  • Siti che presentano contenuti isolati, cioè pagine che hanno un numero inferiore di collegamenti nei confronti del gruppo principale di pagine (come, ad esempio, le landing page);
  • Siti web che hanno un gran numero di pagine (oltre 500).
Rispetto a questi vantaggi, però, bisogna specificare due cose.

In primo luogo, va detto che non tutti i siti web hanno bisogno per forza di una sitemap. Se il tuo sito web non è tra quelli che abbiamo appena elencato, ed è perciò già presente sul motore di ricerca, è relativamente piccolo e ha un buon collegamento tra le sue pagine, gli spider di Google dovrebbero trovare le pagine anche senza bisogno di una sitemap.

In secondo luogo, va detto che la presenza delle pagine nella sitemap non garantisce che quest'ultime saranno indicizzate, in quanto Google non assicura, in nessuna occasione, che un contenuto presente in rete trovi spazio nel suo indice.
Come creare una sitemap corretta

Come creare una sitemap corretta

Veniamo ora al dunque e cerchiamo di capire, nel concreto, come possiamo creare una sitemap codificata correttamente e inviarla a Google. Il protocollo, distribuito sotto la licenza Attribution- ShareAlike Creative Commons License, prevede che il file della sitemap sia composto da tag XML e codificato in UTF-8.

Una sitemap codificata in modo giusto appare così:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.sitoweb.it/</loc>
<lastmod>2022-24-03</lastmod>
<changefreq>daily</changefreq>
<priority>0.6</priority>
</url>
</urlset>

Per capire come configurarla correttamente, vediamo gli elementi di cui si compone.

Tag di apertura

Dopo la codifica XML <?xml version="1.0" encoding="UTF-8"?>, che indica al motore di ricerca la versione XML (1.0) e la codifica di caratteri utilizzata (UTF-8), è presente la stringa URL SET, che serve a indicare al crawler il protocollo utilizzato. In questo caso ci riferiamo al protocollo 0.9, utilizzato di frequente per comunicare con Google e altri motori di ricerca.

Il tag di apertura e chiusura della sitemap sono <urlset> e </urlset>.

Inserire gli URL

All’interno della pagina inseriamo una voce <url> per ogni pagina presente nel sito. Per ciascuna di queste voci, dovrà essere obbligatoriamente presente la voce secondaria <loc>, che indica l’URL.

Tag facoltativi

Se il tag <loc> non può mancare nella nostra sitemap, il quanto l’obiettivo di quest’ultima è proprio quello di fornire agli spider di Google una serie di URL da seguire, ci sono una serie di tag che sono facoltativi e che servono a dare al crawler ulteriori informazioni di varia natura.

Ecco una lista dei tag facoltativi che puoi utilizzare nella sitemap:
  • <lastmod> - Contiene la data dell’ultima modifica della pagina in formato AAAA-MM-GG;
  • <changefreq> - Può contenere la frequenza con la quale la pagina potrebbe venire modificata. Includendo questo tag, si da un’indicazione generica al motore di ricerca, anche se quest’ultima non corrisponderà per forza poi alla frequenza di scansione della pagina da parte del crawler. I valori di questo tag possono essere: always, hourly, daily, weekly, monthly, yearly, never.
  • <priority> - Includendo questo tag, si stabilisce la priorità dell’URL rispetto agli altri URL del sito. Si può inserire un valore compreso tra 0,0 e 1,0, mentre il valore predefinito per ogni pagina è 0,0. È bene tenere in considerazione che, nonostante il tag <priority> possa rappresentare un fattore di ranking delle pagine, bisogna ricordarsi che la priorità assegnata è relativa: se tutte le pagine sono importanti, nessuna lo è. Dare un’alta priorità a tutte le pagine non serve e, anzi, può confondere il crawler.


Ulteriori indicazioni sulle sitemap

Ora che abbiamo visto la struttura di un file “sitemap.xml”, restano alcune cose da dire relativamente ai limiti che possiamo incontrare nella loro creazione.

Dobbiamo considerare, infatti, che un file sitemap non può superare i 50 MB e i 50.000 URL. Nel caso si superi questo numero di link, sarà necessario suddividere la sitemap in più sotto-sitemap collegate a un unico indice. Per farlo, si deve creare una sitemap principale con il tag <sitemapindex> e includere una voce <sitemap> per ogni sitemap presente con l’URL inserito nella voce secondaria <loc>, come nell’esempio seguente:

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>http://www.nomesito.com/sitemap1.xml.gz</loc>
</sitemap>
<sitemap>
<loc>http://www.nomesito.com/sitemap2.xml.gz</loc>
</sitemap>
</sitemapindex>

La seconda indicazione che ti diamo è di tipo più operativo: se vuoi creare una sitemap velocemente e senza l’aiuto di un programmatore esperto, Google ha messo a disposizione una serie di link di sitemap generator online disponibile a questo link.

Come inviare la sitemap a Google?

Esistono due metodi efficaci per inviare la tua sitemap a Google:
  • Puoi inserire la tua sitemap nel file “robots.txt” per indicare al crawler che esiste la sitemap e dove si trova, utilizzando il comando "Sitemap:";
  • Puo caricare la tua sitemap nell’apposita sezione di Google Search Console, lo strumento gratuito messo a disposizione da Google per gestire la presenza del proprio sito web nel motore di ricerca.
Ora che sai cos'è il file sitemap.xml e come realizzarlo per comunicare con il crawler di Google, ricordati che è sempre utile che il file sia ottimizzato in modo da migliorare il proprio posizionamento sui motori di ricerca.

Ricordati di rimanere sempre aggiornato sui più recenti aggiornamenti dell'algoritmo di Google, ci sono continue modifiche che possono influire sul tuo posizionamento sul motore di ricerca. Per aiutarti, abbiamo parlato di recente dell'aggiornamento di Google Page Experience.

Se vuoi approfittare delle opportunità offerte dal web marketing, la nostra Web Agency a Verona è disponibile per una consulenza senza impegno e per un check-up SEO gratuito del tuo sito. Contattaci.