Qu’est ce qu’un Sitemap et à quoi ça sert ?

Le Sitemap est un fichier d’indexation qui facilite la vie de Google en répertoriant le listing des pages référençables d’un site internet destinés au robots des moteurs de recherche (par exemple, Google pour la suite de cet exemple). Ce fichier, le plus souvent au format XML permet à Google de récupérer en une seule fois toutes les pages que l’on souhaite référencer sur son site internet sans avoir besoin de parcourir l’intégralité du site en crawlant le site de lien en lien.

Si ce fichier n’a aucune incidence sur le positionnement de vos pages dans les résultats de recherche (SERP), il permet de faciliter l’indexation de vos fichiers pour que Google prenne connaissance de leur existence afin de les indexer puis de les référencer. Vous pouvez influencer le positionnement de vos pages vers le haut seulement grâce au socle technique de votre page, son contenu sémantique et sa notoriété auprès de Google, les trois fameux piliers du référencement qui servent à générer plus de trafic web sur votre site.

Qu’est ce que le Sitemap

Le sitemap est une méthode web inventée par Google en 2005. Il s’agit d’un fichier XML présentant la liste des contenus d’un site internet. Il permet de répertorier les URLs qui doivent être explorées (crawlées) par les moteurs de recherche sous la forme d’un listing.

Le fichier sitemap.xml est uniquement destiné aux moteurs de recherche. Lorsque les robots de Google crawlent ce fichier, ils récupèrent en un seul passage les pages et les contenus qu’ils doivent explorer pour les indexer.

Le sitemap permet donc de faciliter l’indexation de contenus et de signaler aux moteurs l’existence de ces pages, notamment de pages profondes ou les pages orphelines qu’on ne peut pas trouver en se promenant sur le site ou difficilement.

Listing Sitemap

Le sitemap remplit son rôle en listant l’intégralité des pages et articles que l’on souhaite lui faire connaitre sur le site.

Différences entre un Sitemap et un plan de site

En bon français, Sitemap se traduit littéralement par plan de site. Le plan de site sert essentiellement au visiteur pour retrouver une page à partir d’une arborescence simplifiée et proposée par le gérant du site et qu’on retrouve souvent en pied de page et qu’a qu’un but informatif.

Le sitemap, en revanche, n’a qu’un seul objectif clair : aider les robots de Google. Il n’est pas accessible lorsque l’on navigue naturellement sur le site et n’est trouvable qu’en tapant NOMDEDOMAINE.FR/sitemap.xml à la racine du site.

Le fichier n’ayant pas forcément l’obligation d’apparaitre à cette localisation sur votre site, le plus simple est d’annoncer l’adresse de son sitemap directement dans le fichier robots.txt (disponible en tapant NOMDEDOMAINE.FR/robots.txt à la racine du site) et voir où il se situe s’il est déclaré.

Sitemap déclaré dans le Robots.txt

Il est facile de retrouver son sitemap quand il est directement déclaré dans le fichier Robots.txt de votre site internet.

 

Doit-on obligatoirement avoir un sitemap ?

Il est préférable d’avoir un sitemap sur son site internet, cela respecte les bonnes pratiques mises en place pour avoir un bon référencement naturel. Il est tout à fait possible de ne pas avoir de sitemap pour aider Google, si vous respectez certaines conditions qui n’empêcheront pas le bon déroulement de l’indexation de votre site :

  • Votre site ne doit pas avoir plus de 30 pages (au delà, Google va passer trop de temps à chercher les pages sur votre site)
  • Votre maillage interne doit permettre de trouver toutes les pages que vous souhaitez indexer en moins de 3 clics, sinon Google considèrera que ces pages sont trop profondes et donc inatteignables.

Un sitemap étant limité à 50.000 URLs, il vous sera possible d’avoir plusieurs fichiers de sitemap pour lister plusieurs catégories de votre site. Dans ce cas précis, vous pourrez créer un index de sitemap qui orientera les robots crawlers de Google sur les différents fichiers d’indexations, par exemple :

  • Sitemap pour les pages de votre site
  • Sitemap pour les articles de votre blog
  • Sitemap pour les produits de votre boutiques
  • Sitemap pour les catégories de produits
  • Sitemap pour les images et vidéos
Plusieurs sitemap

Un sitemap index permet d’orienter les crawlers vers un sitemap spécialement conçu pour les pages du site, et un autre pour les articles du blog

 

Comment créer un sitemap ?

Si votre site internet a été créé via un CMS, tel que WordPress par exemple, vous pouvez utiliser des plugins spécialement conçus pour créer votre sitemap automatiquement et le mettre à jour à chaque nouveauté sur votre site. Yoast SEO, All in One SEO et RankMath sont les plugins les plus connus et les plus faciles d’utilisation. Prenez soin de retirer directement toutes les URLs et fichiers d’indexations de catégories que vous ne souhaitez pas indexer afin d’optimiser le budget de crawl des robots.

Vous pouvez également créer votre fichier sitemap manuellement avec quelques notions d’HTML et d’XML en l’intégrant à la racine de votre site internet et en le soumettant à Google grâce à sa Console Search.