À quoi sert plan de site XML (sitemap.xml)?

référencement SEO

À quoi sert plan de site XML (sitemap.xml)?

Olivier
18 min read

Un plan de site XML est un élément essentiel à l’indexation du contenu d’un site web par Google et les autres moteurs de recherche.

Il demeure toutefois un outil méconnu et souvent mal compris, œuvrant dans l’ombre du référencement SEO qui monopolise l’attention.

Pour apparaître dans les résultats des moteurs de recherche, un contenu ne peut toutefois pas se contenter d’être bien optimisé pour le SEO. Il doit surtout avoir déjà été visité et indexé par les bots de Google, Bing et compagnie.

C’est justement là qu’entre en jeu le plan de site XML. Mais comment cela fonctionne-il exactement? Quel est le rôle du sitemap, et quel est l’impact de ne pas en avoir? Voilà certaines des questions auxquelles nous tenterons de répondre dans cet article.

Qu’est-ce qu’un sitemap XML ?

Un sitemap XML sert de répertoire pour les moteurs de recherche. Il représente en quelque sorte un registre du contenu du site, et des liens entre les divers éléments.

Certains plans de site sont destinés à aider les visiteurs à naviguer sur un site web. Les sitemaps XML, pour leur part, aident les moteurs de recherche à comprendre la structure et le contenu du site.

Quand vous ajoutez une nouvelle page ou publication, ou modifiez votre contenu existant, vous avez besoin que Google trouve et indexe ce contenu le plus rapidement possible.

En l’ajoutant au plan, vous indiquer aux bots des moteurs de recherche qu’ils doivent visiter ce nouveau contenu. Il sera alors ajouté à la liste de résultats potentiels que Google peut proposé aux internautes effectuant des recherches.

Qu’est-ce qu’un sitemap?

Votre sitemap XML permet de transmettre à Google quatre informations importantes à propos de chaque page de votre site.

1. Emplacement (loc)

Le premier élément que précise un sitemap est l’emplacement des divers contenus. Il s’agit de l’URL des pages et publications, ou des répertoires dans lesquels se trouvent les fichiers.

L’emplacement doit être l’adresse URL complète, telle que celle dans l’exemple ci-dessus, associée au logo d’Ex2:

<loc>https://www.ex2.com/assets/img/logo-blue.svg</loc>

Chaque contenu à indexer doit ainsi avoir sa propre entrée d’emplacement pour être analysé par les robots des moteurs de recherche.

2. Date de la dernière modification (lastmod)

La seconde information incluse dans les entrées du plan de site est un horodatage indiquant à quel moment le contenu a été mis à jour.

L’équipe Bing de Microsoft souligne que l’inclusion de l’étiquette lastmod est « cruciale » pour une exploration efficace. Pour sa part, Google recherche spécifiquement les mises à jour significatives sur une base régulière.

Selon sa documentation, « Google utilise la valeur si elle est cohérente et vérifiable (par exemple, en comparant à la dernière modification de la page) précise ».

<lastmod>2024-12-30T14:30:00+00:00</lastmod>

Google explique également comment afficher les dates de modification pour les mises à jour de page :

« La valeur doit refléter la date et l’heure de la dernière mise à jour importante de la page. Par exemple, une mise à jour du contenu principal, des données structurées ou des liens sur la page est généralement considérée comme importante; toutefois, une mise à jour de la date de copyright ne l’est pas. »

3. Fréquence des changements (changefreq)

La valeur suivante des entrées d’un sitemap est la fréquence à laquelle le contenu est mis à jour. Cette entrée indique aux moteurs de recherche à quel moment ils doivent revisiter la page.

Il existe plusieurs valeurs de fréquence pouvant être utilisées. Les plus courant incluent notamment :

  • La page d’accueil du site : « tous les jours » ou « toujours » (“daily” ou “always”)
  • Les pages de produits et autres pages fréquemment mises à jour : « hebdomadaire » (“weekly”)
  • Les articles de blog : « mensuellement » (“monthly”)
  • Les pages secondaires (À propos, Contact, Conditions d’utilisation, etc.) sur : « annuel » (“yearly”)
  • Pages diverses (comme les messages d’erreurs): « jamais » (“never”)
<changefreq>weekly</changefreq>

4. Priorité (priority)

La dernier élément à inclure dans un plan de site XML est l’importance relative de chaque contenu par rapport aux autres pages.

En d’autres mots, vous définissez un ordre hiérarchique d’importance entre toutes les pages du site web. La valeur de chaque URL peut varier de 0 à 1.

Voici quelques exemples courant d’utilisation de chaque valeur de priorité :

  • Page d’accueil : 1.0
  • Pages principales d’une catégorie : 0.8
  • Pages des produits : 0.6
  • Articles de blog : 0.4
  • Pages d’archive : 0.2
<priority>0.8</priority>

Notez qu’il est possible de définir des priorités personnalisées et variables pour vos divers contenus. Par exemple, certains vos articles peuvent utiliser une valeur de 0.5, et alors que d’autres ont 0.4 et/ou 0.3.

Il est notamment courant d’utiliser des valeurs légèrement différentes pour les pages secondaires. Par exemple, la page de contact peut être définie à 0.8, et celle des conditions d’utilisation à 0.5.

Votre site web a-t-il besoin d’un sitemap XML ?

Certains sites incontournables comme Wikipédia pourraient presque se passer d’un plan de site. Leur autorité est telle, et le trafic qu’ils attirent si important, que Google indexeraient inévitablement leurs contenus les plus populaires malgré tout.

Très peu de sites web se trouvent toutefois dans une situation aussi hégémonique et enviable. Pour la vaste majorité des sites web, il est donc fortement recommandé de créer un plan de site XML.

En fait, il est essentiel pour un site d’avoir un sitemap s’il rempli l’une des conditions suivantes :

  • Il couvre une multitude d’URL 
  • Le site contient une archive assez vaste 
  • Le site est récent et compte un faible nombre de liens entrants 
  • Il est riche en contenu multimédia (images, vidéos, etc.)

Comme vous pouvez vous en douter, la majorité des sites web cochent au moins l’une de ces cases. Un plan de site est donc bénéfique pour la plupart d’entre eux.

Un bon maillage interne peut-il remplacer un plan de site XML?

D’après la documentation de Google, un bon maillage interne devrait suffire à permet aux robots d’exploration de trouver votre contenu naturellement. C’est effectivement possible, si votre contenu est très bien interrelié.

En réalité, la plupart des sites web n’ont toutefois pas une structure de liens interne parfaite. Certains contenus peuvent alors échapper à l’indexation, ou les contenus peuvent se voir attribuer une hiérarchie différente de celle que vous souhaitez.

C’est pourquoi les sites web modernes bénéficient d’un plan de site XML. Un sitemap permet de fournir aux moteurs de recherche tous les détails possibles pour les aider à trouver et répertorier votre contenu.

Il ne permet pas seulement aux bots de découvrir vos pages. Il rend l’ensemble du processus d’exploration plus efficace, et améliore la qualité des résultats de recherche.

Le plan de site permet de préciser lesquels de vos contenus ont le plus de valeur, et devraient être mis de l’avant dans les résultats de recherche.

Quelles pages ajouter au plan de site XML ?

Un plan de site divise votre site web selon deux types de pages. Cette division permet de donner des indications claires aux robots d’exploration de Google, Bing et compagnie.

Tout d’abord, il définit les pages de destination conçues pour accueillir des visiteurs. Celles-ci sont marquées comme devant être indexées et répertoriées par les bots des moteurs de recherche.

On trouve ensuite un second type de pages appelées « utilitaires ». Celles-ci sont nécessaires au bon fonctionnement du site, mais ne sont pas destinées à être incluse dans la navigation normale du site (comme les messages d’erreur). Elle sont donc définies comme devant être exclue de l’indexation.

1. Pages de destination à chercher

Les utilisateurs devraient trouver les pages suivantes par la recherche :

  • Pages de produits
  • Liste des catégories
  • Articles de blogue
  • Descriptions de service
  • Pages d’information clé

2. Pages utilitaires à ignorer

Un certain nombre de pages de tout site web ne sont pas destinées à accueillir directement des visiteurs. Certaines pages remplissent des fonctions spécifiques, rendant préférable qu’elle n’apparaissent pas dans la recherche :

  • Sections administratives du site web (tableau de bord, répertoires de plugins, etc.)
  • Page de connexion
  • Pages de confirmation de commande
  • Formulaires de réinitialisation du mot de passe
  • Pages de remerciement

Il en va de même pour certaines pages liées à des tunnels de vente. Par exemple, la page « Caisse » sur laquelle les internautes font le paiement. Il est souvent souhaitable que les visiteurs passent d’abord par la page de produits et le panier d’achat pour y arriver.

Votre plan de site XML ne doit inclure que les pages de destination. Inclure des pages utilitaires dilue la qualité perçue de votre site, ce qui nuit à votre réputation auprès des moteurs de recherche. Les classements de votre site dans les résultats peut alors en souffrir.

Comment créer un plan de site XML ?

Vous avez plusieurs options pour créer des sitemaps XML. Vous pouvez bien sûr les créer manuellement, mais il existe aussi des solutions automatisées.

Dans le cadre de cet article, nous commencerons par les approches les plus simples, avant d’aborder les méthodes plus avancées.

Création manuelle d’un sitemap

La création manuelle d’un plan de site XML demande d’ajouter une entrée complète pour chaque URL d’un site web. Cela peut donc s’avérer une tâche très laborieuse, si votre site est vaste ou complexe.

Pour un petit site statique, vous pouvez toutefois créer manuellement votre sitemap XML. Il vous suffit d’utiliser n’importe quel éditeur de texte et de créer un nouveau fichier nommé « sitemap.xml ». Ouvrez ensuite le fichier pour y ajouter cette structure de base :

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <url>
      <loc>https://www.votredomaine.com</loc>
      <lastmod>2024-12-30</lastmod>
   </url>
</urlset>

Il vous faut ensuite ajouter un nouveau bloc pour chaque page que vous souhaitez inclure. Chaque bloc doit minimalement inclure les attributs « location » et « date de dernière modification ».

Cette approche fonctionne assez bien pour les petits sites statiques. Elle devient toutefois de moins en moins pratique à mesure que votre site web se développe.

Solutions automatisées pour créer un plan de site XML sur WordPress

Si vous gérez un site WordPress, vous avez accès à une multitude d’outils SEO puissants. Plusieurs d’entre eux se chargent pour vous de créer et mettre à jour régulièrement un plan de XML.

Il vous suffit donc de choisir et installer un plugin, pour qu’il se charge de tout à votre place. Les extensions ont toutefois des efficacités et des facilités d’utilisation très variables.

C’est pourquoi nous avons sélectionné quelques outils performants et simples à maitriser, pour vous aider à créer votre plan de site XML.

  • Yoast SEO : Le choix le plus populaire pour la génération d’un plan de site XML pour WordPress. Dès l’installation du plugin, votre sitemap est généré automatiquement à « votredomaine.com/sitemap_index.xml. » Vous pouvez alors contrôler les types de contenu qui apparaissent dans ce plan via les paramètres du plugin.
  • All in One SEO : offre des fonctionnalités de plan du site complètes. Cela comprend le support de divers types de messages personnalisés et le calcul automatique de la priorité en fonction de l’âge des entrées et du type de contenu. Vous pourrez alors accédez à votre plan du site à l’adresse « votredomaine.com/sitemap.xml. »
  • Rank Math : offre des fonctionnalités similaires à Yoast. Il inclut toutefois des fonctions supplémentaires comme des plans de site pour la section Actualités de Google et les vidéos. Comme pour AIO SEO, votre plan du site XML sera disponible à « votredomaine.com/sitemap.xml. »
  • Noyau WordPress : Depuis la version 5.5, WordPress inclut des fonctionnalités de base de pour créer des plans de sites XML. Les utilisateurs priorisant le référencement SEO préfèrent utiliser des plugins dédiés offrant plus de contrôle et des fonctionnalités supplémentaires.

Solutions pour les sites non WordPress

Si vous avez utilisé une autre plateforme pour créer votre site web, il est fort probable qu’elle dispose d’une solution intégrée pour la création d’un plan de site XML.

Les solutions SaaS comme Shopify ou Wix se chargent de créer un plan de site pour vous. Cette approche est idéale pour les novices, ou les développeurs ayant peu de temps à consacrer à la configuration. Elles ne vous offrent toutefois très peu de contrôle sur ce que les plans contiennent.

Si vous n’utilisez pas de plateforme (CMS) et que vous avez construit un site entièrement personnalisé, le processus est un peu plus complexe.

Vous devrez alors compter sur un générateur externe de plans de site. Il faudra ensuite télécharger le sitemap généré automatiquement sur votre serveur web, et répéter ce procédé à intervalles réguliers.

Voici quelques bons générateurs de sitemaps :

  • XML-Sitemaps.com : Il vous suffit de télécharger la structure de votre site ou laissez l’outil explorer votre site pour générer un plan du site XML.
  • Screaming Frog : Explore votre site web et crée un sitemap basé sur les critères que vous avez spécifié.
  • Sitebulb Website Crawler : Rationalise la création de plans de sites XML en incluant des informations collectées lors de l’analyse pour optimiser la structure du site.

Comment soumettre votre plan de site XML à Google?

La création de votre plan du site XML n’est que la première étape du processus. Vous devez ensuite vous assurer que Google et les autres moteurs de recherche savent où le trouver.

Google trouvera sans doute éventuellement votre sitemap via le fichier robots.txt. Le soumettre directement via la Google Search Console accélère cependant considérablement le processus.

Avant de soumettre votre sitemap

Tout d’abord, assurez-vous que votre plan de site XML fonctionne comme il devrait. Soumettre un plan cassé à Google ne serait qu’une perte de temps.

Entrez simplement l’URL « votredomaine.com/sitemap.xml » dans la barre d’adresse votre navigateur. Si tout fonctionne, vous devriez alors voir un fichier XML correctement formaté, et non une page d’erreur.

Important : Si vous voyez du texte brouillé, ne vous inquiétez pas. C’est normal. Les fichiers XML sont conçus pour être lu par des bots, et non par des humains. Ils ont donc souvent l’air confus et surchargés quand ils s’affichent dans les navigateurs. L’important est que vous puissiez voir vos URL répertoriées.

Soumettre par l’intermédiaire de Google Search Console

  • Connectez-vous à la console de recherche Google.
  • Sélectionnez la section propriétaire de votre site web.
  • Dans la section Index de la barre latérale gauche, sélectionnez l’option Sitemaps.
  • Entrez l’URL de votre plan du site dans le champ « Ajouter un nouveau plan du site » et cliquez sur SOUMETTRE.

Votre plan du site XML est généralement accessible via « https://votredomaine.com/sitemap.xml » ou encore sous la variante « /sitemap_index.xml ».

Quand vous soumettez via la console, Google vérifie immédiatement si votre plan contient des erreurs de base. Vous verrez alors l’un des messages suivants s’afficher comme résultat :

  • Succès : Google peut lire correctement votre sitemap.
  • Impossible de récupérer : Google n’a pas réussi à accéder à votre plan à l’URL indiquée.
  • Impossible de lire : Google a trouvé votre plan de site XML mais n’a pas pu le traiter.

Comprendre le rapport de Google sur le plan de site XML

Une fois la demande soumise, la console de recherche Google vous indiquera plusieurs informations sur votre domaine.

  • Le nombre d’URL vous avez soumis.
  • Combien d’URL Google a effectivement indexé.
  • Le moment où Google a lu votre sitemap pour la dernière fois

Important : Ne paniquez pas si le nombre d’URL indexées diffère des URL soumises. C’est tout à fait normal. Google n’indexe pas les pages automatiquement parce qu’elles apparaissent dans votre plan. Votre sitemap est une suggestion pour les bots des moteurs de recherche, pas une série d’ordres.

Plusieurs sitemaps

Pour les sites Web plus volumineux, vous pourriez avoir plusieurs sitemaps :

  • Plan de site uniquement pour les produits
  • Plan de site pour les articles de blog
  • Plan de site pour une catégorie (de produits ou d’articles)
  • Plan de site pour les images et/ou vidéos

Soumettez chacun de ces éléments séparément pour aider Google à mieux comprendre la structure de votre site. Cela peut ainsi éviter les problèmes de suivi de l’indexation.

Soumettre votre plan du site XML à Bing

Google domine bien sûr le paysage de la recherche web. Les experts du SEO savent qu’il est important de diversifier sa présence sur les moteurs de recherche.

En seconde place, Bing capte une part importante du trafic de recherche. C’est particulièrement vrai dans certaines régions et auprès de certains groupes démographiques.

De plus, les outils pour les webmasters de Microsoft fournissent souvent des informations uniques, que vous ne trouverez nulle part ailleurs.

Sur la console de Bing, quand vous cliquerez sur « Ajouter un nouveau site », vous aurez deux choix. Le premier est « Importer vos sites de GSC », et le second est « Ajouter votre site manuellement ».

Importation de sites web depuis la console de recherche Google

Il y a de bonnes raisons pour lesquelles nous avons commencé par vous présenter la Search Console de Google.

Bing offre un processus d’importation simplifié qui peut vous faire gagner du temps, si vous avez déjà effectuer l’indexation chez Google.

  • Allez à Bing Webmaster Tools.
  • Cliquez sur Importer à partir de la console de recherche Google.
  • Suivez les étapes d’authentification pour valider la propriété du domaine.
  • Les détails de votre site (y compris les sitemaps) sont ensuite transférés automatiquement!

Soumission du site et du plan de site XML

Si vous n’avez pas indexé votre site sur Google ou préférez le contrôle d’une exécution manuelle, le processus de soumission directe de Bing s’avère simple :

  • Accédez à Bing Webmaster Tools.
  • Choisissez Ajouter votre site manuellement.
  • Saisissez l’URL de votre site.
  • Vérifier la propriété par la méthode de votre choix :
    • Télécharger un fichier XML.
    • Ajouter une balise meta.
    • Ajouter un enregistrement CNAME.
  • Allez à Sitemaps dans la barre latérale gauche, puis cliquez sur Soumettre le plan du site.
  • Enfin, ajoutez votre plan de site XML complet et cliquez sur Soumettre.

Pour conclure sur le rôle d’un plan de site XML

Votre plan de site XML raconte une histoire sur l’organisation et les priorités de votre site web. Il convainc ainsi les moteur de recherche qu’il vaut la peine d’être exploré et indexé. C’est donc essentiel, si vous souhaitez améliorer vos classements dans les résultats de recherche.

Quand il est question d’entrées sur un sitemap, la qualité l’emporte sur la quantité. Un plan du site ciblé sur vos meilleures pages surpasse donc souvent un répertoire encombré de tout ce que vous possédez.

Google, Bing et les autres moteurs de recherche font toutefois leur propre sélection. Ils choisissent toujours eux-mêmes les contenus qu’ils choisissent d’indexer. Peu importe ce qu’indique votre plan, seul les contenus jugés suffisamment pertinents seront ajoutés aux répertoires.

Il vaut donc mieux utilisez un plan de site XML plus restreint. Ajoutez-y l’essentiel, et laissez ensuite les moteurs de recherche explorer le reste du contenu par eux-mêmes.

Nous espérons que cet article vous a plu et vous a éclairé sur l’utilité d’un plan de site XML. Si c’est le cas, nous vous invitons maintenant à consulter nos autres autres articles et tutoriels.

N’hésitez pas non plus à consulter notre base de connaissance. Vous y trouverez une foule d’articles détaillés pouvant répondre à toutes vos questions web.

Olivier

Olivier est un blogueur et développeur web expérimenté. Il créé et gère des sites WordPress depuis plus de 12 ans, et possède plus d'une décennie d'expérience en tant que rédacteur web.