Vizion Web
SEO & Performance

Sitemap

Définition

Fichier XML qui liste toutes les URL importantes d'un site pour aider les moteurs de recherche à les découvrir. Généré dynamiquement chez Vizion Web via la sitemap API Next.js.

Ce qu'est un sitemap

Un sitemap est un fichier XML qui liste les URL importantes d'un site web, accompagnées de métadonnées optionnelles : date de dernière modification, fréquence de mise à jour estimée, priorité relative. Il sert d'aide à l'indexation pour les moteurs de recherche : plutôt que de découvrir les pages uniquement par les liens internes (ce qui peut être lent ou incomplet), Google lit le sitemap et sait directement ce qui existe. Le format XML est standardisé depuis 2005 et accepté par tous les moteurs majeurs. Sur un site de quelques dizaines de pages, l'impact reste modeste. Sur un site de plusieurs milliers de pages, c'est indispensable.

À quoi ça sert vraiment

Le sitemap accélère l'indexation initiale d'un nouveau site et la prise en compte des pages ajoutées. Il aide à indexer des pages mal liées en interne (orphelines ou profondes). Il signale les mises à jour pour que Google revisite plus vite les pages modifiées. Sur les sites e-commerce avec des produits en rotation rapide, c'est critique pour que les nouvelles fiches soient indexées en quelques jours plutôt qu'en plusieurs semaines. Il n'améliore pas le ranking en soi : un sitemap propre rend l'indexation prévisible, mais n'augmente pas l'autorité d'une page. C'est une aide à la découverte, pas un boost SEO.

Génération côté Next.js

Next.js gère le sitemap nativement via une route sitemap.ts (App Router) ou sitemap.xml.ts (Pages Router). On exporte une fonction par défaut qui retourne un tableau d'objets { url, lastModified, changeFrequency, priority }. Next.js sérialise automatiquement en XML conforme. Sur un site dont les pages viennent d'une base ou d'un CMS, on interroge la source au build (SSG) ou à la demande (ISR) pour obtenir la liste à jour. Le sitemap reste donc synchronisé avec le contenu sans intervention manuelle. Pour un site qui change peu, on peut générer un sitemap statique. Pour un site qui change tous les jours, on revalide quotidiennement.

Sitemaps multiples et index

Les limites officielles d'un sitemap sont 50 000 URL et 50 Mo non compressés. Au-delà, on segmente en plusieurs sitemaps regroupés dans un sitemap index : un fichier qui liste les fichiers sitemap. Sur les très gros sites, on segmente par type de contenu (articles, produits, catégories, pages locales) pour faciliter le diagnostic dans Search Console. Cette segmentation permet de voir, par exemple, que les produits s'indexent bien mais que les articles ont un problème. Sans segmentation, le sitemap monolithique masque les variations entre types de contenu.

Référencer le sitemap

Le sitemap doit être référencé à deux endroits. Premier endroit : dans le robots.txt, avec une ligne Sitemap: https://votresite.com/sitemap.xml en bas du fichier. Tous les moteurs lisent le robots.txt et y trouvent le pointeur. Deuxième endroit : soumis manuellement dans Search Console (Google), Bing Webmaster Tools, et éventuellement Yandex et Baidu si vous ciblez ces marchés. La soumission manuelle ne remplace pas le robots.txt, elle s'ajoute. Search Console fournit ensuite un rapport détaillé : nombre d'URL soumises, nombre indexées, raisons d'exclusion. C'est l'outil de pilotage principal de l'indexation.

Les pièges classiques

Premier piège : inclure des URL qui retournent 404 ou redirigent ailleurs. Google détecte ces incohérences et perd confiance dans le sitemap. Deuxième piège : laisser dans le sitemap des pages bloquées par robots.txt ou noindex. C'est contradictoire et confus. Troisième piège : un sitemap qui ne se met pas à jour quand le contenu change, soit parce qu'il est statique et oublié, soit parce que la régénération est cassée silencieusement. Quatrième piège : un sitemap géré manuellement, qui dérive de la réalité au fil des publications. On automatise la génération depuis la source de vérité.

Au-delà du sitemap XML

Pour les sites avec des médias (images, vidéos) ou du contenu spécifique (actualités, applications), il existe des sitemaps spécialisés : image sitemap, video sitemap, news sitemap (pour Google News). Le format est une extension du XML standard avec des balises additionnelles. Pour un site international, on combine sitemap et hreflang pour signaler les variantes linguistiques. Pour un site avec authentification, les pages privées n'ont pas leur place dans le sitemap public, on ne liste que les pages publiquement crawlables. Ces nuances font la différence entre un site bien indexé et un site qui galère à se positionner.

Autres termes de la catégorie SEO & Performance