Schema.org
Définition
Vocabulaire de balisage sémantique qui aide Google à comprendre le contenu d'une page (article, produit, FAQ, événement). Active les Rich Results dans la SERP.
Ce qu'est Schema.org
Schema.org est un vocabulaire standard de balisage sémantique co-fondé en 2011 par Google, Microsoft, Yahoo et Yandex pour décrire le contenu d'une page de façon compréhensible par les moteurs de recherche. Le vocabulaire couvre des centaines de types : Article, Produit, Recette, FAQ, Événement, Entreprise locale, Personne, Vidéo, Cours, Film, Livre, etc. Chaque type a un ensemble de propriétés normalisées (nom, description, image, date, prix, auteur, note moyenne) avec des contraintes de format. C'est devenu le standard de fait pour communiquer aux moteurs ce qu'une page contient au-delà du HTML brut.
Pourquoi l'utiliser
Le balisage Schema.org active les Rich Results dans la SERP Google : étoiles d'avis sous un produit, FAQ déroulante en accordéon, prix et stock, image de recette avec temps de préparation, fil d'Ariane visuel, dates d'événements, vidéo en aperçu. Ces enrichissements augmentent significativement le taux de clic, parfois de 30 à 60% sur les requêtes commerciales. Au-delà de la SERP classique, Schema.org alimente aussi les assistants vocaux, les knowledge panels, et de plus en plus les réponses générées par les IA de recherche (Google AI Overviews, ChatGPT Search, Perplexity). C'est devenu une brique critique du SEO moderne.
Les types les plus utiles
Pour un site éditorial : Article, BlogPosting, NewsArticle. Pour un e-commerce : Product avec ses Offer, AggregateRating, Review. Pour un site local : LocalBusiness avec address, openingHours, geo. Pour un site événementiel : Event avec startDate, location, offers. Pour un site Q&R : FAQPage avec Question et Answer (attention, Google a réduit l'affichage FAQ depuis 2023, à utiliser avec parcimonie). Pour un blog technique : HowTo, SoftwareApplication. Pour la navigation : BreadcrumbList et Organization sur la home. On ne balise pas tout : on cible les types qui apportent un Rich Result réellement utile au taux de clic.
Comment l'intégrer
Trois formats coexistent : JSON-LD (recommandé par Google), Microdata (attributs HTML imbriqués), RDFa (attributs HTML avec préfixes). JSON-LD est le standard moderne : un bloc script type application/ld+json dans le head ou le body, complètement séparé du markup visible. Côté Next.js, on génère le JSON-LD dans un Server Component à partir des données de la page, on le sérialise et on l'injecte avec dangerouslySetInnerHTML. C'est plus simple à maintenir que les microdonnées HTML, et ça permet de couvrir plusieurs types par page sans alourdir le markup.
Valider et tester
Google fournit deux outils gratuits : le Rich Results Test (validator.schema.org pour les types Rich Results) et le Schema Markup Validator pour la validation générique du JSON-LD. On les utilise systématiquement à chaque ajout ou modification. Search Console reporte ensuite les erreurs détectées sur le terrain dans le rapport "Améliorations" : champs manquants, types incorrects, valeurs invalides. Un balisage qui valide en local peut échouer en production si les données injectées contiennent des caractères mal échappés ou des valeurs nulles non gérées. La validation continue évite ce piège.
Les pièges classiques
Premier piège : baliser du contenu absent de la page visible. Google pénalise les balisages trompeurs (prix affiché dans le JSON-LD mais introuvable dans le HTML, par exemple). Deuxième piège : les types incompatibles imbriqués, qui invalident tout le balisage. Troisième piège : oublier les champs obligatoires (price et priceCurrency sur un Offer, par exemple) qui désactivent silencieusement le Rich Result. Quatrième piège : laisser un balisage obsolète après un changement de contenu. On automatise la génération depuis la source de vérité (CMS, base) plutôt que de gérer un balisage à la main.
Au-delà du SEO classique
Avec la montée des LLM en moteur de recherche (Google AI Overviews, Bing Copilot, Perplexity, ChatGPT Search), Schema.org devient encore plus stratégique. Ces modèles utilisent les balisages structurés pour comprendre rapidement le contenu d'une page sans avoir à parser le HTML brut. Une page bien balisée est plus susceptible d'être citée ou recommandée par un LLM. C'est l'un des leviers de la stratégie GEO (Generative Engine Optimization) qui se développe à partir de 2025 : préparer son site pour être lu correctement par les IA, en plus des moteurs classiques.