Retour au blog

Hiérarchie des titres : comment votre structure H1/H2/H3 détermine si les LLM peuvent vous lire

Geovise

La plupart des équipes marketing B2B traitent la structure des titres comme un détail de mise en forme. On choisit les niveaux de titres pour l'esthétique, pour aérer le texte, ou parce que le template CMS le suggère. Cette approche a un coût direct sur la visibilité dans les réponses générées par l'IA.

Quand un grand modèle de langage traite une page web, il ne la lit pas comme un humain. Il parse le document, le segmente en fragments distincts, puis évalue chaque fragment selon sa pertinence et sa fiabilité. La structure de titres que vous choisissez est le principal cadre qui détermine comment ces fragments sont formés, quel contexte chacun transporte, et si votre marque remonte lorsqu'un prospect pose une question à une IA dans votre domaine.

Pourquoi la hiérarchie des titres est un signal GEO, pas seulement un choix de mise en page

La hiérarchie des titres désigne l'organisation logique et imbriquée des balises H1, H2 et H3 sur une page web. En GEO, c'est un signal structurel qui indique aux LLM comment le contenu est organisé, où un sujet se termine et un autre commence, et quelles idées sont subordonnées à d'autres.

Les LLM utilisés dans les produits de recherche IA (comme le mode navigation web de ChatGPT, Gemini ou Perplexity) s'appuient sur des pipelines de récupération qui analysent le HTML avant de générer une réponse. Une structure de titres désorganisée oblige le modèle à deviner les limites du contenu. Une structure bien pensée rend chaque section autonome et directement extractible.

Le mécanisme sous-jacent est simple : le découpage en chunks. Les systèmes de génération augmentée par récupération (RAG) fractionnent les pages en fragments avant de les indexer. Les balises de titre sont parmi les délimiteurs les plus fiables disponibles. Quand un H2 nomme clairement un concept et que les paragraphes qui suivent ne développent que ce concept, le fragment résultant est cohérent, contextuellement complet, et bien plus susceptible d'être récupéré comme réponse pertinente.

Les trois erreurs structurelles qui tuent la lisibilité par les LLM

1. Sauter des niveaux de titre

Passer directement d'un H1 à un H3, ou utiliser H2 et H3 de manière interchangeable, brise la hiérarchie implicite dont dépendent les systèmes de parsing. Un système de récupération qui lit votre page déduit les relations thématiques à partir de la profondeur d'imbrication. Quand cette imbrication est incohérente, le modèle aplatit la structure (perdant la granularité) ou interprète mal les relations parent-enfant (introduisant du bruit dans le contexte du chunk).

La correction est mécanique : chaque H3 doit se trouver sous un H2, chaque H2 sous un seul H1. Le H1 est la thèse de la page. Les H2 sont les arguments ou sections principaux. Les H3 sont les sous-points de chaque H2.

2. Des titres vagues ou non descriptifs

Des titres comme "En savoir plus", "Notre approche" ou "Détails" sont invisibles pour les LLM. Ils ne fournissent aucun signal sur le contenu de la section, ce qui signifie que le chunk formé autour d'eux ne transporte aucun concept récupérable.

Pour les besoins du GEO, chaque titre doit fonctionner comme un label autonome : une formulation suffisamment spécifique pour qu'un système de récupération puisse la faire correspondre à une requête, même sans lire le corps du texte environnant. Comparez :

  • • Faible : "Notre solution"
  • • Fort : "Comment [Produit] réduit le temps d'intégration des équipes grands comptes"

La seconde version encode le sujet (intégration), le public cible (équipes grands comptes) et le résultat attendu (réduction du temps) directement dans le titre. Cette information voyage avec le chunk.

3. Un seul titre couvrant plusieurs sujets

Une page avec un seul H2 couvrant trois sujets distincts oblige le système de récupération à traiter les trois comme un seul fragment. Le modèle ne peut pas isoler la partie la plus pertinente ; il récupère l'ensemble ou rien. Des titres granulaires produisent des chunks granulaires, qui produisent des récupérations plus précises.

Comment les LLM utilisent le contexte des titres pour générer des réponses

Au-delà du découpage au moment de l'indexation, la structure des titres influence aussi directement la génération de réponses. Lorsqu'un modèle lit une page pendant l'inférence (plutôt que via un pipeline de récupération pré-indexé), il utilise les titres comme repères de navigation pour localiser rapidement le passage le plus pertinent.

Une page avec des H2 clairs et descriptifs fonctionne comme un document bien indexé : le modèle peut accéder directement à la section pertinente plutôt que de traiter l'intégralité de la page pour extraire un seul fait. C'est particulièrement important pour les pages B2B longues, comme les pages produits, les pages de solutions ou les guides détaillés, où l'information pertinente peut se trouver plusieurs paragraphes plus bas.

Les recherches sur les patterns d'attention des LLM dans les documents longs montrent de manière constante que la prominence positionnelle compte : le contenu introduit sous une section étiquetée tôt et clairement est extrait de façon bien plus fiable que le contenu équivalent enfoui au milieu de la page sous un titre vague. L'implication pour le GEO est directe : placez votre contenu le plus citable sous les titres les plus descriptifs, aussi tôt que la structure du document le permet.

Construire une structure de titres adaptée aux LLM

Aligner les titres sur les patterns de requête

La technique la plus efficace consiste à rédiger des titres qui reflètent la formulation des questions que votre audience cible pose aux modèles d'IA. Si vos acheteurs demandent "quel est le meilleur outil [catégorie] pour [cas d'usage]", vos H2 et H3 devraient inclure ce vocabulaire.

Ce n'est pas du bourrage de mots-clés. C'est de l'alignement sémantique : s'assurer que les chunks produits à partir de votre page contiennent le même vocabulaire conceptuel que les requêtes auxquelles ils sont censés répondre. Un alignement sémantique au niveau des titres améliore significativement la probabilité qu'un système de récupération remonte votre contenu pour la bonne requête.

Un concept par section

Chaque section H2 doit être thématiquement atomique : un concept, une section. Si vous vous retrouvez à rédiger un H2 qui nécessite une phrase de transition comme "Par ailleurs" ou "En revanche", c'est souvent le signe que deux sections distinctes ont été fusionnées en une. Séparez-les.

Des sections atomiques produisent des chunks cohérents. Des chunks cohérents sont récupérés avec une plus grande précision. Une récupération plus précise signifie que la proposition de valeur spécifique de votre marque atteint le contexte de génération du LLM intacte, plutôt que diluée par du matériel non pertinent.

Utiliser des structures parallèles entre les H2

Des structures de titres parallèles aident les systèmes de récupération à reconnaître qu'un ensemble de sections H2 forme un cadre cohérent. Par exemple, une page produit dont les H2 suivent le modèle "[Résultat] pour [Public]" sur chaque section signale une ressource systématique et bien organisée, ce que les LLM associent à un contenu d'autorité.

Le parallélisme améliore aussi la capacité du modèle à comparer et contraster les sections, une capacité utile quand un utilisateur demande à une IA de résumer ou de classer des options dans une catégorie.

Garder les titres concis mais spécifiques

Visez des titres entre six et douze mots. Des titres plus courts risquent d'être trop vagues ; des titres plus longs risquent de devenir des phrases, ce qui réduit leur rapport signal/bruit comme labels de section. L'objectif est la spécificité sans verbosité : assez de détail pour qu'un système de récupération associe le titre à une requête, sans que le texte soit si long que le titre perde sa fonction structurelle.

L'audit de la hiérarchie des titres : ce qu'il faut vérifier

Avant d'optimiser, auditez votre situation actuelle. Pour chaque page clé (page d'accueil, pages produits, pages de solutions, articles de blog à fort trafic), vérifiez :

  • Un seul H1 par page : un seul H1, contenant le concept principal de la page
  • Aucun niveau sauté : le H2 précède toujours le H3 ; un H3 n'apparaît jamais sans H2 parent
  • Titres descriptifs : chaque titre fonctionne comme un label de sujet autonome
  • Atomicité des sections : aucune section H2 ne couvre plus d'un concept distinct
  • Alignement sur les requêtes : le vocabulaire des titres correspond au langage qu'utilisent vos acheteurs avec les modèles d'IA

Si une page échoue à plus de deux de ces vérifications, la qualité de ses chunks est probablement trop faible pour concurrencer dans les citations LLM de votre secteur.

Geovise intègre un critère Hiérarchie des titres dédié dans son audit de site, qui note vos pages de 0 à 10 sur ces exigences structurelles et fournit une explication personnalisée indiquant précisément où votre structure présente des lacunes, accompagnée de réécritures concrètes pour les sections sous-performantes.

Structure des titres et le reste de votre stratégie GEO

La hiérarchie des titres ne fonctionne pas en isolation. Elle amplifie ou fragilise chaque autre signal GEO de la page.

Une forte clarté d'entité bénéficie de titres descriptifs qui ancrent les mentions de marque dans des sections clairement délimitées. Les snippets de définition sont bien plus récupérables quand ils se trouvent sous un titre qui annonce le concept défini. Les données structurées appliquées à une page avec une mauvaise hiérarchie de titres, c'est comme attacher des métadonnées à un document que personne ne peut naviguer : techniquement présent, pratiquement invisible.

Considérez la hiérarchie des titres comme le tissu conjonctif de votre stratégie GEO. La clarté d'entité, le potentiel de citation, la profondeur thématique et les données structurées fonctionnent tous mieux sur une page dont la structure de titres est solide. Sans cette fondation, vos autres efforts d'optimisation produisent des rendements décroissants.

De la structure à la visibilité

Le GEO est une discipline à l'intersection de la précision technique et de la stratégie de contenu. La hiérarchie des titres se trouve exactement à cette intersection : c'est simultanément une décision d'écriture HTML, un choix d'organisation du contenu, et un paramètre d'ingénierie de récupération.

Les entreprises B2B qui traitent leur structure de titres comme un actif GEO, en l'auditant systématiquement et en l'alignant sur le langage qu'utilisent leurs acheteurs avec les modèles d'IA, créent des pages que les LLM peuvent parser proprement, découper de façon cohérente, et récupérer avec confiance. Cette lisibilité structurelle est ce qui distingue les marques qui apparaissent régulièrement dans les réponses générées par l'IA de celles qui n'y figurent pas.