Les 7 critères GEO qui déterminent si une IA vous cite

Le score GEO Detekia n'est pas une boîte noire. Derrière chaque note de 0 à 100 se cachent 7 critères précis, mesurés automatiquement à partir de l'analyse de votre site. Comprendre comment chaque critère est évalué, pourquoi il compte, et comment l'améliorer. C'est l'objet de cet article.

Cette méthodologie est le fruit de plusieurs mois de recherche sur ce qui détermine réellement la citabilité d'un site par les LLM. Elle s'appuie sur les travaux académiques en GEO (notamment Aggarwal et al., 2023), les guidelines de Google pour l'E-E-A-T, et les observations empiriques faites sur des centaines d'audits.

→Comment interpréter votre score GEO global →

Vue d'ensemble des 7 critères

Les 7 critères sont regroupés en trois couches :

Couche technique (ce que les IA peuvent lire) : Citabilité, Accessibilité IA
Couche sémantique (ce que les IA comprennent) : Données structurées, Fraîcheur
Couche de confiance (ce que les IA valorisent) : Vérifiabilité, Autorité E-E-A-T, Neutralité éditoriale, Présence externe

Chaque critère est noté de 0 à 100. Le score global est une moyenne pondérée. Les pondérations reflètent l'impact empirique de chaque critère sur la probabilité d'être cité.

Les 7 critères en détail

#1CitabilitéPondération : 20%

Ce que c'est : La capacité des IA à extraire facilement des informations factuelles de votre contenu.

Comment c'est mesuré : Analyse de la structure du contenu, présence de titres clairs (H1, H2, H3), de listes à puces, de données chiffrées, de définitions explicites. On mesure la densité informationnelle et la clarté de l'organisation.

Pourquoi ça compte : Les LLM fonctionnent par extraction de patterns. Un texte dense et mal structuré sera paraphrasé de façon approximative ou ignoré. Un contenu avec des faits clairement présentés sera cité littéralement.

Comment améliorer :

Structurer le contenu avec des titres hiérarchiques (H2 pour les sections, H3 pour les sous-points)
Transformer les paragraphes denses en listes à puces quand c'est possible
Inclure des données chiffrées précises (pas "beaucoup" mais "72%")
Utiliser des encadrés récapitulatifs à la fin de chaque section

#2VérifiabilitéPondération : 15%

Ce que c'est : La mesure dans laquelle vos affirmations peuvent être vérifiées par l'IA ou ses utilisateurs.

Comment c'est mesuré : Présence de sources citées (liens externes vers des études, données officielles), de dates sur les informations, d'auteurs identifiés, de méthodologies expliquées. On vérifie aussi que les liens sortants pointent vers des sources reconnues.

Pourquoi ça compte : Les LLM sont entraînés à valoriser les informations vérifiables. Une affirmation sans source est perçue comme moins fiable qu'une affirmation sourçable. Citer des études, c'est augmenter la probabilité que l'IA reprenne votre formulation.

Comment améliorer :

Citer les études et rapports que vous mentionnez (lien + auteur + année)
Dater clairement vos contenus ("dernière mise à jour : mars 2026")
Mentionner les sources primaires pour les statistiques
Éviter les affirmations non sourcées ("les experts s'accordent à dire que...")

#3Autorité E-E-A-TPondération : 20%

Ce que c'est : L'Expérience, l'Expertise, l'Autorité et la Fiabilité (Trust) du site et de ses auteurs, le cadre de Google repris par les LLM.

Comment c'est mesuré : Présence d'une page "À propos" détaillée, biographies d'auteurs avec credentials, mentions de partenaires/clients/certifications, page de contact accessible, politique de confidentialité, liens entrants de qualité.

Pourquoi ça compte : Les IA citent des sources fiables. Un site sans auteur identifié, sans page "À propos", sans signaux de légitimité sera systématiquement sous-pondéré face à un concurrent qui en a.

Comment améliorer :

Créer une page "À propos" avec l'histoire de l'entreprise et les credentials
Ajouter des biographies d'auteurs sur chaque article (nom, poste, expertise)
Mentionner les partenaires, certifications ou clients reconnus
S'assurer que la page de contact et les CGU sont facilement accessibles

#4Accessibilité IAPondération : 15%

Ce que c'est : La capacité des robots des IA à accéder et lire votre site.

Comment c'est mesuré : Analyse du robots.txt pour les user-agents IA (GPTBot, OAI-SearchBot, ClaudeBot, PerplexityBot, Googlebot-Extended), présence éventuelle d'un llms.txt, vitesse de chargement, accessibilité des pages importantes.

Pourquoi ça compte : Un site qui bloque les bots IA dans son robots.txt sera simplement ignoré. Un site lent ou avec du contenu en JavaScript non rendu sera partiellement lu. C'est un prérequis absolu.

Comment améliorer :

Vérifier que GPTBot, ClaudeBot et PerplexityBot ne sont pas bloqués dans robots.txt
Créer un fichier llms.txt avec un résumé du site et les pages clés
S'assurer que le contenu important est dans le HTML rendu (pas uniquement en JS client-side)
Maintenir un sitemap XML à jour

→Guide technique complet : robots.txt et llms.txt pour les bots IA →

#5Données structuréesPondération : 15%

Ce que c'est : La présence et la qualité du balisage Schema.org en JSON-LD sur les pages clés.

Comment c'est mesuré : Détection et validation des schemas JSON-LD (Organization, WebSite, Article, FAQPage, Product, BreadcrumbList, LocalBusiness). On vérifie la présence, la complétude et la cohérence avec le contenu de la page.

Pourquoi ça compte : Les schemas JSON-LD sont conçus exactement pour que les machines comprennent le contenu sans ambiguïté. Un schema FAQPage bien rempli sera extrait directement par les LLM pour répondre aux questions des utilisateurs.

Comment améliorer :

Ajouter Organization sur la homepage
Ajouter Article sur chaque article de blog
Ajouter FAQPage sur les pages qui contiennent des questions/réponses
Valider avec l'outil de test de Google Rich Results

→Schema.org et IA : les 5 schemas prioritaires pour le GEO →

#6Neutralité éditorialePondération : 10%

Ce que c'est : La capacité de votre contenu à informer objectivement, sans sur-promotion commerciale.

Comment c'est mesuré : Analyse du langage, densité de superlatifs ("meilleur", "révolutionnaire", "incroyable"), présence d'arguments pour/contre, mentions honnêtes des limites du produit/service, ton informatif vs persuasif.

Pourquoi ça compte : Les IA évitent de citer du contenu perçu comme du marketing. Elles privilégient les sources qui ressemblent à des encyclopédies ou des guides experts. Un article qui présente des nuances et reconnaît des limites est plus crédible qu'un article uniquement positif.

Comment améliorer :

Remplacer les superlatifs par des faits mesurables
Inclure des sections "limites" ou "à qui ce produit/service ne convient pas"
Présenter les alternatives existantes quand c'est pertinent
Éviter les formulations comme "la meilleure solution du marché"

#7Présence externePondération : 10%

Ce que c'est : Les mentions et citations de votre marque/site sur d'autres plateformes.

Comment c'est mesuré : Détection de backlinks de qualité, mentions sur des plateformes tierces (LinkedIn, forums spécialisés, publications sectorielles), présence sur Wikipedia ou des annuaires reconnus, citations dans d'autres articles.

Pourquoi ça compte : Les LLM ont été entraînés sur un corpus Web large. Si votre marque est mentionnée dans de nombreuses sources indépendantes, l'IA la connaît et lui fait confiance. La présence externe est un proxy de la notoriété perçue.

Comment améliorer :

Publier des études ou données originales qui seront citées par d'autres
Contribuer à des publications sectorielles (articles invités, interviews)
Être présent sur les annuaires pertinents de votre secteur
Encourager les témoignages et avis sur des plateformes tierces

#8FraîcheurPondération : 5%

Ce que c'est : La récence et la régularité de mise à jour du contenu.

Comment c'est mesuré : Date de publication et de modification des pages, fréquence de publication de nouveaux contenus, présence de la date dans le balisage Schema.org et dans le HTML visible.

Pourquoi ça compte : Les IA préfèrent les informations récentes pour les sujets évolutifs. Un article de 2021 sur les IA sera moins cité qu'un article de 2026, même si le contenu est similaire. La fraîcheur a moins d'importance pour les sujets stables (mathématiques, histoire) que pour les sujets technologiques.

Comment améliorer :

Mettre à jour les articles existants régulièrement (et l'indiquer avec une date de mise à jour)
Publier de nouveaux contenus au moins une fois par mois
Inclure la date dans le schema Article (datePublished + dateModified)
Mentionner l'année dans les titres pour les sujets actualisables

Comment les critères s'additionnent

Le score global est une moyenne pondérée. Mais il y a une subtilité importante : les critères techniques (Citabilité, Accessibilité IA) agissent comme des prérequis. Un site bloquant les bots IA dans son robots.txt aura un score Accessibilité IA de 0, ce qui plafonne mécaniquement son score global, peu importe la qualité de son contenu.

L'ordre d'optimisation recommandé :

Débloquer les bots IA (Accessibilité IA) : prérequis absolu
Structurer le contenu (Citabilité) : impact immédiat le plus fort
Ajouter les schemas prioritaires (Données structurées) : quick win technique
Renforcer l'autorité (E-E-A-T) : investissement moyen terme
Sourcer les affirmations (Vérifiabilité) : amélioration continue
Ajuster le ton (Neutralité) : relecture et reformulation
Développer la présence externe : travail de fond
Maintenir la fraîcheur : discipline éditoriale

Ce que le score ne mesure pas

Le score GEO Detekia mesure la citabilité potentielle. Il ne mesure pas :

Si vous êtes déjà cité : pour ça, il faut tester directement dans ChatGPT, Perplexity, etc.
La qualité du fond : un article factuellement faux mais bien structuré peut avoir un bon score technique
Le volume des sujets couverts : un site avec un seul article excellent vs un site avec 50 articles moyens
La popularité de la requête : être citable sur un sujet que personne ne recherche n'apporte pas de trafic

C'est pourquoi le score GEO s'interprète comme un potentiel de citabilité, pas comme une garantie. La stratégie complète combine l'optimisation technique (score GEO) avec la stratégie éditoriale (sujets à couvrir) et la distribution (présence externe).

→Analysez votre score GEO gratuitement →

Questions fréquentes sur la méthodologie

Le score GEO est-il valable pour tous les types de sites ?

La méthodologie a été conçue pour les sites B2B et B2C avec du contenu éditorial (blogs, guides, fiches produits). Elle est moins pertinente pour les applications web pures (SaaS sans contenu public) ou les sites très techniques sans audience grand public.

À quelle fréquence faut-il réévaluer son score ?

Après chaque optimisation significative (refonte technique, nouveaux articles, mise à jour de schemas), et au minimum une fois par trimestre. Les algorithmes des LLM évoluent, et ce qui est optimal aujourd'hui peut changer.

Le score GEO remplace-t-il le score SEO ?

Non, les deux scores mesurent des choses complémentaires. Un bon score SEO (autorité de domaine, backlinks, positions sur Google) contribue au score GEO (présence externe, vérifiabilité). Mais des pages très bien positionnées sur Google peuvent avoir un mauvais score GEO si le contenu n'est pas extractible par les IA.

→SEO vs GEO : les différences clés et comment les combiner →

Votre site est-il visible pour les IA ? Testez gratuitement.

Tester mon site gratuitement →

Vue d'ensemble des 7 critères

Les 7 critères en détail

Comment les critères s'additionnent

Ce que le score ne mesure pas

Questions fréquentes sur la méthodologie

Le score GEO est-il valable pour tous les types de sites ?

À quelle fréquence faut-il réévaluer son score ?

Le score GEO remplace-t-il le score SEO ?

Testez votre score GEO gratuitement