Vous voulez savoir si ChatGPT, Gemini ou Perplexity citent votre site — et si non, pourquoi. Un audit GEO répond à ces deux questions. Il évalue votre site sur les critères que les moteurs IA utilisent pour sélectionner leurs sources, identifie les blocages, et vous donne un plan d'action priorisé.
Cet article vous guide à travers un audit GEO complet, étape par étape, que vous pouvez réaliser vous-même ou accélérer avec un outil automatisé.
Ce qu'un audit GEO évalue (et ce qu'il n'évalue pas)
Un audit GEO n'est pas un audit SEO. Les deux se complètent mais ne mesurent pas les mêmes choses.
Ce qu'un audit GEO mesure :
- Votre contenu peut-il être extrait et cité par une IA ? (extractibilité)
- Les bots IA peuvent-ils accéder à votre site ? (crawlabilité)
- Votre site est-il compris par les machines ? (données structurées)
- Votre contenu est-il perçu comme fiable ? (vérifiabilité, autorité, neutralité)
- Existez-vous en dehors de votre propre site ? (présence externe)
- Votre contenu est-il à jour ? (fraîcheur)
Ce qu'un audit GEO ne mesure pas :
- Vos positions sur Google (c'est du SEO)
- Votre vitesse de chargement (c'est du SEO technique)
- Vos backlinks en détail (c'est du SEO off-page)
- Le nombre exact de fois où les IA vous citent (aucun outil ne peut le mesurer avec certitude)
L'audit GEO mesure votre potentiel de citation — les conditions techniques et éditoriales qui maximisent vos chances d'être sélectionné comme source par les IA.
→Les 8 critères GEO qui déterminent si une IA vous cite →
Étape 1 — Le test de citation (15 minutes)
Avant de plonger dans la technique, commencez par le test le plus concret : demandez directement aux IA si elles connaissent votre site.
Comment procéder
Ouvrez ChatGPT, Gemini et Perplexity. Pour chacun, posez 5 questions :
Questions de recommandation (votre marché) :
- "Quel est le meilleur [votre service/produit] en France ?"
- "Recommande-moi un [votre service/produit] pour [besoin spécifique de vos clients]"
Questions d'expertise (votre domaine) :
- "Comment choisir un bon [votre domaine] ?"
- "Quelle est la différence entre [A] et [B] dans [votre secteur] ?"
Question de marque (votre nom) :
- "Que fait [nom de votre entreprise] ?"
Comment analyser les résultats
Pour chaque réponse, notez dans un tableau :
- Cité ? — votre site ou votre marque apparaît dans la réponse (oui/non)
- Concurrents cités — quels noms apparaissent à votre place
- Type de source citée — site officiel, article de blog, forum, annuaire ?
Calculez votre taux de présence : nombre de citations / (5 questions × 3 moteurs) = X %.
En dessous de 20 %, vous avez un problème significatif de visibilité IA. Au-dessus de 50 %, vous êtes dans une bonne position. Au-dessus de 80 %, vous pouvez passer en mode optimisation fine.
Ce que les résultats vous disent
Si vous n'apparaissez nulle part mais que vos concurrents sont cités, le problème est probablement technique (crawlabilité, données structurées) ou éditorial (extractibilité, contenu).
Si personne n'apparaît dans votre secteur, c'est une opportunité : le premier à s'optimiser raflera les citations.
Si vous apparaissez sur certaines requêtes mais pas d'autres, comparez les pages correspondantes : celle qui est citée a probablement quelque chose que les autres n'ont pas (meilleure structure, plus de données, FAQ...).
Étape 2 — L'audit de crawlabilité (10 minutes)
C'est le critère binaire : si les bots IA ne peuvent pas accéder à votre site, rien d'autre ne compte.
Vérifier robots.txt
Allez sur votresite.fr/robots.txt et cherchez les directives pour ces user-agents :
GPTBot— ChatGPTClaudeBot— ClaudePerplexityBot— PerplexityGoogle-Extended— Gemini / AI Overviews
Si vous voyez Disallow: / pour l'un de ces bots, vous le bloquez activement.
Résultat attendu : aucun bot IA ne doit être bloqué (sauf décision stratégique documentée).
Vérifier le fichier llms.txt
Allez sur votresite.fr/llms.txt. Ce fichier, s'il existe, guide les crawlers IA vers vos contenus les plus importants.
Résultat attendu : le fichier existe et liste vos pages principales.
→llms.txt, robots.txt et crawlabilité IA : le guide technique →
Vérifier l'accessibilité sans JavaScript
Désactivez JavaScript dans votre navigateur (Chrome DevTools → Ctrl+Shift+P → "Disable JavaScript") et naviguez sur votre site. Si le contenu principal disparaît, les crawlers IA ne peuvent probablement pas le lire.
Résultat attendu : le contenu principal est visible sans JavaScript.
Vérifier le sitemap
Allez sur votresite.fr/sitemap.xml. Vérifiez qu'il est accessible, qu'il liste toutes vos pages importantes, et que les dates <lastmod> sont à jour.
Résultat attendu : sitemap accessible et à jour.
Étape 3 — L'audit d'extractibilité (30 minutes)
C'est le critère le plus lourd du score GEO (25 points sur 100) et le plus souvent défaillant.
Analyser les 5 pages principales
Prenez vos 5 pages les plus importantes (homepage, page service/produit principale, article de blog clé, FAQ, page À propos). Pour chaque page, évaluez :
Les 100 premiers mots — contiennent-ils une réponse directe à la question que se pose le visiteur ? Ou commencent-ils par du texte commercial vague ("Bienvenue chez...", "Leader de l'innovation...") ?
Testez avec cette méthode : copiez les 100 premiers mots de votre page et collez-les dans ChatGPT en demandant "Sur la base de ce texte, que fait cette entreprise et que propose-t-elle ?". Si ChatGPT ne peut pas répondre clairement, votre intro n'est pas extractible.
Les sous-titres H2/H3 — sont-ils descriptifs ou vagues ? "Comment fonctionne notre service" est bon. "En savoir plus" est mauvais. "Nos avantages" est médiocre.
L'autonomie des paragraphes — prenez un paragraphe au hasard dans la page. Est-il compréhensible hors contexte ? Les IA extraient souvent un seul paragraphe pour répondre à une question. Si ce paragraphe nécessite le contexte du paragraphe précédent, il perd sa valeur.
La structure — y a-t-il des listes, des tableaux, des étapes numérotées ? L'information structurée est plus facilement extractible que le texte continu.
Notation rapide
Pour chaque page, attribuez un score subjectif :
- Bon (4-5/5) : intro factuelle, sous-titres descriptifs, paragraphes autonomes, listes/tableaux
- Moyen (2-3/5) : mix contenu informatif et commercial, structure partielle
- Faible (0-1/5) : intro commerciale, pas de structure, texte continu vague
Étape 4 — L'audit des données structurées (15 minutes)
Tester avec le Rich Results Test
Allez sur le Rich Results Test de Google et entrez l'URL de votre homepage. Notez :
- Combien de types de résultats enrichis sont détectés ?
- Y a-t-il des erreurs ou des avertissements ?
Répétez pour votre page FAQ et votre article de blog principal.
Checklist des schemas essentiels
Vérifiez la présence de ces schemas :
Organizationsur la homepage — nom, logo, URL, adresse, contact, sameAs (liens vers LinkedIn, etc.)Articlesur les contenus éditoriaux — titre, auteur (avec nom et URL LinkedIn), dates, descriptionFAQPagesur les pages contenant des Q&RBreadcrumbListsur les pages internesWebSiteavec SearchAction sur la homepage
Résultat attendu : au minimum Organization + Article. Idéalement les 5 schemas ci-dessus.
→Schema.org et IA : exemples de code prêts à copier →
Étape 5 — L'audit de vérifiabilité (20 minutes)
Scanner le contenu pour les preuves
Parcourez vos 5 pages principales et comptez, pour chaque page :
- Données chiffrées — statistiques, pourcentages, montants, durées (objectif : 1 donnée pour 200 mots)
- Sources nommées — "selon Gartner", "d'après une étude McKinsey" (pas "selon les experts" ni "des études montrent")
- Dates de référence — "en 2026", "depuis mars 2025" (pas "récemment" ni "depuis quelque temps")
- Exemples concrets — cas clients, scénarios d'usage, résultats mesurés
Identifier les affirmations non sourcées
Cherchez dans vos pages les affirmations qui ne sont pas accompagnées de preuves :
- "Nous sommes leaders de..." → leaders selon quelle métrique ?
- "Des résultats exceptionnels" → quel résultat précisément ?
- "De nombreux clients satisfaits" → combien exactement ?
Chaque affirmation non sourcée est un signal négatif pour les IA.
Étape 6 — L'audit d'autorité E-E-A-T (10 minutes)
Page À propos
Votre page À propos contient-elle :
- Le nom complet du fondateur/dirigeant ?
- Une biographie avec parcours et expertise ?
- Une photo ?
- Les coordonnées complètes (adresse, email, téléphone) ?
- Des signaux de confiance (logos clients, certifications, mentions presse) ?
Auteurs identifiés
Vos articles de blog sont-ils signés par un auteur nommé avec :
- Un lien vers un profil professionnel (LinkedIn) ?
- Une bio courte en bas de l'article ?
Mentions légales
Vos mentions légales sont-elles complètes : raison sociale, SIRET/RCS, adresse, directeur de publication ?
Résultat attendu : page À propos complète, auteurs identifiés, mentions légales exhaustives.
Étape 7 — L'audit de neutralité (10 minutes)
Analyser le ton
Relisez vos pages clés avec un œil critique. Cherchez :
- Superlatifs non sourcés : "le meilleur", "le plus innovant", "inégalé", "révolutionnaire"
- Promesses vagues : "des résultats exceptionnels", "une solution transformative"
- Manipulation : urgence artificielle ("offre limitée !"), pression sociale ("tout le monde utilise..."), peur ("vous perdez de l'argent")
Chaque occurrence réduit votre crédibilité auprès des IA.
Le test du ton
Prenez le paragraphe le plus commercial de votre site et posez-vous la question : "Est-ce qu'un article Wikipédia dirait ça ?" Si non, c'est trop promotionnel pour les IA.
L'objectif n'est pas de supprimer toute dimension commerciale, mais de la baser sur des faits : "Solution reconnue par 312 entreprises depuis 2019" plutôt que "Solution leader du marché".
Étape 8 — L'audit de présence externe (15 minutes)
Vérifier votre empreinte web
Cherchez votre marque sur Google (entre guillemets) : "votre entreprise". Combien de résultats proviennent de sites tiers (pas votre propre site) ?
Cherchez aussi :
- Votre nom sur Reddit (via Google :
site:reddit.com "votre entreprise") - Votre profil LinkedIn entreprise — est-il actif ?
- Votre Google Business Profile — existe-t-il et est-il vérifié ?
- Des mentions presse — des articles qui parlent de vous ?
Évaluer la diversité
L'idéal est d'être mentionné sur plusieurs types de sources :
- Presse/médias sectoriels
- Forums/Reddit
- Annuaires professionnels
- Google Business Profile
- LinkedIn (profil entreprise actif)
Résultat attendu : au moins 3 types de sources externes différents.
Étape 9 — L'audit de fraîcheur (5 minutes)
Vérifier les dates :
- Votre dernier article de blog date de quand ?
- Vos pages principales affichent-elles une date de mise à jour visible ?
- Y a-t-il des dates périmées dans votre contenu ("tendances 2024", "nouveautés 2023") ?
- Les
dateModifieddans vos schemas Article sont-ils à jour ?
Résultat attendu : contenu mis à jour dans les 3 derniers mois, aucune date obsolète.
Synthétiser les résultats
Comment prioriser
Prioriser d'abord les critères bloquants — crawlabilité et extractibilité. Si les bots ne peuvent pas accéder à votre site ou si votre contenu n'est pas extractible, rien d'autre ne sert.
Ensuite les critères à fort impact — vérifiabilité et données structurées. Ce sont les leviers qui font passer un site de "invisible" à "citable".
Enfin les critères de renforcement — autorité, neutralité, présence externe, fraîcheur. Ils améliorent un site déjà citable.
Automatiser votre audit
L'audit manuel que nous venons de décrire prend environ 2 heures. C'est un excellent exercice pour comprendre les enjeux, mais ce n'est pas tenable pour un suivi régulier.
Detekia automatise les 8 critères en moins de 60 secondes : il scrape le DOM réel de votre page, analyse chaque critère, et vous donne un score sur 100 avec des recommandations priorisées par impact.
L'audit automatisé est particulièrement utile pour :
- Le diagnostic initial — où en êtes-vous exactement ?
- Le suivi après optimisation — vos corrections ont-elles amélioré le score ?
- Le benchmark concurrentiel — comment vous situez-vous par rapport à vos concurrents ?
→Lancez votre audit GEO automatisé — en moins de 60 secondes, sans inscription →