Tag : Llm

Tous les articles du blog avec ce tag.

Trafic IA : comment mesurer les visites que ChatGPT, Perplexity et Claude envoient sur votre site

Trafic IA : comment mesurer les visites que ChatGPT, Perplexity et Claude envoient sur votre site

Quelque chose a changé dans la manière dont les internautes découvrent votre site. Et il y a de fortes chances que vous ne le voyiez pas. Depuis fin 2024, les plateformes d'intelligence artificielle conversationnelle ne se contentent plus de répondre aux questions de leurs utilisateurs. Elles citent des sources, insèrent des liens, et envoient des visiteurs réels vers des sites web. ChatGPT, Perplexity, Claude, Gemini, Copilot : ces outils sont en train de devenir un canal de découverte à part entière, comparable aux moteurs de recherche classiques par la qualité du trafic qu'ils génèrent. Le problème ? La plupart des outils analytics ne distinguent pas ce trafic. Il se noie dans la catégorie "referral", se mélange au "direct", ou disparaît purement et simplement des rapports. Résultat : vous avez peut-être déjà des visiteurs qui arrivent via une recommandation de ChatGPT, et vous ne le savez pas. Cet article vous donne la méthode complète pour identifier ce trafic, comprendre sa valeur, et adapter votre stratégie de contenu. Un nouveau canal de découverte en pleine explosion Les chiffres sont encore modestes en volume absolu, mais la dynamique est spectaculaire. Selon une étude de SE Ranking portant sur près de 64 000 sites dans 250 pays (janvier-avril 2025), ChatGPT concentre à lui seul 78 % du trafic IA référent mondial. Perplexity représente environ 15 %, Gemini 6,4 %. Claude et DeepSeek se partagent le reste, avec des parts inférieures à 1 % mais des dynamiques de croissance très intéressantes. (Source : SE Ranking, "AI Traffic in 2025") Une analyse complémentaire de Conductor, relayée par Search Engine Land, confirme cette hiérarchie sur un échantillon de 13 770 domaines et 3,3 milliards de sessions : le trafic IA représente en moyenne 1 % du trafic total d'un site, et ChatGPT en génère 87 % à lui seul. (Source : Search Engine Land, nov. 2025) Un pour cent, c'est peu en apparence. Mais deux éléments changent la perspective. La croissance est forte, mais encore inégale. Entre janvier et avril 2025, la part de ChatGPT dans le trafic internet global a doublé dans l'étude SE Ranking, passant de 0,08 % à 0,16 %. Certaines analyses sectorielles observent aussi une forte progression annuelle du trafic IA référent. Ces chiffres restent à relire par secteur : ils ne transforment pas automatiquement l'IA en premier canal d'acquisition. La qualité du trafic peut être intéressante. Les visiteurs provenant des plateformes IA passent en moyenne 9 à 10 minutes par session sur les sites visités dans l'étude SE Ranking, contre 3 à 4 minutes pour le trafic organique classique. Les sessions référées par Claude y atteignent même une durée moyenne très élevée dans l'UE. Ce sont des signaux à examiner, pas une garantie de conversion : chaque équipe doit vérifier les pages d'entrée, les événements utiles et les conversions sur ses propres données. L'explication est logique : un utilisateur qui clique sur un lien dans une réponse IA a déjà formulé une question précise, reçu un contexte, et choisi de visiter votre site parmi les sources citées. Son intention est pré-qualifiée. C'est un visiteur qui sait pourquoi il vient. Pourquoi vos analytics ne voient pas ce trafic Si le trafic IA est si intéressant, pourquoi n'apparaît-il pas clairement dans vos rapports ? Trois raisons techniques expliquent cet angle mort. Le problème du referrer manquant Lorsqu'un utilisateur clique un lien dans Perplexity depuis un navigateur web, le header HTTP Referer transmet généralement perplexity.ai comme source. L'outil analytics peut alors classer cette visite en "referral" depuis Perplexity. Mais ce mécanisme ne fonctionne pas toujours. Selon le contexte, une partie des sessions provenant d'outils IA peut ne pas transmettre de referrer exploitable. Les raisons sont multiples : les applications mobiles (ChatGPT sur iOS, Copilot dans Windows) peuvent ouvrir les liens dans des webviews internes, certains agents IA préchargent ou prévisualisent des pages sans déclencher le script analytics, et les navigateurs IA comme Perplexity Comet ou ChatGPT Atlas ne transmettent pas tous les signaux de la même manière. (Source : MarTech, nov. 2025) Résultat : une part importante du trafic IA tombe dans la catégorie "direct" ou "unassigned" de vos analytics, invisible et non attribué. La classification par défaut de GA4 Google Analytics 4 peut classer les visites issues des assistants IA comme du trafic "referral", au même titre qu'un lien depuis Facebook, un forum ou un annuaire. Dans les configurations observées lors de la rédaction initiale, les équipes devaient encore créer leur propre regroupement pour isoler ce trafic. Vérifiez toujours l'état courant de votre interface GA4 avant de documenter la procédure. Concrètement, si vous ouvrez votre rapport d'acquisition dans GA4 sans configuration spécifique, le trafic de ChatGPT est noyé parmi des dizaines d'autres sources de referral. Pour un site qui reçoit des centaines de referrers différents, repérer chatgpt.com ou perplexity.ai demande de savoir ce qu'on cherche. La confusion bots vs humains Les plateformes IA ont deux manières d'interagir avec votre site. La première est le trafic référent : un humain clique sur un lien dans une réponse IA et arrive sur votre page. C'est du vrai trafic, avec un vrai visiteur. La seconde est le crawl : les robots des plateformes IA (GPTBot pour OpenAI, PerplexityBot, ClaudeBot, etc.) visitent votre site pour indexer son contenu et nourrir leurs modèles. Ce crawl n'est pas du trafic utile, c'est de l'aspiration de données. GA4 filtre automatiquement les bots connus, mais la liste n'est pas exhaustive. Certains bots IA récents passent entre les mailles du filet, ou au contraire, certains visiteurs humains légitimes provenant d'outils IA sont filtrés par erreur. Selon Cloudflare, le ratio de crawl par rapport aux clics référents peut atteindre 700:1 pour Perplexity, ce qui donne une idée de l'ampleur du phénomène d'aspiration. (Source : Digiday, déc. 2025) Méthode : identifier le trafic IA dans vos outils Deux approches sont possibles selon l'outil que vous utilisez. Dans GA4 : créer un canal "Trafic IA" dédié La méthode recommandée consiste à créer un channel group personnalisé qui regroupe toutes les sources IA connues. Voici la procédure :Dans GA4, allez dans Admin > Paramètres des données > Groupes de canaux. Cliquez sur le groupe de canaux par défaut, puis "Copier" pour en créer un nouveau. Ajoutez un canal nommé "Trafic IA" (ou "AI Traffic"). Définissez la règle : Type de correspondance = "correspond à l'expression régulière", puis collez cette regex :(chatgpt\.com|chat\.openai\.com|perplexity\.ai|claude\.ai|gemini\.google\.com|copilot\.microsoft\.com|deepseek\.com|meta\.ai)Placez ce canal au-dessus du canal "Referral" par défaut dans l'ordre de priorité. C'est crucial : GA4 évalue les règles de haut en bas, et si "Trafic IA" est en dessous de "Referral", les visites seront classées en referral avant d'atteindre votre règle.Cette configuration ne s'applique qu'aux nouvelles données (pas de rétroactivité). Comptez quelques jours avant de voir les premiers résultats. Pour une analyse ponctuelle sur des données existantes, vous pouvez créer un rapport Exploration avec un filtre sur la dimension "Source de la session" utilisant la même regex. (Source : MarTech, nov. 2025) Dans un analytics frugal (Plausible, Fathom, etc.) C'est ici que la simplicité d'un outil bien conçu peut faire la différence. Dans Plausible, par exemple, le rapport "Sources" affiche directement chaque referrer identifié. Si chatgpt.com ou perplexity.ai apparaît comme source, vous le voyez dans la liste des sources sans créer un canal personnalisé. Il suffit ensuite de filtrer le dashboard par cette provenance et d'analyser les pages d'entrée, le temps passé et les événements déclenchés. Plausible a d'ailleurs documenté sa propre expérience : en 2024, le blog de Plausible a constaté une hausse de 2 200 % de son trafic IA référent en quelques mois, identifiable directement depuis leur dashboard standard. (Source : Plausible, déc. 2024) C'est un cas d'école où la philosophie de l'analytics frugale aide : quand l'outil est conçu pour montrer les données essentielles sans couches de configuration, les signaux émergents sont plus faciles à inspecter. Un outil comme GA4 reste puissant, mais il demande souvent une configuration dédiée pour isoler une nouvelle famille de sources. Pour une vue d'ensemble des familles d'outils analytics, consultez notre comparatif Google Analytics, Matomo et analytics frugales. Trafic IA vs crawl IA : deux phénomènes distincts Une confusion fréquente consiste à mélanger le trafic référent (des humains qui cliquent) et le crawl (des robots qui aspirent). Il est important de les distinguer, car ils posent des questions différentes. Le trafic référent IA est une opportunité. C'est un visiteur qualifié, pré-informé, qui arrive avec une intention. Le mesurer permet d'optimiser les pages d'entrée, d'adapter le contenu, et de comprendre comment les IA perçoivent votre site. Le crawl IA est une question de gouvernance. Les robots comme GPTBot, PerplexityBot ou ClaudeBot visitent votre site pour entraîner leurs modèles ou répondre en temps réel aux requêtes de leurs utilisateurs. Certains le font de manière intensive : Cloudflare a observé que le volume de crawl de GoogleBot (qui alimente aussi Gemini) dépasse de loin celui de tous les autres bots IA combinés. Vous pouvez contrôler le crawl via votre fichier robots.txt : User-agent: GPTBot Disallow: /User-agent: PerplexityBot Disallow: /User-agent: ClaudeBot Disallow: /Mais attention au paradoxe : bloquer le crawl peut réduire votre trafic référent. Si une IA ne peut pas indexer votre contenu, elle ne pourra pas le recommander à ses utilisateurs. C'est un arbitrage à faire en connaissance de cause. Une approche émergente consiste à utiliser un fichier llms.txt (au format Markdown, placé à la racine du site) pour guider les IA vers le contenu que vous souhaitez rendre accessible, sans bloquer l'ensemble du crawl. Anthropic (le créateur de Claude) utilise d'ailleurs ce mécanisme sur son propre site. Comment être cité par les IA Comprendre le trafic IA, c'est aussi comprendre ce qui le déclenche. Les plateformes d'IA ne citent pas les sites au hasard. Plusieurs facteurs favorisent les citations. La structure du contenu compte. Les analyses citées par Superprompt suggèrent que les pages organisées avec une hiérarchie claire (H2, H3, listes) et qui répondent directement à des questions précises sont plus facilement reprises. Les FAQ structurées sont particulièrement utiles : elles correspondent au format question-réponse des interactions IA. La fraîcheur peut aider. Les contenus récemment mis à jour sont souvent plus faciles à exploiter dans des réponses qui recherchent une information actuelle. L'effet dépend toutefois du sujet, de l'autorité du domaine et du mode de collecte de la plateforme IA. Les données originales attirent les citations. Les tableaux, statistiques propres et benchmarks exclusifs peuvent être plus faciles à citer qu'un contenu généraliste. C'est un argument supplémentaire pour l'approche data-driven et les KPIs précis plutôt que les métriques de vanité. Le SEO classique reste la fondation. Plusieurs études de marché rapprochent visibilité IA et référencement traditionnel : structure, autorité, fraîcheur et clarté éditoriale restent centrales. Le SEO ne dépend pas de Google Analytics, mais il reste le socle sur lequel se construit une partie de la visibilité IA. Ce que ça change pour le choix de votre outil analytics Le trafic IA met en lumière une limite opérationnelle des outils analytics complexes : les signaux émergents demandent souvent une configuration préalable pour être lisibles. Avec GA4, il faut créer un channel group, écrire une regex, la mettre à jour régulièrement (de nouveaux outils IA apparaissent chaque mois), et accepter que les données ne seront pas rétroactives. C'est faisable, mais ça demande une compétence technique que la plupart des dirigeants de PME ou des freelances n'ont pas. Avec un analytics frugal bien conçu, les referrers IA peuvent apparaître directement dans le rapport des sources, au même titre que Google, LinkedIn ou Twitter, dès lors que le referrer est transmis. Cela ne supprime pas les limites liées aux webviews, au direct ou au prefetch, mais rend les signaux visibles plus faciles à lire. C'est le principe même de la sobriété analytique : collecter moins de données, mais rendre chaque donnée immédiatement lisible. Le trafic IA n'est pas un phénomène à ignorer. C'est l'un des signaux d'un changement dans la manière dont certains internautes découvrent du contenu. Les sites qui le mesurent aujourd'hui auront surtout une meilleure lecture de leurs sources émergentes, sans surestimer un volume qui reste souvent minoritaire. La question n'est plus de savoir si les IA envoient du trafic vers votre site. C'est de savoir si votre outil de mesure vous le montre.Questions fréquentes Quelle part de mon trafic provient des IA ? Les études publiées fin 2025 situent encore le trafic IA identifiable à une part faible du trafic total, avec de fortes variations par secteur. Ces chiffres ne reflètent que le trafic identifiable : lorsqu'une session IA n'a pas de referrer exploitable, elle peut tomber dans "direct" et rester difficile à attribuer. Comment voir le trafic ChatGPT dans Google Analytics 4 ? Si votre interface GA4 ne propose pas encore de canal IA adapté à votre besoin, créez un channel group personnalisé : dans Admin > Paramètres des données > Groupes de canaux, ajoutez un canal "Trafic IA" avec une règle regex couvrant les domaines IA (chatgpt.com, perplexity.ai, claude.ai, gemini.google.com, copilot.microsoft.com). Placez-le au-dessus du canal "Referral" dans la hiérarchie. Les données ne seront collectées qu'à partir de la date de création du canal. Faut-il bloquer les bots IA avec robots.txt ? C'est un arbitrage. Bloquer les bots IA (GPTBot, PerplexityBot, ClaudeBot) via robots.txt empêche l'indexation de votre contenu par ces plateformes, ce qui peut réduire les citations et donc le trafic référent. À l'inverse, ne pas bloquer signifie que votre contenu alimente l'entraînement de modèles IA, ce qui soulève des questions de propriété intellectuelle et de consentement. Une approche intermédiaire consiste à utiliser un fichier llms.txt pour guider les IA vers le contenu que vous souhaitez rendre accessible. Les analytics sans cookies détectent-elles le trafic IA ? Oui, lorsqu'un referrer exploitable est transmis. Les outils cookieless comme Plausible, Fathom ou Simple Analytics peuvent afficher ces referrers directement dans leur rapport de sources, sans channel group dédié. C'est souvent plus simple à inspecter, mais cela ne résout pas les limites de referrer, de direct ou de prefetch. Comment optimiser son contenu pour être cité par ChatGPT ou Perplexity ? Cinq leviers sont utiles à tester : structurer le contenu avec des titres clairs (H2/H3) et des FAQ ; maintenir le contenu à jour quand le sujet l'exige ; produire des données originales (tableaux, statistiques, benchmarks) ; soigner le SEO classique ; et envisager un fichier llms.txt pour faciliter l'accès des IA à votre contenu structuré. Les effets varient selon les plateformes et les sujets : documentez vos hypothèses avant d'en faire une règle éditoriale.Sources et chiffres vérifiés pour la publication initiale de février 2026. Les parts de trafic IA et les classifications GA4 évoluent rapidement : vérifiez l'interface et la documentation courantes avant d'en faire une règle interne. Sources Sources vérifiées le 10 mai 2026.SE Ranking, "AI Traffic in 2025: Comparing ChatGPT, Perplexity & Other Top Platforms" Search Engine Land, "AI sends 1% of website traffic — and most of it is from ChatGPT" MarTech, "How GA4 records traffic from Perplexity Comet and ChatGPT Atlas" Plausible Analytics, "Breaking down our 2.2K% surge in AI traffic"