Aller au contenu principal
Intelligence artificielle

Détecter un texte écrit par une IA : outils et signes qui trahissent ChatGPT

Détecteurs d'IA fiables ou non, indices linguistiques qui trahissent ChatGPT, limites des outils : le guide clair pour repérer un texte généré par une IA.

Hugo MolletPar Hugo Mollet5 min de lecture
Une enseignante compare un devoir imprimé avec un écran d'ordinateur d'un air songeur
Une enseignante compare un devoir imprimé avec un écran d'ordinateur d'un air songeur
Partager
Sommaire

Repérer un texte rédigé par ChatGPT, Gemini ou Claude est devenu une préoccupation pour les enseignants, les recruteurs et les éditeurs. La réponse honnête tient en une phrase : aucun outil ne le fait avec certitude. Les détecteurs estiment une probabilité, et certains indices de style mettent la puce à l'oreille — mais rien ne remplace votre jugement. Voici comment vous y prendre sans vous tromper.

Comment fonctionnent les détecteurs d'IA

Les détecteurs analysent surtout deux paramètres statistiques du texte. La perplexité mesure le caractère prévisible des mots : un modèle d'IA choisit souvent le mot le plus probable, ce qui rend ses phrases « trop lisses ». La burstiness (ou variabilité) évalue l'alternance entre phrases longues et courtes : les humains varient davantage, l'IA tend à produire un rythme régulier.

À partir de ces signaux, l'outil renvoie un score : « 85 % généré par IA », par exemple. Le problème, c'est que ce chiffre repose sur des moyennes. Un texte humain très scolaire peut paraître « robotique », tandis qu'un texte d'IA légèrement retouché redevient « humain ».

Panorama des principaux outils

Voici les détecteurs les plus connus et leurs caractéristiques générales. Les performances évoluent vite : prenez ce tableau comme un repère, pas comme un classement définitif.

Outil Type Points forts Limites
GPTZero Gratuit / payant Pensé pour l'éducation, détaille les phrases suspectes Faux positifs sur textes structurés
Originality.ai Payant Pensé pour le SEO et les éditeurs, détecte aussi le plagiat Coût, sévérité variable
Turnitin Institutionnel Intégré aux universités Accès réservé, controverses sur la fiabilité
Copyleaks Payant Multilingue, API Résultats parfois instables
Compilatio Payant (FR) Adapté au monde académique français Détection IA encore jeune

Aucun de ces outils ne garantit l'absence d'erreur. Les éditeurs eux-mêmes affichent des marges d'incertitude, et leurs résultats peuvent diverger sur un même texte.

Les signes linguistiques qui trahissent ChatGPT

Avant même de lancer un détecteur, votre œil peut repérer des marqueurs récurrents. Aucun n'est décisif isolément, mais leur accumulation est parlante.

  • Un style trop lisse et neutre : pas de fautes, pas d'hésitations, pas de tics personnels.
  • Des tournures passe-partout : « il est important de noter que », « dans le monde d'aujourd'hui », « en conclusion ».
  • Des structures répétitives : listes systématiques, paragraphes de longueur égale, plan en trois parties bien symétrique.
  • Une absence d'exemples concrets et vécus : l'IA reste générale, évite les anecdotes datées ou les détails sensoriels précis.
  • Des affirmations prudentes et équilibrées à l'excès : « les avis sont partagés », « cela dépend de nombreux facteurs ».
  • Un vocabulaire un peu trop soutenu : abondance de mots comme « notamment », « par ailleurs », « toutefois ».
  • Des erreurs factuelles présentées avec assurance : l'IA « hallucine » parfois des chiffres ou des sources qui n'existent pas.

Le meilleur détecteur reste un lecteur attentif qui connaît le sujet et l'auteur supposé du texte.

Le test du contexte

Un texte humain porte des traces de son origine : une référence à l'actualité récente, une opinion tranchée, une expérience personnelle, une faute d'inattention. L'IA, elle, produit un contenu hors-sol, valable « partout et nulle part ». Demandez-vous : ce texte aurait-il pu être écrit par n'importe qui, n'importe quand ? Si oui, la méfiance est permise.

Pourquoi ces outils se trompent souvent

Les limites sont structurelles, pas seulement techniques.

  • Faux positifs : des études ont montré que les textes d'auteurs non-natifs en anglais sont surreprésentés parmi les accusations à tort, car leur vocabulaire est plus prévisible.
  • Contournement facile : reformuler, ajouter des fautes volontaires ou passer par un outil de paraphrase fait s'effondrer les scores.
  • Course à l'armement : chaque nouvelle version de modèle (GPT-4, Claude, Gemini) rend les détecteurs un peu plus obsolètes.
  • Textes hybrides : la plupart des contenus réels mélangent rédaction humaine et assistance IA, ce que les outils peinent à qualifier.

Comment utiliser un détecteur de façon responsable

Si vous devez vérifier un texte — devoir d'élève, article, candidature —, adoptez une démarche de faisceau d'indices plutôt que de verdict.

  1. Croisez plusieurs outils : un seul score ne suffit pas.
  2. Lisez le texte vous-même en cherchant les marqueurs linguistiques ci-dessus.
  3. Comparez avec un écrit antérieur de la même personne, si vous en disposez.
  4. Dialoguez : demandez à l'auteur d'expliquer sa démarche, de citer ses sources, de reformuler oralement une idée.
  5. Ne sanctionnez jamais sur un seul score : exigez un faisceau d'éléments convergents.

Dans le monde éducatif, beaucoup d'établissements privilégient désormais l'oral, les travaux en classe ou les versions intermédiaires d'un devoir, plus probants qu'un détecteur faillible.

En conclusion : l'esprit critique avant l'outil

Détecter un texte d'IA, ce n'est pas appuyer sur un bouton magique. C'est combiner une lecture attentive, la connaissance du contexte et, éventuellement, un outil pris pour ce qu'il est : une aide imparfaite. À mesure que les modèles progressent, la frontière entre humain et machine s'estompe — au point que la vraie question n'est peut-être plus « qui a écrit ce texte ? », mais « est-il juste, sourcé et utile ? ».

Cet article a une visée informative. Les performances des détecteurs évoluent rapidement : vérifiez les conditions d'usage de chaque outil et n'en faites jamais l'unique fondement d'une décision aux conséquences importantes.

Questions fréquentes

Les détecteurs d'IA peuvent-ils accuser à tort un texte humain ?

Oui, c'est l'un de leurs principaux défauts. Les « faux positifs » touchent souvent les textes écrits par des non-natifs, les écrits très structurés ou les contenus techniques. Un score élevé n'est jamais une preuve : il faut le considérer comme un simple indice à vérifier.

ChatGPT peut-il détecter s'il a écrit un texte ?

Non, et il ne faut pas lui faire confiance pour cela. Si vous collez un texte et demandez à ChatGPT s'il l'a généré, il invente une réponse plausible sans réelle capacité d'analyse. OpenAI a d'ailleurs retiré son propre outil de détection faute de fiabilité.

Reformuler un texte d'IA suffit-il à passer entre les mailles des détecteurs ?

Souvent oui. Une réécriture humaine, l'ajout d'exemples personnels ou le passage par un outil de paraphrase font chuter les scores de détection. C'est précisément pourquoi ces outils ne peuvent constituer une preuve solide.

Existe-t-il un filigrane invisible dans les textes générés par IA ?

Des recherches existent sur le « watermarking » (marquage statistique des mots choisis), mais aucun système n'est déployé à grande échelle ni standardisé. Pour l'instant, aucune méthode fiable et universelle ne permet de tracer un texte avec certitude.

Hugo Mollet
Hugo Mollet

Fondateur & directeur de la publication

Fondateur de Booksmag et directeur de la publication du média. À la tête de la société éditrice IDAX, il pilote la ligne éditoriale et veille à des contenus clairs, utiles et honnêtes.

Cet article vous a-t-il été utile ?

Plus dans Tech & Numérique

Continuer la lecture

Toute la rubrique