Comment détecter le plagiat ChatGPT et pourquoi c'est si difficile

Les chatbots sont en vogue en ce moment, et ChatGPT est le chef d'entre eux. Mais grâce à la puissance et à l'aspect humain de ses réponses, les universitaires, les éducateurs et les éditeurs sont tous confrontés à la marée montante du plagiat et de la tricherie générés par l'IA. Vos anciens outils de détection de plagiat ne suffiront peut-être pas à démêler le vrai du faux.

Contenu

  • Beaucoup d'options de détection
  • Les mettre à l'épreuve
  • Fermeture

Dans cet article, je parle un peu de ce côté cauchemardesque des chatbots IA, découvre quelques outils de détection de plagiat en ligne et explore à quel point la situation est devenue désastreuse.

Logos ChatGPT et OpenAI.

Beaucoup d'options de détection

La dernière version de novembre 2022 de startup ChatGPT d'OpenAI a essentiellement propulsé les prouesses du chatbot sous les feux de la rampe. Il a permis à n'importe quel Joe ordinaire (ou à n'importe quel professionnel) de générer des essais ou des articles intelligents et intelligibles et de résoudre des problèmes mathématiques basés sur du texte. Pour le lecteur inconscient ou inexpérimenté, le contenu créé par l'IA peut très facilement passer pour un écrit légitime, c'est pourquoi les étudiants l'adorent - et les enseignants le détestent.

En rapport

  • Le fabricant de ChatGPT OpenAI fait face à une enquête de la FTC sur les lois de protection des consommateurs
  • Le trafic du site ChatGPT a chuté pour la première fois
  • Les meilleurs chatbots IA à essayer: ChatGPT, Bard, et plus

Un grand défi avec les outils d'écriture d'IA est leur capacité à double tranchant à utiliser le langage naturel et grammaire pour construire un contenu unique et presque individualisé même si le contenu lui-même a été tiré d'un base de données. Cela signifie que la course pour vaincre la triche basée sur l'IA est lancée. Voici quelques options que j'ai trouvées et qui sont disponibles gratuitement dès maintenant.

Vidéos recommandées

Détecteur de sortie GPT-2 vient directement du développeur ChatGPT OpenAI pour démontrer qu'il a un bot capable de détecter le texte du chatbot. Output Detector est facile à utiliser - les utilisateurs n'ont qu'à saisir du texte dans un champ de texte et l'outil fournira immédiatement son évaluation de la probabilité que le texte provienne d'un humain ou non.

Deux autres outils dotés d'interfaces utilisateur propres sont Détecteur de contenu Writer AI et Contenu à grande échelle. Vous pouvez soit ajouter une URL pour analyser le contenu (rédacteur uniquement), soit ajouter manuellement du texte. Les résultats reçoivent un pourcentage de la probabilité que le contenu soit généré par l'homme.

GPTZéro est un outil bêta maison hébergé sur Streamlit et créé par Edward Zen, étudiant à l'Université de Princeton. Il diffère des autres dans la façon dont le modèle « algiarism » (plagiat assisté par l'IA) présente ses résultats. GPTZero décompose les métriques en perplexité et rafale. La rafale mesure le caractère aléatoire global de toutes les phrases d'un texte, tandis que la perplexité mesure le caractère aléatoire d'une phrase. L'outil attribue un nombre aux deux métriques - plus le nombre est faible, plus il est possible que le texte ait été créé par un bot.

Capture d'écran de GPTZero.

Juste pour le plaisir, j'ai inclus Salle de test du modèle de langage géant (GLTR), développé par des chercheurs du MIT-IBM Watson AI Lab et du Harvard Natural Language Processing Group. Comme GPTZero, il ne présente pas ses résultats finaux comme une distinction claire entre "humain" ou "bot". GLTR utilise essentiellement des bots pour identifier le texte écrit par des bots, car les bots sont moins susceptibles de sélectionner des mots imprévisibles. Par conséquent, les résultats sont présentés sous la forme d'un histogramme à code couleur, classant le texte généré par l'IA par rapport au texte généré par l'homme. Plus la quantité de texte imprévisible est importante, plus il est probable que le texte provienne d'un humain.

Les mettre à l'épreuve

Sortie du détecteur GPT-2.

Toutes ces options pourraient vous faire penser que nous sommes bien placés avec la détection de l'IA. Mais pour tester l'efficacité réelle de chacun de ces outils, j'ai voulu l'essayer par moi-même. J'ai donc rédigé quelques exemples de paragraphes que j'ai écrits en réponse à des questions que j'ai également posées, dans ce cas, à ChatGPT.

Ma première question était simple: pourquoi l'achat d'un PC préconstruit est-il mal vu? Voici comment mes propres réponses par rapport à la réponse de ChatGPT.

Ma vraie écriture ChatGPT
Détecteur de sortie GPT-2 1,18 % faux 36,57% faux
IA de l'écrivain 100% humain 99% humain
Contenu à grande échelle 99% humain 73% humain
GPTZéro 80 perplexité 50 perplexité
GLTR 12 des 66 mots probablement par l'homme 15 ou 79 mots probablement humains

Comme vous pouvez le voir, la plupart de ces applications pouvaient dire que mes paroles étaient authentiques, les trois premières étant les plus précises. Mais ChatGPT a également trompé la plupart de ces applications de détection avec sa réponse. Il a obtenu un score humain de 99 % sur l'application Writer AI Content Detector, pour commencer, et n'a été marqué qu'à 36 % de faux par un détecteur basé sur GPT. GLTR était le plus grand contrevenant, affirmant que mes propres mots étaient tout aussi susceptibles d'être écrits par un humain que les mots de ChatGPT.

Sortie avec Write AI Detector.

J'ai décidé de lui donner un coup de plus, cependant, et cette fois, les réponses ont été considérablement améliorées. J'ai demandé à ChatGPT de fournir un résumé des recherches de l'EPF sur l'anti-buée à l'aide de particules d'or. Dans cet exemple, les applications de détection ont fait un bien meilleur travail pour approuver ma propre réponse et détecter ChatGPT.

Ma vraie écriture ChatGPT
Détecteur de sortie GPT-2 9,28% faux 99,97% faux
IA de l'écrivain 95% humain 2% humain
Contenu à grande échelle 92% humain 0% (Évidemment IA)
GPTZéro 41 perplexité 23 perplexité
GLTR 15 des 79 mots probablement par l'homme 4 mots sur 98 probablement par un humain

Les trois meilleurs tests ont vraiment montré leur force dans cette réponse. Et tandis que GLTR avait encore du mal à voir ma propre écriture comme humaine, au moins cela a fait du bien d'attraper ChatGPT cette fois.

Fermeture

Il ressort clairement des résultats de chaque requête que les détecteurs de plagiat en ligne ne sont pas parfaits. Pour des réponses ou des écrits plus complexes (comme dans le cas de ma deuxième invite), c'est un peu plus facile pour que ces applications détectent l'écriture basée sur l'IA, tandis que les réponses les plus simples sont beaucoup plus difficiles à déduire. Mais clairement, ce n'est pas ce que j'appellerais fiable. Parfois, ces outils de détection classeront à tort des articles ou des essais comme étant générés par ChatGPT, ce qui est un problème pour les enseignants ou les éditeurs qui souhaitent s'appuyer sur eux pour attraper les tricheurs.

Les développeurs affinent constamment la précision et les taux de faux positifs, mais ils se préparent également à l'arrivée de GPT-3, qui vante un ensemble de données considérablement amélioré et des capacités plus complexes que GPT-2 (dont ChatGPT est formé depuis).

À ce stade, afin d'identifier le contenu généré par les IA, les éditeurs et les éducateurs devront combiner la judicieuseté et un peu d'intuition humaine avec un (ou plusieurs) de ces détecteurs d'IA. Et pour les utilisateurs de chatbot qui ont ou sont tentés d'utiliser des chatbots tels que Chatsonic, ChatGPT, Notion ou YouChat pour faire passer leur "travail" comme légitime - s'il vous plaît ne le faites pas. La réutilisation du contenu créé par un bot (qui s'approvisionne à partir de sources fixes dans sa base de données) est toujours du plagiat, peu importe comment vous le regardez.

Recommandations des éditeurs

  • Google Bard peut désormais parler, mais peut-il noyer ChatGPT?
  • ChatGPT: les dernières actualités, controverses et astuces à connaître
  • La fonctionnalité de navigation Bing de ChatGPT est désactivée en raison d'une faille d'accès au mur payant
  • 81 % pensent que ChatGPT est un risque pour la sécurité, selon une enquête
  • Le rival ChatGPT d'Apple peut automatiquement écrire du code pour vous

Améliorez votre style de vieDigital Trends aide les lecteurs à garder un œil sur le monde trépidant de la technologie avec toutes les dernières nouvelles, des critiques de produits amusantes, des éditoriaux perspicaces et des aperçus uniques.