ChatGPT の盗作を検出する方法とそれが非常に難しい理由

チャットボットは今注目のアイテムです。 チャットGPT その中でのリーダーです。 しかし、その応答が非常に強力で人間らしいため、学者、教育者、編集者は皆、AI によって生成される盗作や不正行為の増加傾向に対処しています。 古い盗作検出ツールでは、本物と偽物を嗅ぎ分けるのに十分ではない可能性があります。

コンテンツ

  • 豊富な検出オプション
  • 彼らをテストする
  • 閉鎖

この記事では、AI チャットボットのこの悪夢のような側面について少し話し、いくつかのオンライン盗作検出ツールを確認し、状況がどれほど悲惨になっているかを探ります。

ChatGPT と OpenAI のロゴ。

豊富な検出オプション

最新の 2022 年 11 月リリースのスタートアップ OpenAIのChatGPT 基本的にチャットボットの優れた能力が脚光を浴びるようになりました。 これにより、一般のジョー (または専門家) であれば誰でも、スマートでわかりやすいエッセイや記事を作成し、テキストベースの数学問題を解決できるようになりました。 知識のない、または経験の浅い読者にとって、AI によって作成されたコンテンツは、正当な文章として非常に簡単に合格することができます。だからこそ、生徒はそれを好みますが、教師はそれを嫌います。

関連している

  • ChatGPTメーカーのOpenAIは消費者保護法を巡りFTCの捜査に直面している
  • ChatGPT Webサイトのトラフィックが初めて減少
  • 試してみるのに最適な AI チャットボット: ChatGPT、Bard など

AI ライティング ツールの大きな課題は、自然言語と言語を使用する両刃の剣の能力です。 たとえコンテンツ自体が データベース。 つまり、AI ベースの不正行為を打破する競争が始まっているということです。 ここでは、現在無料で利用できるいくつかのオプションを見つけました。

おすすめ動画

GPT-2 出力検出器 ChatGPT 開発者 OpenAI から直接提供され、チャットボット テキストを検出できるボットがあることを実証します。 Output Detector は使い方が簡単です。ユーザーはテキスト フィールドにテキストを入力するだけで、ツールはそのテキストが人間から送信されたものであるかどうかの可能性をすぐに評価します。

クリーンな UI を備えたさらに 2 つのツールは次のとおりです。 Writer AI コンテンツ検出器

大規模なコンテンツ. URL を追加してコンテンツをスキャンするか (ライターのみ)、テキストを手動で追加できます。 結果には、コンテンツが人為的に生成されたものである可能性を表すパーセンテージ スコアが与えられます。

GPTゼロ は、Streamlit でホストされ、プリンストン大学の学生 Edward Zen によって作成された自作のベータ ツールです。 「アルギアリズム」(AI支援盗作)モデルが結果を提示する方法が他のモデルとは異なります。 GPTZero はメトリクスを複雑さとバースト性に分割します。 バースト性はテキスト内のすべての文の全体的なランダム性を測定し、パープレキシティは文内のランダム性を測定します。 このツールは両方の指標に数値を割り当てます。数値が小さいほど、テキストがボットによって作成された可能性が高くなります。

GPTZeroのスクリーンショット。

楽しみのために、私は含めました 巨大言語モデル テスト ルーム (GLTR)、MIT-IBM Watson AI Lab およびハーバード自然言語処理グループの研究者によって開発されました。 GPTZero と同様、最終結果を「人間」か「ボット」かの明確な区別として提示しません。 ボットは予測できない単語を選択する可能性が低いため、GLTR は基本的にボットを使用して、ボットによって書かれたテキストを識別します。 したがって、結果は色分けされたヒストグラムとして表示され、AI が生成したテキストと人間が生成したテキストがランク付けされます。 予測できないテキストの量が多ければ多いほど、そのテキストは人間からのものである可能性が高くなります。

彼らをテストする

GPT-2 検出器からの出力。

これらすべてのオプションを考えると、AI 検出に関しては有利な状況にあると思われるかもしれません。 しかし、これらの各ツールの実際の有効性をテストするために、自分で試してみたいと思いました。 そこで、私が同様に提起した質問 (この場合は ChatGPT) に答えて書いたサンプルの段落をいくつか実行しました。

私の最初の質問は単純なものでした。なぜプレビルド PC の購入が嫌われるのでしょうか? 以下は、私自身の回答と ChatGPT からの回答を比較したものです。

私の本当の書き込み チャットGPT
GPT-2 出力検出器 1.18% 偽物 36.57% 偽物
ライターAI 100%人間 99%人間
大規模なコンテンツ 99%人間 73%が人間
GPTゼロ 80 困惑 50 困惑
GLTR 66 単語中 12 単語が人間によるものである可能性が高い 人間が作成した可能性が高い 15 または 79 語

ご覧のとおり、これらのアプリのほとんどは私の言葉が本物であることを判断でき、最初の 3 つが最も正確でした。 しかし、ChatGPT は、その応答によってこれらの検出アプリのほとんどを騙してしまいました。 まず、Writer AI Content Detector アプリでは 99% が人間であると評価され、GPT ベースの検出器ではわずか 36% が偽物とマークされました。 GLTR が最大の犯罪者で、私自身の言葉も ChatGPT の言葉と同じように人間によって書かれた可能性が高いと主張しました。

Write AI Detector を使用して出力します。

しかし、もう一度試してみることにしました。すると、今度はレスポンスが大幅に改善されました。 私は ChatGPT に、金粒子を使用した曇り止めに関するスイス連邦工科大学の研究の概要を提供するよう依頼しました。 この例では、検出アプリは私自身の応答を承認し、ChatGPT を検出するという点ではるかに優れた仕事をしました。

私の本当の書き込み チャットGPT
GPT-2 出力検出器 9.28% 偽物 99.97%偽物
ライターAI 95%は人間 2%人間
大規模なコンテンツ 92%が人間 0% (明らかに AI)
GPTゼロ 41 困惑 23 困惑
GLTR 79 語中 15 語が人間によるものである可能性が高い 98 語中 4 語が人間によるものである可能性が高い

上位 3 つのテストは、この応答においてその強さを実際に示しました。 そして、GLTR はまだ私自身の文章を人間として見るのに苦労していましたが、少なくとも今回は ChatGPT をうまくキャッチしました。

閉鎖

各クエリの結果から、オンライン盗作検出器が完璧ではないことは明らかです。 より複雑な回答や文章の場合 (2 番目のプロンプトの場合など)、少し簡単です。 これらのアプリは AI ベースの書き込みを検出できますが、単純な応答を検出するのははるかに困難です。 推測します。 しかし、明らかに、それは信頼できるものとは言えません。 場合によっては、これらの検出ツールが記事やエッセイを ChatGPT によって生成されたものとして誤分類することがあります。これは、不正行為者を捕まえるためにこれらの検出ツールに依存したいと考えている教師や編集者にとっては問題です。

開発者は精度と誤検知率を常に微調整していますが、同時に、 GPT-3 は、GPT-2 よりも大幅に改善されたデータセットとより複雑な機能を宣伝しています (ChatGPT がトレーニングされています) から)。

現時点では、AI によって生成されたコンテンツを識別するために、編集者と教育者は、これらの AI 検出器の 1 つ (または複数) を使用して、賢明さと少しの人間の直感を組み合わせる必要があります。 また、Chatsonic、ChatGPT、Notion、YouChat などのチャットボットを使用している、または使用しようとしているチャットボット ユーザーは、自分の「作品」を正当なものとして伝えることはやめてください。 ボットによって作成されたコンテンツ (データベース内の固定ソースをソースとする) を再利用することは、どう考えても盗作です。

編集者のおすすめ

  • Google Bard は話せるようになりましたが、ChatGPT をかき消すことができるでしょうか?
  • ChatGPT: 最新のニュース、論争、知っておくべきヒント
  • ChatGPT の Bing ブラウジング機能がペイウォール アクセスの欠陥により無効になる
  • 81% が ChatGPT はセキュリティ リスクであると考えていることが調査で判明
  • Apple の ChatGPT ライバルが自動的にコードを作成する可能性がある

ライフスタイルをアップグレードするDigital Trends は、読者が最新ニュース、楽しい製品レビュー、洞察力に富んだ社説、ユニークなスニーク ピークをすべて提供して、ペースの速いテクノロジーの世界を監視するのに役立ちます。