ホーム AI GPT-4 は著作権で保護されたコンテンツを公然と提供します。他の AI ははるかにうまく隠蔽します: この研究の結論

GPT-4 は著作権で保護されたコンテンツを公然と提供します。他の AI ははるかにうまく隠蔽します: この研究の結論

パトロナス AI が水曜日に発表した調査では、著作権の尊重を明らかにするために、現在最も使用されている 4 つの人工知能ツールについて広範な分析が行われました

この会社は元メタ研究者によって設立され、大規模言語モデル (生成 AI 製品の背後にあるテクノロジー) の分析を専門としています。さらに、同スタジオは、著作権侵害を捕捉するために特別に作られた新しいツール CopyrightCatcher の立ち上げを計画しました。

Patronus AI は、広く使用されている 4 つの AI モデルが、著作権で保護されたテキストを使用してユーザーのクエリに応答する頻度を調べることができました。テストした 4 つのモデルは、 OpenAI の GPT-4 、Anthropic のClaude 2 、 Meta の LLaMA 2 、および Mistral AI のMixtralでした。

パトロナス AI の共同創設者兼最高技術責任者 (CTO) であるレベッカ シアン氏は、「 オープンソースかクローズドソースかにかかわらず、評価したすべてのモデルにおいて、実質的に著作権で保護されたコンテンツが全面的に見つかりました。以前はメタ社の AI 担当研究部門で働いていました ( 2023 年 11 月に、 Meta は人工知能倫理チームを解雇しました。これはMicrosoft などの他の企業も同様です)。

OpenAI の GPT-4 は保護されたコンテンツを多く使用します

OpenAI には、著作権で保護されたコンテンツの使用に関して多くのオープンな面があることを覚えておく必要があります。 New York Times はMicrosoft と OpenAI に対して自社の情報を許可なく使用したとして訴訟を起こしており、訴状の中で ChatGPT を非常に批判している。ジョージ・R・R・マーティンと他の作家も、 彼らの作品を許可なくコピーしたとしてOpenAIを訴えた。

Patronus AI は、OpenAI の GPT-4 がテストで構築したプロンプトの 44% で著作権で保護されたコンテンツを生成したことを確認しました。パトロナスは、カタログ Web サイト Goodreads から人気のあるタイトルを選択し、米国の著作権で保護された書籍を使用してモデルのみをテストしました

研究の結論によれば、OpenAI の GPT-4 は最も慎重ではありません。特定の本の本文を完成させるように求められたとき、彼は 60% の確率でそうし、求められた回の約 4 回に 1 回は本の最初の章を見せました。

Anthropic の Claude 2 は騙すのがより困難であることが判明し、本の本文を完成させるよう求められた場合、著作権で保護されたコンテンツを使用した回答は 16% のみでした。クロード 2 号は、本の最初の章を見せてほしいと頼まれたとき、自分は「著作権で保護された本にアクセスできない AI アシスタント」であると主張して、決して申し出ませんでした。

一方、ミストラル社のミストラルモデルは、本の最初の章を提供することにはほとんどの場合消極的だが、求められた場合は10回に4回近くそうしている。あなたが彼に本の一部を完成させるように指示したとしても、彼がそれを実行したのは 6% のケースだけでした。

Meta の LLaMA 2 は、指摘事項の 10% と前述の 2 つのケースにおいて、著作権で保護されたコンテンツで対応しました

「本当にびっくりですよ」

パトロナスより AI は、「すべての言語モデルが著作権で保護されたコンテンツをそのまま生成しているという事実は、本当に驚くべきことです」と述べています。

パトロナス AI の共同創設者兼 CEO であるアナンド・カナッパン氏は、以前は Meta Reality Labs で説明可能な AI に取り組んでいたが、Meta のような企業が提供するこれらのソフトウェア ツールを統合し始めたとき、「これが比較的簡単に実現できるとは思っていなかった」と感じていると述べています。このように一語一語コンテンツを作成するのは簡単です。」

パトロナス AI が水曜日に発表した調査では、著作権の尊重を明らかにするために、現在最も使用されている 4 つの人工知能ツールについて広範な分析が行われました

この会社は元メタ研究者によって設立され、大規模言語モデル (生成 AI 製品の背後にあるテクノロジー) の分析を専門としています。さらに、同スタジオは、著作権侵害を捕捉するために特別に作られた新しいツール CopyrightCatcher の立ち上げを計画しました。

Patronus AI は、広く使用されている 4 つの AI モデルが、著作権で保護されたテキストを使用してユーザーのクエリに応答する頻度を調べることができました。テストした 4 つのモデルは、 OpenAI の GPT-4 、Anthropic のClaude 2 、 Meta の LLaMA 2 、および Mistral AI のMixtralでした。

パトロナス AI の共同創設者兼最高技術責任者 (CTO) であるレベッカ シアン氏は、「 オープンソースかクローズドソースかにかかわらず、評価したすべてのモデルにおいて、実質的に著作権で保護されたコンテンツが全面的に見つかりました。以前はメタ社の AI 担当研究部門で働いていました ( 2023 年 11 月に、 Meta は人工知能倫理チームを解雇しました。これはMicrosoft などの他の企業も同様です)。

OpenAI の GPT-4 は保護されたコンテンツを多く使用します

OpenAI には、著作権で保護されたコンテンツの使用に関して多くのオープンな面があることを覚えておく必要があります。 New York Times はMicrosoft と OpenAI に対して自社の情報を許可なく使用したとして訴訟を起こしており、訴状の中で ChatGPT を非常に批判している。ジョージ・R・R・マーティンと他の作家も、 彼らの作品を許可なくコピーしたとしてOpenAIを訴えた。

Patronus AI は、OpenAI の GPT-4 がテストで構築したプロンプトの 44% で著作権で保護されたコンテンツを生成したことを確認しました。パトロナスは、カタログ Web サイト Goodreads から人気のあるタイトルを選択し、米国の著作権で保護された書籍を使用してモデルのみをテストしました

研究の結論によれば、OpenAI の GPT-4 は最も慎重ではありません。特定の本の本文を完成させるように求められたとき、彼は 60% の確率でそうし、求められた回の約 4 回に 1 回は本の最初の章を見せました。

Anthropic の Claude 2 は騙すのがより困難であることが判明し、本の本文を完成させるよう求められた場合、著作権で保護されたコンテンツを使用した回答は 16% のみでした。クロード 2 号は、本の最初の章を見せてほしいと頼まれたとき、自分は「著作権で保護された本にアクセスできない AI アシスタント」であると主張して、決して申し出ませんでした。

一方、ミストラル社のミストラルモデルは、本の最初の章を提供することにはほとんどの場合消極的だが、求められた場合は10回に4回近くそうしている。あなたが彼に本の一部を完成させるように指示したとしても、彼がそれを実行したのは 6% のケースだけでした。

Meta の LLaMA 2 は、指摘事項の 10% と前述の 2 つのケースにおいて、著作権で保護されたコンテンツで対応しました

「本当にびっくりですよ」

パトロナスより AI は、「すべての言語モデルが著作権で保護されたコンテンツをそのまま生成しているという事実は、本当に驚くべきことです」と述べています。

パトロナス AI の共同創設者兼 CEO であるアナンド・カナッパン氏は、以前は Meta Reality Labs で説明可能な AI に取り組んでいたが、Meta のような企業が提供するこれらのソフトウェア ツールを統合し始めたとき、「これが比較的簡単に実現できるとは思っていなかった」と感じていると述べています。このように一語一語コンテンツを作成するのは簡単です。」

最新記事一覧