最近、メディアやネットワークで最も話題になっている OpenAI に関連したトピックが 2 つあります (傍観者のイーロン・マスクとの対立)。1 つは、ビデオ生成のための新しい驚くべき AI モデル( Sora ) です。その一方で、後に AI モデルのトレーニングに使用されるデータセットを完成させるために著作権で保護された素材を使用したことをめぐる法的論争があります。
さて、この場合、私たちが皆さんにお届けするニュースは 2 つで 1 です。OpenAI のテクニカル ディレクターであるミラ ムラティ氏とのウォール街でのインタビューで、すでに述べた同社の悪い慣行に関する懸念が明らかになりました。ジャーナリストの質問の 1 つに対して、すでにメディアの嵐が巻き起こっています。
質問は非常に単純で、OpenAIがSoraをトレーニングするためにYouTube、Facebook、Instagramなどのプラットフォームからの公開ビデオを使用したかどうかを問うものであったが、これについてムラティ氏は明確に肯定も否定もしていない。 「よくわかりません」と彼女は言い、後に「私たちは公開されているデータとライセンスされたデータを使用している」と述べた。
具体的な情報が欠如しており(同社の「技術」ディレクターの信頼できる知識の欠如に基づく)、憶測を煽るだけだった。
そして、一部の指摘があるように、Sora が YouTube 動画でトレーニングされていたとしたら、所有者が YouTube から削除してから何年も経っても、Sora でのコンテンツ生成中に自分の動画のパターンや断片がどのように再現されるかを何百万ものユーザーが確認できることを意味します。ネットワーク。
一方で、OpenAI が自社のデータ ソースの詳細を完全に明らかにすることに消極的であるのは、生成 AI の分野に限ったことではありません。著作権やコンテンツの倫理的使用に関する透明性の要求が高まるほど、その傾向はより広範囲に及ぶようです。そういった詳細は非公開にする傾向にあります。
今年はSoraを使えるようになります。朗報です!
したがって、Murati 氏は、データセットの起源に関する議論ではなく、良いニュースに一般の注目を集めたいと考えていました。それは、 OpenAI が Sora を今年を通じて一般公開するという発表です(彼は、「数年内に公開される予定だ」と述べています)。 months” ですが、正確な日付は指定していません)、現在の関数だけでそうするわけではありません…
…ただし、プロンプトを使用したコンテンツの事後編集などの新機能も実装します。ビデオクリップに付随するオーディオを生成する可能性など、他の待望の対策も現在取り組んでいるトピックですが、最初は実装されないでしょう。

