1 年前、GitHub/Microsoft は、AI のおかげでコードを自動補完して生成できるツールを世界に発表しました。これは GitHub Copilot と名付けられましたが、数日前には商用化される無料のテスト段階ではなくなりました。しかし、ビジネス モデルを超えて、Copilot は昨年、法的な理由から多くの話題をさらってきました…
…なぜなら、以前に「提供」された人々によって以前に作成されたコードに基づいて新しいコードを生成することにより、他の人々の作業から関連するコードの断片が繰り返される可能性が飛躍的に増加し、その結果、多数のソフトウェア プロジェクトがライセンスの危険にさらされることになるからです。コンプライアンスの問題。
「Linux for M1」の作成者がこの件について意見を述べる
ASAHI Linux ( M1 Mac にインストール可能な GNU/Linux ディストリビューション) の開発責任者である Hector Martin 氏は、ニューラル ネットワーク、著作権、ソース コードの関係についてTwitter スレッドで意見を表明しました。
「ニューラルネットワークは、人工的であれ生物学的であれ、著作権を消去しません。私がソースコードを読んで同一または非常に類似したソースコードを書いた場合、それはオリジナルの二次的著作物になります。GitHub Copilotについても同様です。」
マーティン氏は、不用意な著作権侵害を避けるため、Appleのコードにアクセスした者とアサヒ社とのコラボレーションに拒否権を発動することを好むが、自身の立場は「物議を醸すべきではない」と述べている。その標準に違反するコードを受け入れるには「多大な信頼」が必要であるということ。
「マイクロソフトは、考えることができず、著作権という生来の概念を持たず、真の創造性を発揮できず、ユーザーに対する道徳的責任を持たないニューラル ネットワークを信頼するよう求めています。マイクロソフト自身も理解していないニューラル ネットワークです。
ありがとう、いや、ありがとう。」
Martin 氏は、Copilot の使用を、「著作権によって保護され、異種ライセンスの下で」既存のコードをランダムに組み合わせるロシアン ルーレットの使用と同等だと考えています。 Microsoft は、次の 2 つの方法で、Copilot がすでにライセンスを取得したコードを吐き出すのを防ぐことができたはずです。
-
AI に著作権規制を理解して適用するよう教え込み、著作権で保護されたコード フラグメントの検出 (および拒否) が非常に高い成功率であることを示す具体的な数字を入手します。 「 『私たちを信頼してください』だけでは十分ではありません。」
-
「著作権で保護された要素を除いてオリジナルの作品の『機能』を抽出するある種の埋め込みモデルのおかげで、オリジナルの作品のみを確実に生成できる「魔法の」ニューラル ネットワークを開発しています。彼らがどのようにそれを行うのか見てみたいと思っています。」
「Copilot が著作権で保護されたコードを適切な割合で生成している例が 1 つでも見つかった場合、それは、Copilot がサービスとして、また Microsoft がその作成方法として、大規模な著作権侵害を構成する十分な証拠であると私は考えています。」
そして Martin 氏自身は、Copilot がコードの商用利用を許可しないオリジナルからコピーした行を事実上生成したという事件へのリンクを担当しています。ツイートの投稿者は、オリジナルのコードを自分で入力したため、このことをよく知っています。
有料サービスである github copilot を調査し、制限付きライセンスを使用してリポジトリからコードをエンコードするかどうかを確認しました。
以前の雇用主で書いた、無料ゲームのみに使用を許可し、ライセンスの添付を必要とするライセンスを持つコードが含まれているかどうかを確認しました。
はい、そうですpic.twitter.com/JMbXNgOF3Z— クリス・グリーン (@ChrisGr93091552) 2022年6月22日
