ゼファーネットのロゴ

AI NeMo Megatron の著作権をめぐって著者が Nvidia を訴える

日付:

3人の著者が、AIプラットフォームNeMo Megatronをトレーニングするために著作権で保護された作品を許可なく使用したとして、半導体製造大手Nvidiaを訴えた。

著者らの主張によれば、2022年にリリースされたNvidiaのNeMo Megatron-GPTは「同意、クレジット、補償なしに彼らの書籍をコピーし、引用している」という。

現在、筆記者らは、過去3年間にニモの訓練に著作物が使用された人々に対して「不特定の損害賠償」を求めている。

これは、同意なしにインターネットからスクラップされた情報を使用してモデルをトレーニングしたとして、AI企業に対する著作権侵害の申し立てをめぐる他の訴訟リストに加わることになる。

何十万冊もの本が使われている

著者のブライアン・キーン氏、アブディ・ナゼミアン氏、スチュワート・オナン氏は、自分たちの作品が、NvidiaのNeMo AIプラットフォームを訓練して通常の書き言葉をシミュレートするために使用された約196,640冊の書籍のデータセットの一部であると主張している。

による ロイター通信社、彼らは、これは10月に削除される前だったと述べた。 著作権侵害に設立された地域オフィスに加えて、さらにローカルカスタマーサポートを提供できるようになります。」

著者らは提出書類の中で、Nvidiaの削除はNeMoのトレーニング時に作家の著作権を侵害したことを認めた表れであるとも述べた。

金曜日にサンフランシスコで起こされたこの訴訟は、キーンの2008年の小説『ゴースト・ウォーク』、ナゼミアンが2019年に執筆した『ライク・ア・ラブ・ストーリー』、オナンの2007年の小説『ロブスターでの昨夜』を対象としている。

「トレーニング中に、LLM はトレーニング データセット内の各テキスト作品をコピーして取り込み、そこから保護された表現を抽出します。」 読み込み 苦情の一部。

による フォックスビジネス、著者らは訴訟の中で、書籍は「Books3」と呼ばれる書籍のコレクションを含む「The Pile」として知られるデータの中にあったと述べています。しかし、Nvidia は自社の NeMo Megatron AI モデルを「The Pile と XNUMX 冊の本」に基づいてトレーニングしたことを認めました。

パイルの本3

による PCMag, NeMo Megatron を訓練するために使用された Pile – は 800 GB のデータで構成されています。著者らの訴訟で述べられているように、これには108GBの書籍が含まれる。

その書籍コンポーネントは「Books3」と呼ばれ、「Bibliotik」には 196,000 冊を超える書籍が含まれており、これには XNUMX 人の著者の書籍が含まれます。

著者が述べているように、Pile's Books3 は ハグ顔 昨年10月に「著作権侵害が報告されているため、廃止されアクセスできなくなった」というメッセージとともにデータセットが削除されるまでは。

また、お読みください。 LLM がラップトップに登場: Nvidia と HP の CEO が AI PC を祝う

増加する作家による訴訟

しかし、NVIDIAの広報担当者は、チップメーカーは法律や規制を遵守していると述べた。

「私たちはすべてのコンテンツ作成者の権利を尊重しており、著作権法を完全に遵守してNeMoを作成したと信じています」と広報担当者は電子メールでPCMagに語った。

今回の訴訟により、作家や出版社による増え続ける訴訟リストにNVIDIAが加わった。

Nvidia は、自社の AI プラットフォーム NeMo を「生成 AI を導入するための迅速かつ手頃な方法」であると宣伝しています。生成 AI は、散文を作成し、歌詞を作成し、画像やビデオを作成し、詩を書くことができるテクノロジーです。

訴訟を戦っている AI 企業は Nvidia だけではありません。チャットGPTメーカー OpenAI マイクロソフトとその支援者は保留中 著作権訴訟 ニューヨーク・タイムズ。

しかし、それだけではありません。最近では、アーティストも登場し、生成 AI 画像作成者による懸念を表明しています。 ミッドジャーニー はまた、「彼らの独自のスタイルを使用して、彼らの同意なしに自分たちの作品から抜粋した成果物を作成しており、それは非人間的で失礼であると呼んでいます」。

スポット画像

最新のインテリジェンス

スポット画像