ゼファーネットのロゴ

裁判所、OpenAIに対する著者らの著作権侵害の申し立てを却下

日付:

オープンナイのロゴ

オープンナイのロゴここ数カ月間、あらゆる権利者がAIモデルを開発する企業に対して訴訟を起こしている。

リストにはレコードレーベル、個人作家、ビジュアルアーティスト、さらにはニューヨークタイムズまでが含まれている。これらの権利所有者は全員、適切な補償なしで自分たちの著作物が使用されるとみなされることに反対しています。

いくつかの 訴訟 書籍の著者によって提出されたファイルには著作権侵害の要素が含まれています。訴訟では、以下を含むテクノロジー企業が主張している。 Meta と OpenAI は、 物議を醸す Books3 データセット モデルをトレーニングするためです。

Books3 データセットは、2020 年に「海賊版」サイト Bibliotik のライブラリをスクレイピングした AI 研究者の Shawn Presser によって作成されました。全体的なビジョンは、195,000 冊を超える書籍の平文コレクション (サイズは約 37 GB) が、AI 愛好家がより良いモデルを構築するのに役立つ可能性があるということでした。

そのビジョンは間違っていませんでした。大規模なテキスト アーカイブは大規模言語モデルの優れたトレーニング資料ですが、多くの著者は自分の作品が許可や補償なしでこのような方法で使用されることを認めていません。

著者スー、OpenAI が応答

起こされた訴訟では 昨年6月、著者のポール・トレンブレイ氏とモナ・アワド氏は、OpenAIを直接的および代理著作権侵害などで告発した。そのすぐ後に、作家兼コメディアンのサラ・シルバーマンが作家のクリストファー・ゴールデンとリチャード・カドリーと同じスーツでチームを組んだ。

訴状では、著者の書籍は海賊版サイトから入手したと主張している。彼らは特に、物議を醸している Books3 データセットや、LibGen、Z-Library、Sci-Hub などの他のシャドウ ライブラリのデータについて言及しています。

「これらのウェブサイトに集められた書籍は、トレント システム経由で大量に入手することもできます。 これらの著しく違法なシャドウ ライブラリは、AI トレーニング コミュニティの長い間関心を集めてきました...」と著者らは書いています。

OpenAIはこれらの申し立てを直接否定はしなかったが、それでもAIをトレーニングするために書籍を使用することは著作権の代理侵害やDMCA違反に当たるという点には同意しなかった。

却下する動議, OpenAIはカリフォルニア州連邦裁判所に対し、訴訟の範囲を「縮小」するよう求めた。生き残れる唯一の申し立ては直接的な著作権侵害だが、OpenAIは後の段階でこれを破棄できると予想していると述べた。

裁判所は著作権とDMCAの請求を却下

カリフォルニア州地方判事のアラセリ・マルティネス・オルギン氏は、双方からの意見を検討した後、この件について判決を下した。彼女の命令では、彼女は主に OpenAI の側に立っている。

OpenAI のモデルによって生成されたすべての出力が二次的著作物とみなされることに裁判所が同意していないため、著作権侵害の代理侵害の申し立ては失敗します。生き残るためには、侵害の主張をより具体的にする必要があります。

「『OpenAI言語モデルのすべての出力は侵害する二次的著作物である』という原告らの主張は不十分である。原告は、その成果物が何を意味するのか説明しておらず、特定の成果物が彼らの書籍と実質的に類似している、またはまったく類似していると主張していません」と命令書には書かれている。

実質上

著者らは、著作権侵害に加えて、著作権管理情報(CMI)を意図的に変更することでOpenAIがDMCAに違反したと非難した。タイトル、著者、著作権所有者などの詳細は、侵害を「可能にする」または「隠す」ために削除されたと言われています。

マルティネス・オルギン判事は、この著作権情報が意図的に削除されたという証拠はないとしている。そして、たとえこれらの申し立てが真実だったとしても、それが邪悪な理由で行われたという証拠はありません。

「原告らは、OpenAI が ChatGPT のトレーニングにどのインターネット書籍を使用したかを明らかにしなかったことは、ChatGPT ユーザーは出力が侵害しているかどうか分からないため、OpenAI が故意に侵害を可能にしたことを示していると主張している。

「しかし、原告らは、そのような情報を明らかにしないことが、内部データベースからCMIを削除した疑いが意図的に侵害を可能にするかどうかに影響を与えることを示唆する判例を何も指摘していない。」

著者らはさらに、OpenAI が CMI なしで作品を配布しており、これも DMCA に違反すると主張しました。 OpenAIは書籍の完全なコピーを配布していないため、この議論も失敗すると裁判所は判決した。

「代わりに、[著者らは]、そのような出力が何を伴うか、つまり、著作権で保護された書籍であるか書籍のコピーであるかについては何も示さずに、『OpenAI言語モデルからのすべての出力は侵害的な二次的著作物である』と主張しました。」命令はこう書いてあります。

直接的な著作権侵害の申し立てが残る

マルティネス・オルギン判事は、著作権代理侵害とDMCA違反に加えて、カリフォルニア州不正競争法も棄却した(UCL)「不法な商行為」、「詐欺行為」、「過失」、「不当利得」に対する申し立て。 「不公平な行為」に対するUCLの申し立ては続行される可能性がある。

これで法廷闘争は終わったわけではない。著者らは、却下された請求を続行したい場合、欠陥を修正するために修正請求を提出する機会があります。

最後に、直接的な著作権侵害の申し立てはOpenAIの却下申し立ての対象ではなかったので、これも同様に前進することになることを繰り返し述べておく価値がある。他の多くの AI 著作権訴訟も同様です。

-

カリフォルニア州地方裁判官アラセリ・マルティネス・オルギンの申し立て却下命令のコピーが入手可能です こちら(pdf).

スポット画像

最新のインテリジェンス

スポット画像