This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
大手AI企業にこのように「盗まれる」ままにしておくと、無料のWebサイトが表示されなくなるかもしれません
出典: 悪いレビュー
数日前、Googleは突然プライバシーポリシーを更新し、インターネット上のすべての公開データを使用して独自のAIモデルをトレーニングすることを明らかにした。
OpenAIがデータ侵害で訴えられてから間もなく、Googleは急いで攻撃を開始した。
ChatGPTが普及して以来、この問題は絶えることがありません。
Shichao が最初にタイムラインの概要を説明します。
今年3月、マスク氏は先頭に立ってデータ料金の先制攻撃を開始し、TwitterのAPIインターフェースはもはや無料ではないと宣言した。
先月、Reddit の「ブラックアウト」キャンペーンは、公式の API 料金ポリシーに対する抗議でした。
この期間中、Twitterはレート制限を再度調整し、認証にお金を費やさないアカウントは1日あたり600件の投稿しか読むことができません。これはロボットがユーザーデータを取得するのを防ぐためでもあります。
シーチャオは、やはり**AIのせいだと感じました。 **
現在、大規模なモデルを作成できる人は、Baidu、Ali、Tencent などの独自のデータを持っているか、他の人のデータをクロールしているかのどちらかです (ここでは OpenAI と呼ばれています)。
多くの Web サイトにはオープンで無料の API インターフェイスがあるため、Microsoft や OpenAI などの大手企業にチャンスが与えられています。
RedditのCEOホフマンでさえ、巨人に無料でデータを提供したくないだけだと明言した。
しかし、今回この法律がOpenAIの側に立つかどうかは分からない。
**1. データ クローラー自体の動作は合法ですか? **
**2. データは著作権で保護されていますか? **
**3. データから生成された作品は著作権で保護されていますか? **
まず、最初のデータを取得するということですが、これはお金を払って購入したり、インターネット上で公開されているデータを収集したりすることに他なりません。
ただし、公開データは許可された使用と同等ではないことに注意してください。また、Web サイトにデータ クローラーの動作を制限する関連条項があるかどうかにも依存します。
2つ目は、データ自体が著作権の対象であるかどうかについてです。
米国の著作権法によれば、AIモデルのトレーニングに使用されるデータが「フェアユース」の範囲内にある場合、著作権侵害にはならないとされている。
しかし、問題はこの「フェアユース」にあります。
ニュースレポートや学術研究と同様、適切な引用はまったく問題ありません。
AI モデルや商用化された AI ソフトウェアにおける数億レベルのデータ使用は、依然として「フェアユース」としてカウントされますか?
最後に、AI 生成された作品の著作権の問題があります。
学習データの著作権は明確ではないため、AIが生成したコンテンツには当然著作権紛争が発生します。数日前、Steam も著作権上の問題があるという理由で、AIGC を使用して生成されたゲームを削除しました。
トレーニングデータは他人のものであるため、米国著作権局は、AIによって生成された作品は著作権法で保護されず、著作権を侵害する可能性さえあると判断した。
日本の法律はAIの学習に使われたデータの著作権を保護していないとして、日本政府の態度は大きく異なっている。
▼OpenAI訴訟文書
もちろん、この問題はプラットフォームにとって新たな金儲けの方法であり、テクノロジー大手がどれほど悪かろうと、彼らはより多くの資金を投じるだろう。
当時、Wikipedia や Twitter など、オープン共有の遺伝子を持ったインターネットが誕生し、API インターフェイスが一年中無料で提供され、開発者にとってデータの呼び出しが非常に便利になりました。
結局のところ、小規模な開発者には莫大なデータ料金を支払う能力はありません。イノベーションが巨大企業でのみ発生するのであれば、これは純粋な独占ではないでしょうか?
最も重要なことは、現在無料で閲覧できる多くの Web サイトは、後で閲覧する必要がある可能性があるということであり、これは私たちのような一般ユーザーにとって非常に重要です。
したがって、鍵となるのは、いつ監督という大槌が下されるかである。
データの著作権の明確化はAIの発展において避けては通れないハードルであり、今やインターネットの今後の方向性にも関わってきそうです。
AI船は私たちをよりオープンな時代、あるいはクローズドな時代へと押し進めるのだろうか?