マスク氏はOpenAIに厳しく、ユーザーは不運に見舞われる

出典: Alphabet List、著者: Bi Andi、編集者: Wang Jing

画像ソース: Unbounded AI によって生成‌

ソーシャルメディアがユーザーの滞在時間を長くさせようとしているという話は聞いたことがあるが、率先して人数に上限を設けるという話は聞いたことがない。今、目を開けてください、イーロン・マスクはすべてのTwitterユーザーに「軽度の保護」を追加しています、そしてこれはすべてAIによって実際に強制されているのでしょうか?

現在、Twitter ユーザーが毎日閲覧できるツイートの最大数は、手の速さや夜更かしのしなさには依存しませんが、明確な数字があります: 認証済み (つまり、有料の「Bluebird」サービス) アカウントが 10,000、未認証アカウントが 10,000アカウントは 1000 ありますが、新規登録された未認証アカウントは 500 のみです。

これは、怒っているユーザーに直面して、マスク氏が二度引き上げた基準だ。理由については「極端なレベルのデータスクレイピングとシステム操作に対処するため」だという。

彼は、モデルをトレーニングするために大量のデータを必要とする AI 企業について言及していました。マスク氏は昨年12月にOpenAIとのデータ接続を遮断し、今年4月にはツイッターのデータを違法に使用したとしてマイクロソフトを非難した。

マスク氏がデータスクレイピングを阻止するために積極的な措置を講じているため、OpenAIは集団訴訟に直面している。この訴訟の原告は16人で、全員が個人、つまり一般のインターネットサーファーだ。彼らは、OpenAIがChatGPTを訓練するために許可なく「インターネットから3000億語をこっそり収集」し、そのインターネットユーザーから「膨大な量の個人情報」を盗んだと非難している。

一方には、長年にわたって大量の UGC コンテンツを蓄積してきたインターネット ユーザーとプラットフォームがあり、もう一方には新興 AIGC 企業があり、データ キャプチャとプライバシー セキュリティをめぐる戦争が始まっています。

##01

鉦と太鼓をたたきます。ようやく週末になったものの、「レート制限」を超え、Twitterのルールに違反し、ツイートの閲覧数が多すぎることを警告するエラーメッセージが画面に表示され、Twitterユーザーは唖然とした。

これが何を意味するのか人々はまったく知りませんでしたが、Twitter の責任者であるマスク氏は前に出てレート制限が実際にあると述べ、次のように発表しました: 極端なレベルのデータ スクレイピングとシステム操作を解決するために、検証済み、未検証、および新規登録は制限されています。認証済みアカウントのツイート数は 1 日あたり 6000、600、300 に制限されています。

これに先立ち、マスク氏はTwitterがログインしていないユーザーによるコンテンツの閲覧を禁止すると発表したばかりだが、これはユーザーにとっては容認されたものだった。この制限は実際に厳しく課され、ユーザーは身動きができなくなり、認証と非認証の違いを見て眉をひそめました。もしかして、このトリックを「青い鳥の定期購読」を宣伝するために利用しようとしているのでしょうか?コメント欄には複数のユーザーが「勝つためにはお金を使わなければならないのか?」とコメントした。

不満の声は大きく、Twitterの競合製品であるHive、Mastodon、Tumblrなどが話題に登場し、Twitterの墓石のミームが広く使われている。論争中、マスク氏は基準を認証済みユーザーによるビュー10,000回と未認証ユーザーによるビュー1,000回に2回引き上げた。

マスク氏の偽アカウントの1つは、「ツイッター中毒者たちは抜け出す必要があるので、制限を設けた。私は世界のために良いことをしている」と冗談を言った。このような価値を高める考えは良いことであり、マスク氏の相槌は再投稿ですが、別途「友達や家族を訪ねてください」というメッセージも送っています。

しかし冗談は冗談で、マスク氏はデータクローリングへの対処という「テスト」について明確に説明した。ユーザーの不満も、データクローリングの問題ではなく、電流制限方法が有効かどうかにあります。

AIスタートアップが「データを収集」するためにTwitterにやってくることはどれほど深刻なのだろうか?マスク氏はツイートの中で、トラフィックの急増によりTwitterはバックアップサーバーの稼働を余儀なくされたと述べ、「途方もなく高い評価を得ている一部のAIスタートアップを支援するためだけに、緊急時に多数のオンラインサーバーを稼働させるのは多すぎる」と述べた。 。」

現在の制限嵐の前日に、エピック・ゲームズのCEOティム・スウィーニー氏もツイッターでも壁を築いているとツイートし、マスク氏は「数百(あるいはそれ以上)のブロックが非常に積極的にツイートをクロールしている。特別なデータは、 」

先ほどまで文句を言い続けていたティム氏は、Twitterの利用規約にデータクロールの禁止を追加すること、情報セキュリティエンジニアリングでプラットフォームを保護すること、Twitterを悪用する企業に対して大規模な法的措置を講じることなど、すぐさま重大な提案を行った。

注目すべきは、マスク氏が返答の中で、データを盗んだ者に対して「絶対に」法的措置が取られるだろうと述べ、「(楽観的に)今から2~3年後、法廷で会うのを楽しみにしている」と述べたことだ。

「有料サブスクリプションに薪を追加する」という推測が悪人の心であるかどうかに関係なく、ユーザーのプライバシーの旗を高く掲げているマスク氏は多かれ少なかれ利己的である可能性があります。 4月、マスク氏はChatGPTと戦うために新しい人工知能企業X.AIを設立すると噂された。本当に大規模な言語モデルをトレーニングしたい場合、Twitter のユーザー データはもちろん自分自身だけのものです。

いずれにせよ、プラットフォームの流れを積極的に制限することは可能であり、マスク氏はAIスタートアップと最後まで戦う準備ができている。

##02

**マスクがプラットフォーム全体の流れを制限するために攻撃していたとき、この AICG ブームの「仕掛け人」であり、ChatGPT の作成者である OpenAI が集団訴訟に巻き込まれました。 **

この訴訟はカリフォルニア北部地区連邦地方裁判所で開始され、原告は16名、全員匿名、全員個人であった。訴状は全157ページに及ぶ非常に長いもので、スティーブン・ホーキング博士の「強力な人工知能の台頭は、人類史上最高のことか、最悪のことかのどちらかだ」という一文で始まる。数百億ドルを注入したマイクロソフト。

主な主張は、ChatGPT が「テクノロジーのトレーニング」のためにインターネットから収集したデータを使用した際に、「無数の人々の著作権とプライバシー」を侵害したということです。

起訴状によると、OpenAIはプライバシー法に違反してインターネットから3000億語を秘密裏に収集し、「同意なく取得した個人情報を含む書籍、記事、ウェブサイト、投稿」を盗聴したという。 OpenAI はソーシャル メディアのデータを含む大量のネットワーク データをクロールすると述べました。

また、OpenAI には、Reddit の投稿やリンク先の Web サイトから取得したデータを含む、膨大な量の個人データを蓄積した独自の AI コーパスがあるとも指摘しています。

これはトレーニングモデルの観点からの告発であり、原告はさらに、ユーザーによるOpenAI製品とのやりとりや製品内の個人情報もOpenAIによって大規模に不正アクセスされ、悪用されたと主張した。

OpenAIが米国で集団訴訟に直面したのはこれが初めてではない。昨年11月、Githubのプログラマーらは、OpenAIがオープンソースライセンスに違反し、提供されたコードを独自のAIツールGitHub Copilotのトレーニングに使用した疑いで、Github、OpenAI、Microsoftに対する集団訴訟を起こした。

当時はまだChatGPTがオンライン化されておらず、今振り返るとAI学習の問題が露呈した時期でした。現在、最新の集団訴訟は ChatGPT を対象としているが、ChatGPT にはより広範囲のユーザーがおり、侵害された人々の範囲も広い (基本的にはすべての被害者)。 。

この訴訟を代理する公益法律事務所クラークソン氏は声明で、この集団訴訟は「画期的な」連邦訴訟であり、人工知能全体に対する警告であると述べた。

この観点から見ると、OpenAIの肩の荷は確かに重い。

**OpenAI は、データ キャプチャとプライバシー セキュリティが原因ですでに多くのトラブルに遭遇しています (プラットフォームがロックされ、ユーザー同士が敵対するなど)。これらは氷山の一角にすぎません。 **

欧州ではOpenAIが多くの国で調査されており、今年4月にもイタリアはChatGPTが欧州のデータ保護法に違反するのではないかと懸念し、一時的にChatGPTを禁止した。

人工知能の分野全体の規制が進んでいます。フランスは5月に人工知能行動計画を発表しており、その中でAIGCに関してフランスのプライバシー規制当局は、インターネットからデータを収集し、大規模な言語モデルをトレーニングするためのデータセットを構築する一部のAIモデルの実践に特別な注意を払っている。

最も重要なのは欧州連合人工知能規制法(EU AI法)で、現在最終段階にある。この法案は世界的なAIガバナンスのモデルとなる可能性が高い。

##03

**プラットフォーム、ユーザー、監視の3つの勢力が包囲網を形成し、AIGCのルールをできるだけ早く確立し、大規模なモデルトレーニングの出発点から始めることを誓っています。 **

一方で、時間がなくなりつつあり、AIGC の発展は急速に進んでいます。

マスク氏が「異常に高い評価のAIスタートアップ」という言葉で誰を指しているのかは分からない。しかし、この言葉が出てくると、確かにヒットが多く、結局、AIGC分野では資金調達の波があり、そのどれもがホットマネーなのです。

スタートアップ企業の中では、OpenAIの評価額は300億ドル近く、総資金調達規模は113億ドルでAIGC内で最も裕福な企業となっており、次いで評価額が40億ドルを超える2番目に裕福なAnthropic社となっている。そして、つい数日前に13億米ドルの資金調達でシリコンバレーに衝撃を与えたInflection社の評価額は40億米ドルで、設立されてまだ1年以上しか経っていない。

大きなものはまだ来ていないかもしれない。 Inflection は独自のビッグ言語モデルを使用しており、今回は 13 億米ドルを調達し、22,000 個の Nvidia H100 チップを搭載して世界最大の人工知能クラスターを構築すると発表しました。このような大規模な計算能力があれば、ターゲット パラメーターとデータ セットの量は驚くべきものになるはずです。

** 一方、ChatGPT はどこからともなく生まれ、問題が明らかになったときに「修正」するのはそれほど簡単ではありません。 **OpenAI の数世代にわたる大規模な言語モデルでは、GPT-2 データセットには 40GB のテキストがあり、GPT-3 (つまり、ChatGPT がリリースされたときに使用されたモデル) には 570GB のトレーニング データがあります。今年はデータセットのサイズは基本的に公開されていませんでした。

大量のデータは最初から適切に文書化されていませんでした。 Googleの元研究員であるNicia Sambaswan氏はインタビューで、ハイテク企業はAIトレーニングデータをどのように収集したり注釈を付けたりするのか、さらにはデータセットの内容さえも追跡していない、と述べた。

完成したChatGPTはブラックボックスのようなもので、秘密の部屋に作られたブラックボックスですが、今後はどのようなデータがクロールされるのかを一覧表示したり、利用時にどのように利用されるのかを説明したりするなど、透明性とプライバシー保護が求められます。ユーザーの要求に応じて削除することは、実際には非常に困難なデータです。

インターネット サーファーと規制当局が OpenAI に噛みつくのには、無視できないもう 1 つの理由があります。ソーシャル メディアが発展し成長した時代には、パーソナル ネットワークのデータ保護に対する認識はまだ初期段階にあり、争う時期が来たときに、それが問題であることが判明しました。それはあまりにも遠くにあったことを。

2018年にザッカーバーグ氏が初めて議会公聴会に出席したとき、同氏のソーシャルメディアプラットフォームFacebookは立ち上げて14年が経っていた。当時、Facebookは「ケンブリッジスキャンダル」に巻き込まれ、同社の最高技術責任者は8,700万人のユーザーが影響を受けたと述べた。それはデータスクレイピングによる大きなミスでもありました。

今年5月にアルトマン氏が米国議会の公聴会に出席したとき、議員らはソーシャルメディア時代における自分たちの無策に対する遺憾の意を頻繁に表明した。 **

次々と現れる大規模なモデルはまだ訓練中であり、データ収集はスレッドであり、それを把握することによってのみ、AIGC の混乱を解消することが期待できます。

参考資料:

  1. Sina Technology: 「マスク氏とマイクロソフト社は法廷で争っているのか? Twitter がデータを違法に使用したとして Microsoft を非難 »

  2. ダークホースプログラマー: 「このプログラマーたちは GitHub を訴えました!」 649億の賠償請求」

  3. Jiemian ニュース: 「EU AI 法案が発表されました。OpenAI と他の企業はどのように得点することができますか?そして中心的な紛争は何ですか?」 」

  4. Tencent Technology: 「データへの渇望が OpenAI に悪影響を及ぼしていますか?データ保護法違反で複数の国が非難

  5. Netease Technology: 「イタリアではChatGPTがオンラインで再開したが、OpenAIの規制問題は始まったばかりだ」

原文表示
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
  • ピン
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)