Маск жестко относится к OpenAI, и пользователи терпят неудачу

Источник: Алфавитный список, Автор: Би Анди, Редактор: Ван Цзин

Источник изображения: сгенерировано Unbounded AI‌

Я слышал только о социальных сетях, пытающихся заставить пользователей оставаться дольше, но я никогда не слышал об инициативе ограничить людей. А теперь откройте глаза, Илон Маск добавляет «незначительную защиту» всем пользователям Твиттера, и все это на самом деле навязано ИИ?

В настоящее время максимальное количество твитов, которые пользователи Твиттера могут просматривать каждый день, не зависит от скорости рук или нежелания ложиться спать допоздна, но есть четкая цифра: 10 000 проверенных (то есть оплаченных услуг «Синяя птица») учетных записей, 10 000 непроверенных Есть 1000 учетных записей, но только 500 для вновь зарегистрированных непроверенных учетных записей.

Это дважды повышенный стандарт Маска перед лицом разгневанных пользователей. Что касается причины, то она заключается в том, чтобы «устранить крайние уровни очистки данных и системных манипуляций».

Он имел в виду компании, занимающиеся искусственным интеллектом, которым требуются большие объемы данных для обучения своих моделей. В декабре прошлого года Маск разорвал соединение для передачи данных с OpenAI, а в апреле этого года обвинил Microsoft в незаконном использовании данных Twitter.

OpenAI сталкивается с коллективным иском, поскольку Маск предпринимает агрессивные шаги, чтобы остановить очистку данных. В иске 16 истцов, все физические лица, то есть обычные интернет-пользователи. Они обвиняют OpenAI в тайном «вычищении 300 миллиардов слов из Интернета» и краже «огромного количества личной информации» у этого пользователя Интернета без разрешения на обучение ChatGPT.

С одной стороны — интернет-пользователи и платформы, накопившие за годы большое количество пользовательского контента, а с другой — развивающиеся компании AIGC.Началась война вокруг сбора данных и безопасности конфиденциальности.

01

Бить в гонги и барабаны Пт. Пт. Наконец-то наступили выходные, но пользователи Твиттера были ошарашены: на экране отображалось сообщение об ошибке, напоминающее, что они превысили «лимит скорости», нарушили правила Твиттера и просмотрели слишком много твитов.

Люди вообще не знали, что это значит. Босс Твиттера Маск выступил вперед и сказал, что ограничение скорости действительно существует, и объявил: чтобы решить экстремальные уровни очистки данных и системных манипуляций, проверенные, непроверенные и новые регистрации не допускается Подтвержденные учетные записи ограничены 6000, 600 и 300 твитами в день.

До этого Маск только что объявил, что Twitter запретит незарегистрированным пользователям просматривать контент, что по-прежнему было приемлемо для пользователей. Ограничение действительно забили, и пользователи были парализованы, а потом посмотрели на разницу между верификацией и неверификацией, и подняли брови: неужели вы пытаетесь использовать этот трюк для продвижения «Подписки Синей Птицы»? В области комментариев более одного пользователя прокомментировали: «Теперь мы должны использовать деньги, чтобы выиграть?»

Голос недовольства звучит громко, конкурирующие продукты Twitter Hive, Mastodon, Tumblr и т. д. появляются в горячих темах, широко используется мем с надгробием Twitter. Во время спора Маск дважды повышал стандарт до 10 000 просмотров проверенными пользователями и 1000 просмотров непроверенными пользователями.

Один из фальшивых аккаунтов Маска пошутил: «Я установил лимит, потому что вам, зависимым от твиттера, нужно выбраться. Я делаю хорошие вещи для мира». Такая идея повышения стоимости хороша, бэкхенд Маска — это репост, а еще он прислал отдельное сообщение «Иди в гости к друзьям и родным».

Но шутка шуткой, Маск дал четкое объяснение своему «тесту»: иметь дело со сканированием данных. Недовольство пользователей также заключается в том, эффективен ли текущий метод ограничения, а не в вопросе сканирования данных.

Насколько серьезно то, что стартапы ИИ приходят в Твиттер, чтобы «очистить данные»? В своем твите Маск сказал, что всплеск трафика вынудил Twitter включить резервные серверы:** «Это слишком, чтобы включить большое количество онлайн-серверов в чрезвычайной ситуации только для того, чтобы помочь некоторым стартапам ИИ со смехотворно высокими оценками». "**

За день до нынешнего предельного шторма Тим Суини, генеральный директор Epic Games, также написал в Твиттере, чтобы пожаловаться на то, что Twitter также строит стену. Маск ответил: «Сотни (или даже больше) блоков чрезвычайно агрессивно сканируют твиты. точки, где это влияет на пользовательский опыт. Как мы должны это сделать? Я открыт для всех идей».

Тим, который только что все еще жаловался, быстро дал серьезные предложения, такие как добавление запрета на сканирование данных в условия обслуживания Twitter, защита платформы с помощью технических средств информационной безопасности и возбуждение судебных исков против компаний, которые злоупотребляют Twitter в крупном масштабе.

Примечательно, что Маск упомянул в своем ответе, что судебные иски будут «абсолютно» предприняты против тех, кто украл данные: «(оптимистично) через 2-3 года, с нетерпением жду встречи с ними в суде».

Независимо от того, является ли догадка о «добавлении дров к платным подпискам» сердцем злодея, Маск высоко держит знамя конфиденциальности пользователей может быть более или менее эгоистичным. Ходили слухи, что в апреле Маск создал X.AI, новую компанию по искусственному интеллекту, для борьбы с ChatGPT. Если вы действительно хотите обучить большую языковую модель, пользовательские данные Twitter, конечно, предназначены только для вас.

В любом случае можно активно ограничивать поток платформы, Маск готов бороться со стартапами ИИ до конца.

02

** Пока Маск пытался ограничить поток всей платформы, OpenAI, «инициатор» этого помешательства на AICG и создатель ChatGPT, был вовлечен в коллективный иск. **

Иск был инициирован в Окружном суде США Северного округа Калифорнии с участием 16 истцов, все анонимные, все физические лица. Жалоба очень длинная, целых 157 страниц, начиная с фразы Стивена Хокинга: «Появление мощного искусственного интеллекта — это либо лучшее, что есть в истории человечества, либо самое худшее». Microsoft, которая вложила в него десятки миллиардов долларов.

Основное обвинение заключается в том, что ChatGPT нарушил «авторские права и конфиденциальность бесчисленного количества людей», когда использовал данные, собранные из Интернета, для «обучения своей технологии».

В обвинительном заключении говорится, что OpenAI тайно извлекла из Интернета 300 миллиардов слов и подслушала «книги, статьи, веб-сайты и сообщения, включая личную информацию, полученную без согласия», в нарушение законов о конфиденциальности. В нем упоминалось, что OpenAI сканирует большой объем сетевых данных, включая данные в социальных сетях.

Они также отмечают, что у OpenAI есть собственный корпус ИИ, который накопил огромное количество личных данных, включая данные, взятые из сообщений Reddit и веб-сайтов, на которые они ссылаются.

Это обвинение с точки зрения моделей обучения.Кроме того, истец также утверждал, что взаимодействие пользователя с продуктами OpenAI и личная информация в продуктах также были незаконно доступны и незаконно присвоены OpenAI в больших масштабах.

Это не первый случай, когда OpenAI сталкивается с коллективным иском в Соединенных Штатах. В ноябре прошлого года программисты Github подали коллективный иск против Github, OpenAI и Microsoft, обвинив OpenAI в якобы нарушении лицензий с открытым исходным кодом и использовании их кода для обучения проприетарного инструмента искусственного интеллекта GitHub Copilot.

В то время ChatGPT еще не было в сети, и, оглядываясь назад, можно сказать, что в то время встала проблема обучения ИИ. Сегодня последний групповой иск направлен против ChatGPT, который имеет более широкий круг пользователей и более широкий круг людей, подвергшихся насилию (в основном все жертвы), Что еще более важно, в безумии AIGC любой юридический прецедент может повлиять на будущее. .

В своем заявлении Кларксон, юридическая фирма, представляющая интересы общественности, назвала коллективный иск «знаменательным» федеральным делом и предупреждением для искусственного интеллекта в целом.

С этой точки зрения бремя на плечах OpenAI действительно тяжелое.

**OpenAI уже столкнулся с множеством проблем из-за сбора данных и защиты конфиденциальности.Платформа заблокирована, и пользователи настроены друг против друга.Это только верхушка айсберга. **

В Европе OpenAI исследовали многие страны, и даже в апреле этого года Италия опасалась, что ChatGPT нарушит европейские законы о защите данных, и временно запретила ChatGPT.

Продвигается регулирование всей области искусственного интеллекта. Франция запустила план действий по искусственному интеллекту в мае.Среди них, с точки зрения AIGC, французский регулятор конфиденциальности уделяет особое внимание практике некоторых моделей ИИ, собирающих данные из Интернета и создающих наборы данных для обучения больших языковых моделей.

Наиболее важным из них является Закон Европейского Союза о регулировании искусственного интеллекта (Закон ЕС об искусственном интеллекте), который в настоящее время находится на завершающей стадии. Законопроект, скорее всего, станет моделью глобального управления ИИ.

03

** Платформы, пользователи и контроль, три силы сформировали тенденцию окружения, пообещав установить правила для AIGC как можно скорее и начать с отправной точки крупномасштабного обучения модели. **

С одной стороны, время уходит, и AIGC развивается слишком быстро.

Мы не знаем, кого Маск имеет в виду под «абсурдно дорогими стартапами в области искусственного интеллекта». Но как только эти слова прозвучали, хитов действительно было много, ведь в сфере AIGC идут волны финансирования, все это горячие деньги.

Среди стартапов OpenAI оценивается почти в 30 миллиардов долларов США с общим масштабом финансирования в 11,3 миллиарда долларов США, что делает его самым богатым в AIGC; за ним следует Anthropic, второй по величине, с оценкой более 4 миллиардов долларов США. А компания Inflection, которая потрясла Силиконовую долину финансированием в размере 1,3 миллиарда долларов США всего несколько дней назад, оценивается в 4 миллиарда долларов США, и она была создана всего более года назад.

Большие могут быть еще впереди. Inflection использует свою собственную большую языковую модель.На этот раз она получила 1,3 миллиарда долларов США и объявила, что построит 22 000 чипов Nvidia H100 для создания крупнейшего в мире кластера искусственного интеллекта. При такой крупномасштабной вычислительной мощности количество целевых параметров и наборов данных должно быть поразительным.

** С другой стороны, ChatGPT родился из ниоткуда, и его не так просто «исправить», когда он выявляет проблемы. ** Несколько поколений больших языковых моделей OpenAI, набор данных GPT-2 содержит 40 ГБ текста, а GPT-3 (то есть модель, использовавшаяся при выпуске ChatGPT) содержит 570 ГБ обучающих данных. в этом году размер набора данных в основном не раскрывается.

Огромные объемы данных не были должным образом задокументированы с самого начала. Никия Самбасван, бывший научный сотрудник Google, сказала в интервью, что технологические компании не отслеживают, как они собирают или аннотируют данные обучения ИИ, или даже то, что находится в наборе данных.

Готовый ChatGPT похож на черный ящик, и это черный ящик, построенный в секретной комнате.Теперь он должен быть прозрачным и защищенным от конфиденциальности, например, перечислять, какие данные сканируются, объяснять, как они будут использоваться во время использования, и удаление его по запросу пользователей.Определенный кусок данных на самом деле очень сложно.

Интернет-серферы и регуляторы кусают OpenAI, есть еще одна причина, которую нельзя игнорировать — в годы, когда социальные сети развивались и росли, осознание защиты персональных данных в сети все еще находилось в зачаточном состоянии, и когда пришло время бороться, оно было найдено. что он промахнулся слишком далеко.

Когда Цукерберг впервые присутствовал на слушаниях в Конгрессе в 2018 году, его социальная сеть Facebook была запущена уже 14 лет. В то время Facebook был замешан в «кембриджском скандале», и главный технический директор компании заявил, что пострадали 87 миллионов пользователей. Это также была большая ошибка, вызванная очисткой данных.

Когда Альтман присутствовал на слушаниях в Конгрессе США в мае этого года, конгрессмены часто выражали сожаление по поводу бездействия в эпоху социальных сетей. **

Большие модели одна за другой все еще обучаются, а сбор данных — это поток, и только ухватившись за него, мы можем надеяться прояснить путаницу AIGC.

Справочные материалы:

  1. Sina Technology: «Маск и Microsoft в баре? Twitter обвиняет Microsoft в незаконном использовании его данных »

  2. Программист темной лошадки: «Эти программисты подали в суд на GitHub!» Требование о возмещении 64,9 миллиарда долларов».

  3. Jiemian News: «Закон ЕС об искусственном интеллекте выпущен, как OpenAI и другие компании могут набрать очки и каковы основные споры?» "

  4. Tencent Technology: «Жажда данных вредит OpenAI? Несколько стран обвиняют его в нарушении законов о защите данных

  5. Технология Netease: «ChatGPT возобновляет работу в сети в Италии, но проблемы с регулированием OpenAI только начались»

Посмотреть Оригинал
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Награда
  • комментарий
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить