Musk est dur avec OpenAI et les utilisateurs souffrent du malheur

Source : Liste alphabétique, Auteur : Bi Andi, Éditeur : Wang Jing

Source de l'image : générée par l'IA illimitée‌

J'ai seulement entendu parler des médias sociaux essayant de faire rester les utilisateurs plus longtemps, mais je n'ai jamais entendu parler de prendre l'initiative de mettre un plafond sur les gens. Ouvrez les yeux maintenant, Elon Musk ajoute une "protection mineure" à tous les utilisateurs de Twitter, et tout cela est en fait forcé par l'IA ?

De nos jours, le nombre maximum de tweets que les utilisateurs de Twitter peuvent parcourir chaque jour ne dépend pas de la vitesse de la main ou de la réticence à se coucher tard, mais il y a un nombre clair : 10 000 comptes vérifiés (c'est-à-dire le service "Bluebird" payant), 10 000 comptes non vérifiés Il y a 1000 comptes, mais seulement 500 pour les comptes non vérifiés nouvellement enregistrés.

C'est la norme deux fois plus élevée de Musk face aux utilisateurs en colère. Quant à la raison, c'est "pour faire face à des niveaux extrêmes de récupération de données et de manipulation du système".

Il faisait référence aux entreprises d'IA, qui ont besoin de grandes quantités de données pour se nourrir afin de former leurs modèles. En décembre de l'année dernière, Musk a coupé la connexion de données avec OpenAI et, en avril de cette année, a accusé Microsoft d'utiliser illégalement les données de Twitter.

OpenAI fait face à un recours collectif alors que Musk prend des mesures agressives pour arrêter le grattage des données. Il y a 16 plaignants dans le procès, tous des particuliers, c'est-à-dire de simples internautes. Ils accusent OpenAI d'avoir secrètement "gratté 300 milliards de mots sur Internet" et d'avoir volé "de grandes quantités d'informations privées" à cet utilisateur d'Internet sans l'autorisation de former ChatGPT.

D'un côté, les internautes et les plates-formes qui ont accumulé une grande quantité de contenu UGC au fil des ans, et de l'autre, les entreprises AIGC émergentes.Une guerre a commencé autour de la capture de données et de la sécurité de la vie privée.

01

Battez les gongs et les tambours ven. ven. C'était enfin le week-end, mais les utilisateurs de Twitter étaient abasourdis : un message d'erreur s'affichait à l'écran, leur rappelant qu'ils avaient dépassé la « limite de débit », violé les règles de Twitter et consulté trop de tweets.

Les gens ne savaient pas du tout ce que cela signifiait. Le patron de Twitter, Musk, s'est avancé et a déclaré qu'il y avait effectivement une limite de débit, et a annoncé : Afin de résoudre des niveaux extrêmes de raclage de données et de manipulation du système, des enregistrements vérifiés, non vérifiés et nouveaux sont Les comptes vérifiés sont limités à 6000, 600 et 300 tweets par jour.

Avant cela, Musk venait d'annoncer que Twitter interdirait aux utilisateurs non connectés de parcourir le contenu, ce qui était acceptable pour les utilisateurs. La restriction a été vraiment martelée, et les utilisateurs ont été paralysés, puis ont regardé la différence entre la vérification et la non-vérification, et ont haussé les sourcils : Est-il possible que vous essayiez d'utiliser cette astuce pour promouvoir « Blue Bird Subscription » ? Dans la zone de commentaires, plus d'un utilisateur a commenté : "Maintenant, nous devons utiliser de l'argent pour gagner ?"

La voix du mécontentement est forte, les produits concurrents de Twitter Hive, Mastodon, Tumblr, etc. apparaissent dans les sujets d'actualité, et un mème de la pierre tombale de Twitter est largement utilisé. Au cours de la controverse, Musk a relevé deux fois la norme à 10 000 vues par des utilisateurs vérifiés et 1 000 vues par des utilisateurs non vérifiés.

L'un des faux comptes de Musk a plaisanté: "J'ai fixé la limite parce que vous, les accros de Twitter, devez sortir. Je fais de bonnes choses pour le monde." Ce genre d'idée d'augmentation de valeur est bonne. Le revers de Musk est un repost, et il a également envoyé un message séparé "Allez rendre visite à vos amis et à votre famille".

Mais la blague est une blague, Musk a donné une explication claire pour son "test": traitant de l'exploration de données. L'insatisfaction des utilisateurs réside également dans l'efficacité de la méthode de limitation actuelle, pas dans la question de l'exploration des données.

Dans quelle mesure est-il sérieux que les startups de l'IA viennent sur Twitter pour « extraire des données » ? Dans un tweet, Musk a déclaré que l'augmentation du trafic avait forcé Twitter à activer des serveurs de secours :** "C'est trop d'activer un grand nombre de serveurs en ligne en cas d'urgence juste pour aider certaines startups d'IA avec des valorisations ridiculement élevées." ."**

La veille de la tempête limite actuelle, Tim Sweeney, PDG d'Epic Games, a également tweeté pour se plaindre que Twitter construisait également un mur. Musk a répondu : « Des centaines (voire plus) de blocs sont des tweets extrêmement agressifs. point où cela affecte l'expérience utilisateur. Comment devrions-nous le faire ? Je suis ouvert à toutes les idées.

Tim, qui se plaignait encore à l'instant, a rapidement fait des suggestions sérieuses, telles que l'ajout de l'interdiction de l'exploration des données aux conditions d'utilisation de Twitter, la protection de la plate-forme avec une ingénierie de sécurité de l'information et l'engagement de poursuites judiciaires contre les entreprises qui abusent de Twitter à grande échelle.

Notamment, Musk a mentionné dans sa réponse que des poursuites judiciaires seraient "absolument" intentées contre ceux qui ont volé les données : "(avec optimisme) dans 2 à 3 ans, dans l'attente de les voir au tribunal".

Indépendamment du fait que la conjecture "d'ajouter du bois de chauffage aux abonnements payants" soit le cœur d'un méchant, Musk tient haut la bannière de la confidentialité des utilisateurs peut être plus ou moins égoïste. En avril, Musk aurait créé X.AI, une nouvelle société d'intelligence artificielle, pour lutter contre ChatGPT. Si vous voulez vraiment former un grand modèle de langage, les données utilisateur de Twitter sont bien sûr uniquement pour vous.

Dans tous les cas, il est possible de limiter activement le débit de la plateforme. Musk est prêt à combattre les startups de l'IA jusqu'au bout.

02

** Tout comme Musk a tenté de limiter le flux de toute la plate-forme, OpenAI, "l'initiateur" de ce boom AICG et le créateur de ChatGPT, a été impliqué dans un recours collectif. **

Le procès a été intenté devant le tribunal de district américain du district nord de Californie, avec 16 plaignants, tous anonymes, tous des particuliers. La plainte est très longue, avec 157 pages complètes, commençant par une phrase de Stephen Hawking : "L'essor d'une intelligence artificielle puissante est soit la meilleure chose de l'histoire humaine, soit la pire chose." En plus d'OpenAI, le défendeur a également Microsoft, qui y a injecté des dizaines de milliards de dollars.

L'allégation principale est que ChatGPT a violé "les droits d'auteur et la vie privée d'innombrables personnes" lorsqu'il a utilisé des données collectées sur Internet pour "former sa technologie".

OpenAI a secrètement récupéré 300 milliards de mots sur Internet et a écouté "des livres, des articles, des sites Web et des publications, y compris des informations personnelles obtenues sans consentement", en violation des lois sur la confidentialité, selon l'acte d'accusation. Il a mentionné qu'OpenAI explore une grande quantité de données réseau, y compris des données sur les réseaux sociaux.

Ils soulignent également qu'OpenAI possède un corpus d'IA propriétaire qui a amassé de grandes quantités de données personnelles, y compris des données extraites des publications Reddit et des sites Web auxquels ils sont liés.

Il s'agit d'une accusation en termes de modèles de formation.En outre, le plaignant a également affirmé que l'interaction de l'utilisateur avec les produits d'OpenAI et les informations privées contenues dans les produits ont également été consultées illégalement et détournées par OpenAI à grande échelle.

Ce n'est pas la première fois qu'OpenAI fait l'objet d'un recours collectif aux États-Unis. En novembre de l'année dernière, les programmeurs de Github ont lancé un recours collectif contre Github, OpenAI et Microsoft, accusant OpenAI d'avoir prétendument violé les licences open source et d'avoir utilisé leur code contribué pour former l'outil d'IA propriétaire GitHub Copilot.

À l'époque, ChatGPT n'était pas encore en ligne. Avec le recul, le problème de la formation à l'IA a été exposé à cette époque. Aujourd'hui, la dernière action collective vise ChatGPT, qui a un plus large éventail d'utilisateurs et un plus large éventail de personnes qui ont été violées (essentiellement toutes les victimes). Plus important encore, sous la frénésie de l'AIGC, tout précédent juridique peut affecter l'avenir. .

Dans un communiqué, Clarkson, le cabinet d'avocats d'intérêt public représentant l'affaire, a qualifié le recours collectif d'affaire fédérale "historique" et d'avertissement à l'intelligence artificielle dans son ensemble.

De ce point de vue, la charge qui pèse sur les épaules d'OpenAI est en effet lourde.

**OpenAI a déjà rencontré de nombreux problèmes en raison de la capture de données et de la sécurité de la confidentialité. La plate-forme est verrouillée et les utilisateurs se retournent les uns contre les autres. Ce ne sont que la pointe de l'iceberg. **

En Europe, OpenAI a fait l'objet d'enquêtes par de nombreux pays. Même en avril de cette année, l'Italie craignait que ChatGPT ne viole les lois européennes sur la protection des données et a temporairement interdit ChatGPT.

La réglementation de tout le domaine de l'intelligence artificielle progresse. La France a lancé en mai un plan d'action sur l'intelligence artificielle, parmi lesquels, en ce qui concerne l'AIGC, le régulateur français de la vie privée accorde une attention particulière à la pratique de certains modèles d'IA collectant des données sur Internet et construisant des ensembles de données pour entraîner de grands modèles linguistiques.

Le plus important est la loi de l'Union européenne sur l'intelligence artificielle (EU AI Act), qui est actuellement dans sa phase finale. Le projet de loi deviendra probablement un modèle de gouvernance mondiale de l'IA.

03

** Plates-formes, utilisateurs et supervision, les trois forces ont formé une tendance à l'encerclement, s'engageant à établir des règles pour l'AIGC dès que possible et à partir du point de départ de la formation de modèles à grande échelle. **

D'une part, le temps presse et l'AIGC se développe trop vite.

Nous ne savons pas à qui Musk fait référence par "des startups d'IA à valorisation absurde". Mais dès que ces mots sont sortis, il y a eu effectivement beaucoup de hits.Après tout, il y a des vagues de financement dans le domaine de l'AIGC, qui sont toutes de l'argent chaud.

Parmi les startups, OpenAI est évaluée à près de 30 milliards de dollars, avec une échelle de financement totale de 11,3 milliards de dollars, ce qui en fait la plus riche de l'AIGC ; suivie par Anthropic, la deuxième plus riche, avec une valorisation de plus de 4 milliards de dollars. Et Inflection, qui a choqué la Silicon Valley avec un financement de 1,3 milliard de dollars il y a quelques jours à peine, a une valorisation de 4 milliards de dollars et n'est établie que depuis plus d'un an.

Les grands sont peut-être encore à venir. Inflection utilise son propre grand modèle de langage. Cette fois, il a obtenu 1,3 milliard de dollars américains et a annoncé qu'il construirait 22 000 puces Nvidia H100 pour construire le plus grand cluster d'intelligence artificielle au monde. Avec une telle puissance de calcul à grande échelle, la quantité de paramètres cibles et d'ensembles de données est forcément incroyable.

** D'autre part, ChatGPT est né de nulle part, et il n'est pas si facile de "réparer" lorsqu'il expose des problèmes. ** Plusieurs générations de grands modèles de langage d'OpenAI, l'ensemble de données GPT-2 contient 40 Go de texte et le GPT-3 (c'est-à-dire le modèle utilisé lors de la sortie de ChatGPT) contient 570 Go de données de formation. cette année, la taille de l'ensemble de données est essentiellement N'a pas été divulgué.

Des quantités massives de données n'ont pas été correctement documentées dès le départ. Nicia Sambaswan, ancienne chercheuse chez Google, a déclaré lors d'entretiens que les entreprises technologiques ne gardaient aucune trace de la manière dont elles collectaient ou annotaient les données de formation à l'IA, ni même du contenu de l'ensemble de données.

Le ChatGPT fini est comme une boîte noire, et c'est une boîte noire construite dans une pièce secrète. Maintenant, il doit être transparent et protégé par la vie privée, comme répertorier les données qui sont explorées, expliquer comment elles seront utilisées pendant l'utilisation, et la supprimer à la demande des utilisateurs. Une certaine donnée est en fait très difficile.

Les internautes et les régulateurs mordent OpenAI, il y a une autre raison qui ne peut être ignorée - dans les années où les médias sociaux se sont développés et se sont développés, la prise de conscience de la protection des données personnelles des réseaux en était encore à ses balbutiements, et quand il était temps de lutter, il a été découvert qu'il avait raté trop loin.

Lorsque Zuckerberg a siégé pour la première fois à l'audience du Congrès en 2018, sa plateforme de médias sociaux Facebook était lancée depuis 14 ans. À cette époque, Facebook a été pris dans le "scandale de Cambridge", et le directeur de la technologie de l'entreprise a déclaré que 87 millions d'utilisateurs étaient concernés. C'était aussi une grosse erreur causée par le grattage des données.

Lorsque Altman a siégé à l'audience du Congrès américain en mai de cette année, les membres du Congrès ont fréquemment exprimé leurs regrets pour leur inaction à l'ère des médias sociaux. **

L'un après l'autre, les grands modèles continuent de s'entraîner, et la capture de données est un fil conducteur, ce n'est qu'en la saisissant que l'on peut espérer démêler la confusion de l'AIGC.

Matériel de référence:

  1. Sina Technology : « Musk et Microsoft au bar ? Twitter accuse Microsoft d'utiliser illégalement ses données »

  2. Programmeur Dark Horse : "Ces programmeurs ont poursuivi GitHub !" Demande d'indemnisation de 64,9 milliards"

  3. Jiemian News : "Le projet de loi sur l'IA de l'UE est publié, comment OpenAI et d'autres entreprises peuvent-elles marquer des points, et quels sont les principaux différends ?" "

  4. Tencent Technology : « La soif de données nuit à OpenAI ? Plusieurs pays l'accusent de violer les lois sur la protection des données

  5. Netease Technology : "ChatGPT reprend en ligne en Italie, mais les problèmes réglementaires d'OpenAI ne font que commencer"

Voir l'original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Récompense
  • Commentaire
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)