Musk es duro con OpenAI y los usuarios sufren desgracias

2023-07-04 07:41:06

Fuente: Lista alfabética, Autor: Bi Andi, Editor: Wang Jing

Fuente de la imagen: Generada por Unbounded AI‌

Solo he oído hablar de las redes sociales que intentan que los usuarios se queden más tiempo, pero nunca he oído hablar de tomar la iniciativa de poner un límite a las personas. Abra los ojos ahora, Elon Musk está agregando "protección menor" a todos los usuarios de Twitter, ¿y todo esto es realmente forzado por AI?

Hoy en día, el número máximo de tweets que los usuarios de Twitter pueden navegar todos los días no depende de la velocidad de la mano o de la falta de voluntad para trasnochar, pero hay un número claro: 10.000 cuentas verificadas (es decir, el servicio "Bluebird" de pago), 10.000 cuentas no verificadas Hay 1000 cuentas, pero solo 500 para cuentas no verificadas recién registradas.

Este es el estándar doblemente elevado de Musk frente a los usuarios enojados. En cuanto a la razón, es "para abordar niveles extremos de extracción de datos y manipulación del sistema".

Se refería a las empresas de IA, que requieren grandes cantidades de datos para alimentarse a fin de entrenar sus modelos. En diciembre del año pasado, Musk cortó la conexión de datos con OpenAI y en abril de este año acusó a Microsoft de usar ilegalmente los datos de Twitter.

OpenAI enfrenta una demanda colectiva ya que Musk toma medidas agresivas para detener el raspado de datos. Hay 16 demandantes en la demanda, todos personas físicas, es decir, navegantes comunes de Internet. Acusan a OpenAI de "sacar 300 mil millones de palabras de Internet" en secreto y robar "grandes cantidades de información privada" de ese usuario de Internet sin permiso para entrenar a ChatGPT.

Por un lado están los usuarios de Internet y las plataformas que han acumulado una gran cantidad de contenido UGC a lo largo de los años, y por otro lado están las empresas AIGC emergentes.Ha comenzado una guerra en torno a la captura de datos y la seguridad de la privacidad.

01

Golpear los gongs y los tambores Vie. Vie. Finalmente llegó el fin de semana, pero los usuarios de Twitter quedaron boquiabiertos, se mostró un mensaje de error en la pantalla, recordándoles que habían excedido el "límite de tasa", violado las reglas de Twitter y visto demasiados tweets.

La gente no sabía lo que esto significaba en absoluto. El jefe de Twitter, Musk, dio un paso al frente y dijo que de hecho hay un límite de tasa, y anunció: Para resolver los niveles extremos de extracción de datos y manipulación del sistema, los registros nuevos, verificados y no verificados son no permitido Las cuentas verificadas están limitadas a 6000, 600 y 300 tweets por día.

Antes de esto, Musk acababa de anunciar que Twitter prohibiría a los usuarios que no iniciaron sesión navegar por contenido, que aún era aceptable para los usuarios. La restricción fue realmente martillada, y los usuarios quedaron paralizados, y luego miraron la diferencia entre verificación y no verificación, y levantaron las cejas: ¿Es posible que esté tratando de usar este truco para promocionar la "Suscripción Blue Bird"? En el área de comentarios, más de un usuario comentó: "¿Ahora tenemos que usar dinero para ganar?"

La voz de insatisfacción es fuerte, los productos de la competencia de Twitter, Hive, Mastodon, Tumblr, etc., aparecen en los temas candentes, y se usa ampliamente un meme de la lápida de Twitter. Durante la controversia, Musk elevó el estándar dos veces a 10 000 visitas de usuarios verificados y 1000 visitas de usuarios no verificados.

Una de las cuentas falsas de Musk bromeó: "Establecí el límite porque ustedes, los adictos a Twitter, necesitan salir. Estoy haciendo cosas buenas por el mundo". Este tipo de idea de aumentar el valor es buena. El revés de Musk es un reenvío, y también envió un mensaje separado "Ve a visitar a tus amigos y familiares".

Pero la broma es una broma, Musk dio una explicación clara para su "prueba": lidiar con el rastreo de datos. La insatisfacción de los usuarios también radica en si el método de limitación actual es efectivo, no en el tema del rastreo de datos.

¿Qué tan serio es que las nuevas empresas de IA vengan a Twitter a "raspar datos"? En un tuit, Musk dijo que el aumento del tráfico obligó a Twitter a activar servidores de respaldo:** "Es demasiado activar una gran cantidad de servidores en línea en una emergencia solo para ayudar a algunas empresas emergentes de inteligencia artificial con valoraciones ridículamente altas". ."**

El día antes de la tormenta de límites actual, Tim Sweeney, CEO de Epic Games, también tuiteó para quejarse de que Twitter también estaba construyendo un muro. Musk respondió: "Cientos (o incluso más) bloques son tweets rastreadores extremadamente agresivos. Datos especiales, para el punto donde afecta la experiencia del usuario. ¿Cómo deberíamos hacerlo? Estoy abierto a todas las ideas.”

Tim, que todavía se estaba quejando en este momento, rápidamente dio sugerencias serias, como agregar la prohibición del rastreo de datos a los términos de servicio de Twitter, proteger la plataforma con ingeniería de seguridad de la información y emprender acciones legales contra las empresas que abusan de Twitter a gran escala. acción.

En particular, Musk mencionó en su respuesta que se emprenderían acciones legales "absolutamente" contra quienes robaron los datos: "(con optimismo) dentro de 2 o 3 años, esperando verlos en los tribunales".

Independientemente de si la conjetura de "agregar leña a las suscripciones pagas" es el corazón de un villano, el hecho de que Musk mantenga en alto la bandera de la privacidad del usuario puede ser más o menos egoísta. En abril, se rumoreaba que Musk establecería X.AI, una nueva empresa de inteligencia artificial, para luchar contra ChatGPT. Si realmente desea entrenar un modelo de lenguaje grande, los datos de usuario de Twitter son, por supuesto, solo para usted.

En cualquier caso, es posible limitar activamente el flujo de la plataforma Musk está listo para luchar contra las nuevas empresas de IA hasta el final.

02

** Justo cuando Musk intentó limitar el flujo de toda la plataforma, OpenAI, el "iniciador" de este auge de AICG y el creador de ChatGPT, se vio envuelto en una demanda colectiva. **

La demanda se inició en el Tribunal de Distrito de los EE. UU. para el Distrito Norte de California, con 16 demandantes, todos anónimos, todos individuos. La denuncia es muy larga, con 157 páginas completas, comenzando con una oración de Stephen Hawking: "El surgimiento de una poderosa inteligencia artificial es lo mejor en la historia de la humanidad o lo peor". Además de OpenAI, el acusado también tiene Microsoft, que le ha inyectado decenas de miles de millones de dólares.

La acusación central es que ChatGPT violó "los derechos de autor y la privacidad de innumerables personas" cuando usó datos recopilados de Internet para "entrenar su tecnología".

OpenAI extrajo en secreto 300.000 millones de palabras de Internet y espió "libros, artículos, sitios web y publicaciones, incluida información personal obtenida sin consentimiento", en violación de las leyes de privacidad, según la acusación. Mencionó que OpenAI rastrea una gran cantidad de datos de la red, incluidos los datos en las redes sociales.

También señalan que OpenAI tiene un corpus de IA patentado que ha acumulado grandes cantidades de datos personales, incluidos los datos tomados de las publicaciones de Reddit y los sitios web a los que se vinculan.

Esta es una acusación en términos de modelos de capacitación. Además, el demandante también afirmó que la interacción del usuario con los productos de OpenAI y la información privada en los productos también fueron accedidas ilegalmente y apropiadas indebidamente por OpenAI a gran escala.

Esta no es la primera vez que OpenAI enfrenta una demanda colectiva en los Estados Unidos. En noviembre del año pasado, los programadores de Github iniciaron una demanda colectiva contra Github, OpenAI y Microsoft, acusando a OpenAI de presuntamente violar las licencias de código abierto y usar su código contribuido para entrenar la herramienta patentada de IA GitHub Copilot.

En ese momento, ChatGPT aún no estaba en línea. Mirando hacia atrás ahora, el problema del entrenamiento de IA ha quedado expuesto en ese momento. Hoy, la última demanda colectiva está dirigida a ChatGPT, que tiene una gama más amplia de usuarios y una gama más amplia de personas que han sido violadas (básicamente todas las víctimas). Más importante aún, bajo el frenesí de AIGC, cualquier precedente legal puede afectar el futuro. .

En un comunicado, Clarkson, el bufete de abogados de interés público que representa el caso, calificó la demanda colectiva como un caso federal "histórico" y una advertencia para la inteligencia artificial en su conjunto.

Desde esta perspectiva, la carga sobre los hombros de OpenAI es realmente pesada.

**OpenAI ya ha encontrado muchos problemas debido a la captura de datos y la seguridad de la privacidad. La plataforma está bloqueada y los usuarios se enfrentan entre sí. Estos son solo la punta del iceberg. **

En Europa, OpenAI ha sido investigado por muchos países Incluso en abril de este año, Italia temía que ChatGPT violaría las leyes europeas de protección de datos y prohibió temporalmente ChatGPT.

La regulación de todo el campo de la inteligencia artificial avanza. Francia lanzó un plan de acción de inteligencia artificial en mayo.Entre ellos, en términos de AIGC, el regulador de privacidad francés presta especial atención a la práctica de algunos modelos de IA que recopilan datos de Internet y construyen conjuntos de datos para entrenar grandes modelos de lenguaje.

La más importante es la Ley de Regulación de Inteligencia Artificial de la Unión Europea (Ley de IA de la UE), que actualmente se encuentra en su etapa final. Es probable que el proyecto de ley se convierta en un modelo para la gobernanza mundial de la IA.

03

**Plataformas, usuarios y supervisión, las tres fuerzas han formado una tendencia de cerco, prometiendo establecer reglas para AIGC lo antes posible y comenzar desde el punto de partida del entrenamiento de modelos a gran escala. **

Por un lado, el tiempo se acaba y AIGC se desarrolla demasiado rápido.

No sabemos a quién se refiere Musk con "startups de IA de valoración absurdamente alta". Pero tan pronto como salieron estas palabras, de hecho hubo muchos éxitos.Después de todo, hay oleadas de financiación en el campo AIGC, todas las cuales son dinero caliente.

Entre las nuevas empresas, OpenAI está valorada en casi 30 000 millones de USD, con una escala de financiación total de 11 300 millones de USD, lo que la convierte en la más rica de AIGC, seguida de Anthropic, la segunda más rica, con una valoración de más de 4 000 millones de USD. E Inflection, que conmocionó a Silicon Valley con US$1.300 millones en financiamiento hace apenas unos días, tiene una valoración de US$4.000 millones y solo lleva más de un año establecida.

Los grandes pueden estar aún por venir. Inflection utiliza su propio modelo de lenguaje grande. Esta vez obtuvo 1.300 millones de dólares estadounidenses y anunció que construirá 22.000 chips Nvidia H100 para construir el clúster de inteligencia artificial más grande del mundo. Con un poder de cómputo a gran escala, la cantidad de parámetros de destino y conjuntos de datos seguramente será sorprendente.

** Por otro lado, ChatGPT nació de la nada, y no es tan fácil de "arreglar" cuando expone problemas. **Varias generaciones de modelos de lenguaje grande de OpenAI, el conjunto de datos GPT-2 tiene 40 GB de texto y el GPT-3 (es decir, el modelo utilizado cuando se lanzó ChatGPT) tiene 570 GB de datos de entrenamiento. este año, el tamaño del conjunto de datos es básicamente No divulgado.

Cantidades masivas de datos no se documentaron correctamente desde el principio. Nicia Sambaswan, excientífica investigadora de Google, ha dicho en entrevistas que las empresas de tecnología no hacen un seguimiento de cómo recopilan o anotan los datos de entrenamiento de IA, o incluso qué hay en el conjunto de datos.

El ChatGPT terminado es como una caja negra, y es una caja negra construida en una habitación secreta. Ahora debe ser transparente y proteger la privacidad, como enumerar qué datos se rastrean, explicar cómo se usarán durante el uso y eliminarlo a petición de los usuarios Ciertos datos son realmente muy difíciles.

Los navegadores de Internet y los reguladores muerden OpenAI, hay otra razón que no se puede ignorar: en los años en que las redes sociales se desarrollaron y crecieron, la conciencia de la protección de datos de redes personales aún estaba en pañales, y cuando llegó el momento de competir, se encontró que se había perdido demasiado.

Cuando Zuckerberg se sentó por primera vez en la audiencia del Congreso en 2018, su plataforma de redes sociales Facebook se había lanzado durante 14 años. En ese momento, Facebook se vio envuelto en el "escándalo de Cambridge", y el director de tecnología de la empresa dijo que 87 millones de usuarios se vieron afectados. También fue un gran error causado por el raspado de datos.

Cuando Altman se sentó en la audiencia del Congreso de los EE. UU. en mayo de este año, los congresistas expresaron con frecuencia su pesar por su falta de acción en la era de las redes sociales. **

Los modelos grandes, uno tras otro, aún se están entrenando, y la captura de datos es un hilo. Solo captándolo podemos esperar aclarar la confusión de AIGC.

Materiales de referencia:

Sina Technology: "¿Musk y Microsoft en la barra? Twitter acusa a Microsoft de usar ilegalmente sus datos »
Programador Dark Horse: "¡Estos programadores han demandado a GitHub!" Solicitud de indemnización de 64.900 millones"
Jiemian News: "Se publica el proyecto de ley de IA de la UE, ¿cómo pueden puntuar OpenAI y otras empresas y cuáles son las disputas principales?" "
Tencent Technology: "¿La sed de datos está perjudicando a OpenAI? Múltiples países lo acusan de violar las leyes de protección de datos
Tecnología Netease: "ChatGPT se reanuda en línea en Italia, pero los problemas regulatorios de OpenAI acaban de comenzar"

Ver originales

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

Recompensa
Me gusta
Comentar
Compartir

Comentar

0/400

Sin comentarios

Tema
Dr.Han Joins Gate Square
30k Popularidad
Gate VIP New Upgrade
30k Popularidad
Nonfarm Payrolls Update
21k Popularidad
4BTC
30328k Popularidad
5contentstar
10720k Popularidad
6NADA
11186k Popularidad
7BOME
11564k Popularidad
8BTC
30328k Popularidad
9SMILE
8688k Popularidad
10比特币
13378k Popularidad

Anclado