Los modelos a gran escala echan raíces en la industria: de la "emergencia de capacidades" a la "emergencia de valor"

2023-07-17 08:37:21

Fuente original: Yibang Power

Fuente de la imagen: Generada por Unbounded AI‌

El "gran movimiento" de inteligencia artificial AI que sonaba desde principios de 2023 ya no es tan "dulce" recientemente, sino mezclado con ruido y dudas.

**Por ejemplo, disputas de tráfico. **

Según los datos de la organización de investigación en el extranjero Similarweb, después de que OpenAI haya hecho grandes avances desde mayo, el crecimiento del tráfico se ha estancado. En junio, el número de visitas a ChatGPT incluso mostró un descenso mensual por primera vez, con una tasa del 9,7%. Según estos datos, algunas personas dicen que la IA volverá a ser genial.

Sin embargo, también hay opiniones públicas de que el tráfico de la encuesta son solo datos del extremo C, mientras que AI está trabajando actualmente en el extremo B. El tráfico en el lado B incluso supera la mitad del tráfico total actual y está aumentando rápidamente. Es solo que las instituciones de investigación no obtuvieron los datos completos.

¿Es el flujo una fluctuación a corto plazo? ¿O un declive a largo plazo? ¿O es realmente un énfasis diferente?

**Otro ejemplo es el falso entusiasmo. **

Zhang Ying, socio de Matrix Partners, compartió dos datos que son bastante interesantes en comparación. Una es que de marzo a mayo de este año, entre las empresas del índice S&P 500, los ejecutivos de 110 empresas mencionaron la IA en los intercambios de rendimiento, que es tres veces el mismo tipo de datos en los últimos diez años.

Pero otro conjunto de datos diferentes es que el banco de inversión internacional Morgan Stanley realizó recientemente una encuesta a más de 2000 personas y resultó que el 80 % de ellas nunca había usado ChatGPT o Bard1 de Google.

Comparado con estos datos, parece que "Ye Gong ama a los dragones". ¿Es falso el entusiasmo de estos ejecutivos corporativos, gigantes tecnológicos y analistas?

** O, la confusión de los usuarios. **

Los usuarios finales C son muy entusiastas y sinceros, pero después de usarlo, tienen dudas: queremos que los robots ayuden a los humanos a barrer el piso y lavar los platos porque los humanos quieren escribir poesía y pintar. Como resultado, AI ahora está escribiendo poemas y pinturas, mientras que los humanos todavía estamos barriendo el piso y lavando platos.

¿Será que la "emergencia" de la inteligencia artificial no puede reflejarse en el mundo real?

Controversia sobre el tráfico, falso entusiasmo y confusión entre los usuarios, estas controversias también golpean directamente los elementos centrales del desarrollo de modelos grandes: ¿Cómo puede ** convertirse realmente en una fuerza productiva? **

Las diferentes formas de responder darán forma a diferentes sistemas de desarrollo de IA y también se convertirán en un punto de inflexión para el desarrollo futuro de las empresas.

01 Del algoritmo al producto

Desde el día de su nacimiento, la inteligencia artificial ha ido fortaleciendo sus “dos piernas” para caminar: una es tecnología y la otra es aplicación.

Detrás de la mejora de la tecnología de IA se encuentra el soporte común de los tres elementos principales de poder de cómputo, datos y algoritmos. Por ejemplo, en términos de algoritmos, la inteligencia artificial ha pasado sucesivamente por etapas como reglas, aprendizaje automático estadístico, aprendizaje profundo y preentrenamiento, ampliando así enormemente la cantidad de datos; y el algoritmo "pionero" Transformador, a través de la atención mecanismo, permite que la IA "haga preguntas" Entrenamiento rápido de una manera rápida, mostrando así una mutación significativa y una mayor capacidad de autoaprendizaje.

Cada salto en la tecnología traerá sorpresas, pero si miras hacia atrás en la historia del desarrollo de la inteligencia artificial, encontrarás que después de varias sorpresas, hay soledad.

Por ejemplo, en la ola de calor que surgió en 1956, la inteligencia artificial podía jugar al ajedrez y atrapar bloques de construcción, pero en 1973, un informe de la comunidad académica concluyó: Hasta ahora, ningún descubrimiento en este campo ha producido la promesa original. Impacto significativo2.

En 1976, el sistema experto basado en IA comenzó a participar en el diagnóstico y la consulta médica. Con nuevas olas de calor, los gobiernos de todo el mundo están aumentando la inversión. Sin embargo, otros diez años después, se descubrió que los expertos en máquinas no mostraban mucho talento. Los médicos todavía tienen que ir allí en persona, lo cual no es suficiente.

Desde 2016, Google AlphaGO ha desafiado a muchos reyes humanos del ajedrez en el mundo de Go, obteniendo 60 victorias consecutivas en 5 días. Incluso Li Shishi y Ke Jie solo pueden rendirse. La gente lamenta el poder de la inteligencia artificial, pero en los próximos cinco años, la IA no ha hecho nada sorprendente.

El punto de inflexión entre los altibajos es precisamente el "producto": si hay un buen producto, deje que la tecnología baje del altar e ingrese a la sociedad, y conviértase verdaderamente en el líder de la productividad y la creatividad.

Hay muchos casos en los que la tecnología y los productos se promocionan entre sí. Por ejemplo, el caso del fracaso es el proyecto Iridium de Motorola, que brinda servicios globales de comunicación satelital, su tecnología es líder, pero debido a que sus productos no están conectados a tierra, se declaró en bancarrota después de cuatro años de operación oficial. Los casos exitosos incluyen vehículos eléctricos. Aunque las baterías y los accionamientos eléctricos son tecnologías existentes, el mercado se abrirá gradualmente solo después de que salgan productos con un fuerte sentido de la tecnología.

Volviendo al campo de los modelos grandes, hay un punto interesante en esta ronda de marea de IA: OpenAI lanzó el mundialmente famoso ChatGPT, pero utiliza el algoritmo Transformer de Google para la optimización continua. Esto demuestra que en esta ronda de competencias de modelos a gran escala y la ola de inteligencia artificial, los algoritmos por sí solos no son suficientes. Solo el algoritmo es débil; la competencia de un solo punto del algoritmo finalmente dará paso a la "competencia del producto".

Y OpenAI no es una "tecnología fascinante". Detrás también está el soporte del poderoso "sistema de productos" de Microsoft: Bing de búsqueda, cubeta familiar de oficina, asistente personal y marketing publicitario y otros servicios en la nube orientados a la empresa.

Esto es como una "regla de oro" en el círculo de capital de riesgo: si el fundador es un experto en tecnología o un geek, al mismo tiempo que da dinero, también debe dárselo a un socio que entienda el mercado. De esta forma, la tecnología es aplaudida, pero los ingresos no son populares.

Por lo tanto, mientras otorga importancia a la tecnología, también presta más atención a la orientación de la aplicación y al impulso del producto. Especialmente para las empresas a gran escala, en lugar de decírselo a los socios, tengo muchas capacidades potentes de IA, y puede usarlas como quiera; tal vez, proporcionar algunos módulos de productos esté más cerca de la realidad. Entonces, un buen producto, ¿cómo hacerlo?

02 De lo general a la industria

Incluso si Zhuge Liang supiera astronomía en la parte superior y geografía en la parte inferior, incluso si Da Vinci pudiera dibujar, diseccionar y construir aviones, solo podrían limitarse al conocimiento de esa era. La inteligencia artificial, por otro lado, puede depender de una gran cantidad de insumos para ampliar en gran medida los límites del conocimiento.

Sin embargo, la sabiduría de la inteligencia artificial no es perfecta ni universal. A juzgar por la experiencia de los últimos meses, AI "dirá tonterías en serio" de vez en cuando. Tal vez la IA no esté mintiendo a propósito, pero ciertamente muestra que el modelo general aún es imperfecto.

Especialmente cuando se trata de algunos campos específicos, como finanzas, educación, etc., las limitaciones de los grandes modelos generales serán obvias. Después de todo, siempre hay muchas áreas en las que el jengibre todavía está de moda, y el conocimiento es clave.

Sin embargo, si el modelo grande no puede ingresar a la industria, el valor se reducirá considerablemente. Especialmente para nuestro país, que tiene una base de cadena industrial enorme y rica, todas las industrias verticales deben combinarse con nuevas tecnologías para reducir costos, mejorar la eficiencia y generar nuevo valor.

Entonces, en el campo vertical, ¿solo necesita hacer un modelo pequeño? la respuesta es negativa. Los modelos de pequeña industria pueden resolver problemas en campos específicos, o pueden hacer un buen trabajo, pero hay dos problemas.

Uno es la falta de generalización, una vez que se cambia el escenario, puede ser necesario volver a hacerlo, lo que conducirá a un aumento sustancial de los costos. Un plato para cada persona, y los platos no se repiten.Si abres un restaurante como este, definitivamente irá a la quiebra. Así que la inteligencia limitada no es inteligencia.

Por otro lado, durante el proceso de solicitud, si el usuario de repente hace algunas preguntas sobre dominios cruzados, el modelo pequeño también se confundirá. Obviamente, la tendencia de la industria cruzada es cada vez más evidente, al igual que los vehículos eléctricos, que son tanto vehículos como baterías y semiconductores. Una vez que piensa desde la perspectiva del usuario, incluso si es un campo completamente irrelevante, aún espera obtener un servicio integral.

Por lo tanto, los modelos grandes deben ingresar a las industrias verticales, y las industrias verticales también necesitan modelos grandes. ¿Cómo hacer? Una muestra de observación es JD.com.

En 2021, JD.com tomará la delantera en la inyección de conocimiento del dominio en modelos grandes, lo que puede aumentar la precisión del modelo del 83 % al 96 %. Justo ayer, JD.com lanzó un modelo a escala Yanxi de 100 mil millones de niveles para la industria. Según la introducción, **70 % de sus datos de capacitación son big data generales, y el otro 30 % son datos de conocimientos técnicos de la industria acumulados en el proceso operativo de los diversos sectores de JD, incluidos el comercio minorista, la logística, la salud, las finanzas y otras industrias. ** .

Efectivamente, los adultos no toman decisiones, sino que quieren ambas cosas.

De hecho, esto es lo correcto. Esta ronda de IA generativa es muy atractiva, pero también porque el algoritmo es fuerte, los datos son ricos y la potencia informática es lo suficientemente fuerte. Y el modelo más grande no es estático, es aprendizaje continuo. Por lo tanto, los datos y los algoritmos forman un "efecto de volante". A medida que haya más y más buenos datos disponibles, los algoritmos se volverán más y más avanzados; cuanto más efectivo sea el algoritmo, más usuarios habrá y mayor será la retroalimentación de los datos. **.

Por lo tanto, formar un circuito cerrado de "algoritmo de datos" lo antes posible no solo es el camino hacia el éxito del producto, sino también la clave para la competencia empresarial.

Además, los datos de alta calidad también son escasos. En el titulado "¿Nos quedaremos sin datos?" "El informe muestra que los datos de lenguaje natural de buena calidad pueden agotarse por modelos de lenguaje grandes tan pronto como 2026. Quien tenga buenos datos tendrá mejor "munición". Y los buenos datos, especialmente en el ámbito industrial, deben provenir de escenarios industriales reales.

Por lo tanto, el ciclo cerrado de "datos-algoritmo" se interpreta como una competencia de "escena-producto". Y solo al entrar en escena, el modelo grande puede pasar de la "emergencia de la capacidad" a la "emergencia del valor".

03 De nativo a empoderamiento

Una forma de darse cuenta del surgimiento del valor industrial es cooperar con la industria, las empresas de tecnología brindan tecnología y la industria brinda conocimientos. Y la otra forma también es la mejor, es decir, de la industria.

Si eres dueño de tu propio negocio industrial, tendrás "datos de alta calidad" reales y valiosos: has sufrido pérdidas, pisado el trueno, peleado batallas, ganado batallas y sabes pelear. Estos datos, como un catalizador, pueden impulsar de manera eficiente el desarrollo de modelos grandes, que están más cerca del negocio y resuelven mejor los problemas.

Un caso pasado es el desarrollo de servicios en la nube en China. Independientemente de si es nacional o extranjero, la etapa inicial de la nube comienza con las necesidades de la propia empresa y luego se orienta al mercado. Al comienzo de los servicios en la nube, cada "producto" parece ser el mismo, tengo lo que tienes. Sin embargo, con la combinación de tecnología y negocio, cada empresa tiene sus propias características.

Tome Jingdong como ejemplo. JD.com comenzó con "marketing, comercio, almacenamiento, distribución, posventa" y otros negocios, pero junto con la mejora paso a paso de la red de la cadena de suministro física, la digitalización de la cadena de suministro interna y JD. com propia venta al por menor, finanzas, logística, salud, Con el desarrollo profundamente arraigado de las industrias y otros campos, JD.com ha completado gradualmente la expansión de "los últimos cinco segmentos de ** caña de azúcar" a "los primeros cinco segmentos de ** ": ** tiene plataformas, escenarios, IA, tiene experiencia**.

Posteriormente, JD.com perfeccionó su experiencia en la cadena de suministro en productos y servicios de "cadena de suministro de inteligencia digital" basados en la tecnología de JD Cloud, y los exportó a la sociedad. Como resultado, se han formado las capacidades de mejora de la eficiencia de la infraestructura digital, mejora de la eficiencia de la sinergia industrial y gestión inteligente urbana.

En la actualidad, hay más de 10 millones de SKU de productos autónomos en la cadena de suministro de Jingdong Shuzhi, que atienden a más de 8 millones de clientes corporativos activos, de los cuales más del 90 % son las 500 empresas más importantes del mundo en China y casi el 70 % de las Las pequeñas y medianas empresas especializadas del país, y alcanzaron una cooperación profunda con más de 2,000 cinturones industriales en todo el país.

Este tipo de escenario de JD.com con enlaces largos, colaboración compleja y flujo de retorno de datos más dinámico es el mejor campo de entrenamiento para modelos grandes y también es la mejor encarnación de las ventajas industriales.

La experiencia de nube interna a nube externa también se está aplicando al desarrollo de modelos grandes. Jingdong también propuso un "enfoque de tres pasos" para modelos grandes:

Fuente de la imagen: JD Cloud

En primer lugar, en julio de este año, se lanzó el modelo a gran escala Yanxi, que tiene un sistema de cuatro capas de capa base, capa de modelo, MaaS y SaaS. En segundo lugar, "perfeccionar" en varias áreas comerciales internas durante medio año, y realizar una cooperación de evaluación comparativa moderada con socios externos, y pasar por múltiples ciclos de "errores, mejoras y conclusiones" para lograr la integración del producto. Finalmente, en la primera mitad de 2024, para la producción industrial, utilizaremos una mejor actitud y una ecología más abierta para servir a la industria y mejorar la eficiencia de la industria.

Las aplicaciones internas también han sido bastante efectivas. Por ejemplo, en el campo del marketing financiero, esta es también la "vieja base" de JD.com. JD Finance ha acumulado una gran cantidad de conocimientos a lo largo de décadas de desarrollo comercial y, en combinación con la IA, puede optimizar de manera eficiente las tareas clave, la adaptabilidad dinámica y la experiencia del usuario.

Por ejemplo, reduzca el costo de aprendizaje y el costo operativo del personal operativo, y aumente la eficiencia de producción de la solución cientos de veces; reduzca el proceso que solo puede completarse con más de 5 tipos de funciones, como producto/I+D/algoritmo/ diseñador/analista a una persona; al mismo tiempo, un nuevo modo interactivo de una entrada reduce el número de interacciones hombre-máquina de 2000 a menos de 50 y mejora la eficiencia operativa en más de 40 veces.

El aumento significativo en el número también muestra que, aunque desde el punto de vista del ritmo, esta caminata de tres pasos parece ser un poco lenta. Sin embargo, considerando el costo de entrada del modelo grande y el impacto significativo en la industria, solo al adoptar un enfoque paso a paso se puede transformar en una "ganancia paso a paso" para permitir que la tecnología genere beneficios.

En otras palabras, en realidad no es lento, porque no es fácil lograr realmente un gran avance industrial. Pero al igual que la confianza de Xu Ran, CEO de Jingdong Group, cortar el modelo a gran escala desde el lado industrial es como escalar el Monte Everest técnico desde la ladera norte. Aunque el camino es más difícil, hay paisajes más magníficos y gran valor de exploración. Solo al comprender a fondo la cadena de suministro física y digital, el gran modelo puede empoderar a la industria.

Como resume la experiencia de la curva de Gartner, el desarrollo de las cosas pasará por etapas como "germinación técnica-expansión expansión-ruptura de valles-escalada recuperación-madurez productiva". Y para resumirlo en otra frase: no trates el problema del ritmo como un problema estructural.

El desarrollo de la tecnología es una tendencia inevitable. Impulsada por los tres elementos de "datos, algoritmos y poder de cómputo", la inteligencia artificial inevitablemente continuará desarrollándose; sin embargo, inevitablemente habrá algunos giros y vueltas durante este período. Lo que se necesita es el ritmo científico de la empresa en investigación, desarrollo y aplicación de tecnología, así como el largoplacismo que ve la tendencia y está dispuesto a apegarse a ella.

La persistencia y el avance de JD.com en la cadena de suministro es un microcosmos de la victoria del largoplacismo. Ahora, en la competencia de las grandes modelos, en la ola de la inteligencia artificial, se necesita lo mismo.

Se puede creer firmemente que aunque la tecnología se implemente a un ritmo, siempre que se arraigue en la industria, inevitablemente nacerá un gran valor. Como dijo Xu Ran, CEO de Jingdong Group, cuando la eficiencia industrial y los límites de la industria se amplíen y mejoren cualitativamente, el modelo grande tendrá un valor práctico y un significado más importantes, que no serán menos que otra revolución industrial.

La fórmula de la inteligencia artificial también se deduce en "escenario, producto, grupo de poder de cómputo y espesor industrial", que es la clave para promover el gran modelo de "emergencia de capacidad" a "emergencia de valor".

[1] Jingwei Zhang Ying: Lo lejano y lo cercano de la IA, Chaos Academy, 2023;

[2] Informe Lighthill, Consejo de Investigación Científica de Gran Bretaña, 1973

Ver originales

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

Recompensa
Me gusta
Comentar
Compartir

Comentar

0/400

Sin comentarios

Tema
Pump.Fun Debuts on Gate
22 Popularidad
Join Gate VIP to Win MacBook
28k Popularidad
Trump Tariff Hikes
14k Popularidad
4HK Stablecoin Rules
11k Popularidad
5Truth Social Crypto ETF
957 Popularidad
6Gate Square Writing Contest Phase 1
5k Popularidad
7Altcoin ETF Watch
4k Popularidad
8Gate Alpha Trading Share
11k Popularidad
9Dr.Han Joins Gate Square
45k Popularidad
10Gate Square Creator Spark Program
152k Popularidad

Anclado