Grandes modelos necesitan hacedores

Original: Wu Xianzhi Wen Yehao

Editor: Wang Pan

Fuente: Planeta fotón

Fuente de la imagen: Generada por Unbounded AI‌

La guerra nacional de modelos a gran escala estuvo una vez envuelta en muchas dudas. Con JD.com y Tencent ocupando sus asientos uno tras otro, este complicado juego se vuelve más claro.

Baidu y Ali, como el primer lote de jugadores de modelos a gran escala en China, ganaron el tráfico temprano mientras "tomaban la delantera". En contraste, aunque Tencent y JD.com comenzaron un poco más tarde, son más capaces de examinar en profundidad la pista del modelo a gran escala para profundizar su comprensión de la industria.

Debido a esto, algunos de los principales fabricantes que lanzaron modelos a gran escala relativamente tarde no siguieron ciegamente al público e invirtieron en la marea de modelos a gran escala de uso general. Por ejemplo, el modelo grande de Huawei mencionó la practicidad antes, y JD.com ha elegido un camino más previsor y más específico en virtud de su profunda acumulación en la industria y la cadena de suministro.Al mismo tiempo que la JD Cloud Summit (Conferencia JDD), se lanzó un modelo JD Yanxi orientado a la industria.

En la era actual de los modelos a gran escala de uso general, el modelo a gran escala de Yanxi y su ruta de creación de valor industrial lanzada por JD.com no solo son un excelente intento de establecer un orden comercial modelo a gran escala, sino que también aportan un nueva forma de pensar y dirección para toda la industria. En las aguas estancadas de la comercialización de modelos grandes, es probable que los modelos industriales grandes que están más cerca de aterrizar abran el camino en la futura competencia por modelos grandes y se conviertan en una nueva fuerza que no se puede ignorar.

Modelo grande, ni "cuento" ni "juguete"

Cada ola de sucesión tecnológica a menudo lleva mucho sedimento.

Desde chips, robots, hasta IA en los primeros años, en cada ola, siempre hay algunos jugadores con motivos ocultos mezclados, mezclando tecnología y marketing, haciendo que el camino originalmente claro sea aún más turbio. Lo mismo es cierto para las pistas de modelos domésticos a gran escala en esta etapa.

Por un lado de la pista, los jugadores luchan por descubrir el contexto técnico del modelo grande y tratan de encontrar la dirección de aterrizaje; por otro lado, incluso las empresas que no tienen nada que ver con el campo de la tecnología están abandonando el campo. uno tras otro, entrenando Los productos llamados "modelo grande": debo admitir que la situación actual de "todo puede ser un modelo grande" tiene el significado de "todo puede ser un metaverso" hace dos años.

Obviamente, cuando el llamado "gran modelo" se convierte en un sinónimo, sirviendo a su propio atractivo de "narración" en lugar de crear valor real, entonces existe una alta probabilidad de que solo pueda ir al destino del metaverso. Y esto también es cierto para aquellos jugadores que honestamente estudian tecnología. Después de todo, es difícil que la tecnología en sí misma cree valor directamente: el fin del modelo grande no es entrenar al modelo grande general en sí mismo, sino dejar que la tecnología genere valor y luego realizar una comercialización madura.

Por lo tanto, las operaciones aparentemente divertidas de los fanáticos perseguidores en realidad sonaron una llamada de atención para la pista de modelos grandes. Después de todo, el ChatGPT que encendió el AIGC afectó sutilmente la visión de los jugadores del modelo grande, lo que provocó que muchos jugadores se precipitaran hacia el modelo grande general y lanzaran una variedad de "variantes" de ChatGPT.

Hablando objetivamente, el modelo grande de uso general tiene su valor, pero en el momento en que la dimensión de la competencia se vuelve cada vez más feroz, el modelo a gran escala de uso general no es fluido:

Por un lado, los jugadores acuden a un solo campo uno tras otro, y es muy probable que caigan en la situación de "fabricación repetitiva de ruedas". Es concebible que sea difícil salir del campo de batalla lleno de nacionales y extranjeros. gigantes tecnológicos.

Por otro lado, un modelo grande de propósito general es un producto típico de la separación de consumo y pago, y se convertirá en un "juguete" si no se tiene cuidado.

Para dar un ejemplo simple, una amplia gama de usuarios finales C pueden hacer preguntas o incluso hablar sobre el universo y el cielo, pero la gran mayoría de los usuarios comunes no tienen demandas de productividad. Después de una experiencia intensiva a corto plazo, rápidamente Siente la frescura de las tecnologías emergentes. Perdido, es posible que no tenga el poder de usar durante mucho tiempo.

En base a esto, incluso si el actual modelo a gran escala de propósito general puede mejorar la eficiencia de la creación de contenido hasta cierto punto, excepto por la reducción de costos y el aumento de la eficiencia dentro de algunas industrias y organizaciones de contenido, aún no ha desarrollado un modelo maduro y modelo de negocio replicable. Es previsible que a medida que la pista general de modelos a gran escala se vuelve más y más concurrida, los jugadores se enfrentarán a muchos desafíos en términos de extensión comercial.

En última instancia, ahora que ha llegado la "singularidad", los modelos grandes no solo son un hito en la sucesión de la tecnología, sino también un motor clave para dar forma al futuro. De acuerdo con esta lógica, la guerra modelo a gran escala en esta etapa no es de ninguna manera una carrera de corta distancia, sino un proyecto sistemático. Si los jugadores quieren pasar por el ciclo y llegar al final, no pueden confiar en un solo punto de avance a nivel técnico, sino que deben pensar simultáneamente en muchas dimensiones, como la dirección técnica, la aplicación de la escena y el modelo comercial. .

Maquetas industriales a gran escala, un nuevo frente en la "Guerra de las Cien Maquetas"

Desde 1997, cuando "Deep Blue" derrotó al maestro de ajedrez Garry Kasparov, "AlphaGo" ingresó al círculo Go, y luego al sistema visual AI y la conducción automática, AI ha experimentado muchas rondas de evolución emocionante en el pasado. estar al borde de la explosión de la aplicación, pero los botones florales que están llenos de ramas no han podido florecer durante mucho tiempo.

La razón principal detrás de esto es que la tecnología aún no ha formado una aplicación profunda en la industria.Después de todo, el final del progreso tecnológico no está atrapado en el laboratorio, sino una inmersión en el "mundo real".

Siguiendo esta lógica, observando las pistas de modelos a gran escala de uso general de hoy en día, todavía queda un largo camino por recorrer antes de arraigarse en escenarios comerciales reales y crear valor real.

Xu Ran, CEO de Jingdong Group, dijo en la conferencia JDD que el modelo grande en sí mismo es una herramienta para obtener valor industrial, no un fin. El valor real de los modelos grandes debe realizarse en aplicaciones industriales.

En otras palabras, el gran modelo no es la meta, pero la aplicación es la meta.

Los fabricantes actuales de modelos grandes a menudo consideran los parámetros del modelo como el estándar de prueba para la calidad de los modelos grandes. Como todos saben, a nivel de implementación comercial, los parámetros enormes también se corresponden con costos elevados, y también existen problemas como el tiempo correspondiente prolongado y la concurrencia deficiente.

Un ejemplo simple, algunos "monstruos de parámetros" cuestan dos o tres centavos para responder una pregunta y tienen que esperar de 5 a 10 segundos. No importa cuán precisa sea la respuesta, es difícil lograr una comercialización a gran escala. Además, el modelo grande de propósito general actual tiene una tasa de precisión de alrededor del 85 %, lo que puede ser suficiente para los usuarios comunes, pero en escenarios comerciales serios, es probable que este error tenga un impacto que no se puede ignorar en el negocio.

Con respecto al problema de la aplicación, los líderes técnicos de varias líneas comerciales de JD.com mencionaron que la gente se reiría de una respuesta inventada de GPT, pero una vez que se implementa en el proceso de aplicación real, cualquier desviación generará grandes pérdidas.

El Dr. He Xiaodong, Decano del Instituto de Investigación de Exploración JD y Presidente del Departamento de Productos y Servicios Inteligentes de JD Technology, una vez experimentó algo personalmente, que es bastante representativo. "Un modelo grande responde a la raíz cuadrada de 143, y la respuesta dada es 11,5 (en realidad, aproximadamente igual a 11,96). Si se usa en un escenario de aplicación real, esta respuesta traerá grandes pérdidas".

En el campo técnico, los parámetros y la precisión del modelo son importantes, pero en el mundo de los negocios, la clave es que el modelo grande en sí sea fácil de usar y estable. En este sentido, el modelo industrial estrechamente relacionado con las industrias subdivididas, sin duda, tiene ventajas naturales.

Sin embargo, no es fácil desarrollar un modelo industrial a gran escala. Como todos sabemos, los datos de entrenamiento son la base del aprendizaje de modelos grandes y también determinan la capacidad de generalización y los escenarios de aplicación de modelos grandes. Por lo tanto, además de los avances a nivel técnico, los escenarios de primera mano y los datos de la industria son igualmente importantes para el desarrollo de grandes modelos industriales.

Tomando JD.com como ejemplo, la razón por la que lanzó un modelo a gran escala para la industria se debe en gran parte a sus fuertes genes industriales. Después de todo, entre los grandes fabricantes nacionales, JD.com, que vincula el mercado de consumo y los dos extremos de la cadena de suministro, tiene una fuerte conexión con la misma industria y posee una gran cantidad de datos de alta calidad.

Se informa que cuando se entrena el modelo grande de Yanxi, se integran el 70% de los datos generales y el 30% de los datos originales de la cadena de suministro de inteligencia digital. Se puede ver que JD.com no enfatiza únicamente los parámetros, ni cuenta deliberadamente una "historia", sino que se enfoca en el nivel de "ajuste", con el objetivo de crear un modelo grande que esté altamente integrado con la industria.

El modelo industrial a gran escala puede convertirse en un paso importante hacia la comercialización a gran escala de la pista de modelos a gran escala, y los jugadores que gradualmente entienden la lógica se están subiendo gradualmente al automóvil.

Recientemente, Tencent, que se ha estado conteniendo durante mucho tiempo, ha lanzado su propio modelo de industria a gran escala; Baidu, que mantiene en alto el estandarte de los modelos a gran escala de propósito general, también ha lanzado modelos de industria a gran escala que cubren el transporte. , energía y otros campos. No es difícil ver que a medida que los gigantes han aumentado su tamaño, los modelos industriales a gran escala que están más cerca de la comercialización se han convertido en un nuevo frente en la "Guerra de los Cien Modelos".

Reúnase en un camino angosto, el que obtiene la "escena" gana

Ya sea un modelo de uso general o un modelo industrial, la construcción de un nuevo orden comercial no puede evitar las "escenas".

En otras palabras, para la implementación, los términos técnicos oscuros y los PPT comerciales deslumbrantes son castillos en el aire. Solo aplicando verdaderamente la capacidad de los modelos grandes a la escena y generando valor real se puede abrir un círculo virtuoso.

En el momento en que se dispara la demanda de AIGC en todos los ámbitos de la vida, no es difícil encontrar los llamados escenarios de aplicación para modelos grandes. Pero si desea encontrar una escena adecuada para el aterrizaje a gran escala de modelos grandes y recorrer el camino de la comercialización, es posible que tenga que pasar por muchos desvíos.

Siguiendo esta lógica, los jugadores que ya han presentado el gran modelo están constantemente probando en varias subdivisiones, tratando de encontrar su propio punto de apoyo:

Baidu aprovechó los puntos calientes del examen anual de ingreso a la universidad y lanzó asistentes voluntarios de IA. Mientras aprovechaba al máximo las capacidades de los modelos grandes, también trató de usar esto para ingresar al mercado C-end; Ali usó Tmall Genie como ancla para explorar la aplicación de modelos grandes en el campo de la electrónica de consumo Capacidad de expansión.

JD.com, que desarrolla modelos industriales grandes, presenta la fórmula de "valor de modelos grandes = algoritmo × potencia de cómputo × datos × cuadrado de espesor industrial", y el llamado "espesor industrial" simplemente se acumula en escenas específicas. convertirse en

Independientemente del camino, los jugadores de modelos a gran escala están obligados a seguir intentando cometer errores antes de llegar a la "Tierra Prometida", e incluso cruzar el "Mar Rojo".

Ante la dificultad de aterrizar modelos grandes, algunos jugadores optan por desempeñar el papel de "vendedores de agua" para ayudar a las empresas a construir sus propios modelos grandes. Sin embargo, JD.com, que siempre ha sido pragmático en su estilo de juego, ha propuesto una estrategia de "tres pasos", es decir, primero construye un modelo grande de propósito general, luego explora escenarios y aplicaciones internamente y luego abre gradualmente aumentar sus capacidades al mundo exterior, mientras se usa a sí mismo como un campo de prueba, también es autodesarrollado.Digerir el costo de prueba y error para garantizar que los productos modelo a gran escala puedan crear un valor real.

Se informa que dentro de JD.com, el modelo grande no solo se ha integrado en escenarios de aplicaciones comunes como marketing digital, optimización de procesos operativos y servicio al cliente, sino que también se ha extendido a muchos escenarios verticales como comercio minorista, logística, finanzas , y salud.

Tomando como ejemplo el campo de la logística, frente a esta complicada ingeniería de sistemas, JD.com ha explorado múltiples caminos de exploración: el producto de la cadena de suministro Jinghui, que se ha construido durante 5 años, además de algoritmos nativos ricos como la predicción de IA y optimización de operaciones, a través de la tecnología ecológica abierta no solo puede comunicarse bien con los algoritmos y datos de sistemas heterogéneos, sino también ser más expresivo en términos de pronóstico de ventas, inventario, planificación de suministro y reabastecimiento con el apoyo de modelos grandes. , debido a la amplia aplicación de AIGC, su torre de control interactiva de la cadena de suministro puede ayudar a los usuarios a localizar y resolver rápidamente los problemas de la cadena de suministro.

En el escenario de gestión de fondos, se lanzó el producto de “selección de base inteligente” de JD Finance. La selección de fondos tradicional es costosa de entender y engorrosa de operar, lo que afecta directamente la tasa de éxito de las transacciones. Con la ayuda de modelos grandes, JD.com ha optimizado los enlaces de coincidencia de intenciones, generación de algoritmos, reconocimiento de intenciones y múltiples rondas de diálogo, lo que hace que la tasa de precisión de las preguntas de detección comunes alcance el 90 %, mejorando efectivamente la experiencia del cliente y la eficiencia de las transacciones. Este producto también servirá completamente a las instituciones financieras en el futuro.

Puede verse que la estrategia de "tres pasos" de JD.com ha logrado resultados iniciales y ha penetrado gradualmente en la textura de industrias verticales como la logística y las finanzas. Es previsible que a medida que la estrategia se despliegue gradualmente, JD.com también seguirá acumulando escenarios de aterrizaje y datos de alta calidad, girando así el volante para el aterrizaje comercial de modelos industriales a gran escala.

En el análisis final, la aparentemente complicada guerra de modelos a gran escala debe volver a un tema central, es decir, cómo la tecnología puede aportar valor real a la industria real. En esta etapa, los jugadores con diferentes caminos solo pueden explorar y practicar gradualmente las respuestas a las preguntas en este largo maratón.

Ver originales
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Recompensa
  • Comentar
  • Compartir
Comentar
0/400
Sin comentarios
  • Anclado
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)