El día 136 después de gritar "ser una versión china de OpenAI", Wang Huiwen vendió Light Years Away a Meituan.
El 29 de junio de 2023, Meituan anunció en la Bolsa de Valores de Hong Kong que adquirirá el 100 % de las acciones de "Light Years Beyond" el 29 de junio de 2023. El precio total de compra incluye: US$233,673 millones en efectivo + compromiso de Deuda de 366.924 millones de dólares estadounidenses en renminbi + 1 yuan, por un total de 2.065 millones de yuanes.
Es difícil imaginar que la primera start-up modelo a gran escala fundada por un gran jefe en China termine de esta manera, este final ha dejado innumerables dudas y especulaciones en el mercado.
Desde una perspectiva comercial general, la adquisición de Meituan a años luz de distancia es solo una adquisición común entre las empresas. Pero para la industria nacional de IA, esta adquisición parece indicar que la ola de emprendimiento a gran escala de IA que solo ha estado caliente durante medio año se está enfriando.
El mercado de capitales tiene una percepción más intuitiva de la temperatura del agua de la industria. Desde el 26 de junio, las acciones de concepto de IA como HKUST Xunfei, Kunlun Wanwei y 360 se han desplomado colectivamente.
No solo en China, las personas ya no buscan ChatGPT, al que alguna vez acudieron en masa.
Según los datos de la herramienta de análisis de datos de sitios web SimilarWeb, la tasa de crecimiento de las visitas de ChatGPT en la etapa inicial fue asombrosa. La tasa de crecimiento mensual fue del 131,6 % en enero, del 62,5 % en febrero y del 55,8 % en marzo. se desaceleró significativamente en abril, con una tasa de crecimiento intermensual del 12,6%, y en mayo esta cifra fue de sólo el 2,8%.
Cuando la popularidad de los modelos grandes desaparece, es fácil que la gente piense en una pregunta: ¿Es el modelo grande una buena oportunidad para iniciar un negocio?
Obviamente, no hay una respuesta estándar a esta pregunta, e incluso las opiniones de los grandes son bastante diferentes. Hace solo unos días, Fu Sheng, presidente y director ejecutivo de Cheetah Mobile, y Zhu Xiaohu, director gerente de GSR Venture Capital Fund, "discutieron" en el círculo de amigos sobre esto.
Las inconsistencias cognitivas del modelo grande no se centran únicamente en el individuo. Cuando los empresarios, inversores y demandantes tienen sesgos cognitivos, ser "cautelosos y conservadores" con modelos grandes se ha convertido en un estado común para la mayoría de los jugadores.
En la Conferencia Anual 2023 de China Film Capital celebrada el 16 de junio, hubo una acalorada discusión entre los inversores de China Film Capital y las empresas de tecnología de consumo y tecnología dura invertidas sobre cómo la industria adopta modelos a gran escala y AIGC.
Desde la perspectiva de "Jiazi Guangnian", el mercado de modelos a gran escala necesita con urgencia voces racionales, el ritmo de la innovación no se puede detener y aún quedan muchas cuestiones por aclarar: ¿se pueden lanzar modelos a gran escala? ¿Cómo lanzar? ¿Cuáles son los problemas para entrar en el modelo grande? ¿La comercialización futura de modelos grandes repetirá los errores de la industria de IA anterior?
No importa cuán preocupada esté la gente, es casi un hecho que la industria adopta el gran modelo; la pregunta es, de qué manera.
1. Inversores prudentes
Baichuan Intelligent, Lianyuan Technology, Lingxin Intelligent, Xihu Xinchen, MiniMax... Desde principios de 2023 hasta el presente, han surgido una tras otra nuevas empresas nacionales a gran escala. La fortaleza de cada empresa está altamente capitalizada.
Durante ese tiempo, no era raro que cierto empresario estrella dejara su trabajo para iniciar un negocio y entrara en un gran modelo para obtener una gran financiación.
Por ejemplo, el 1 de junio, se informó que MiniMax, una empresa nacional de puesta en marcha modelo a gran escala, estaba a punto de completar una ronda de financiación de más de 250 millones de dólares estadounidenses, y la valoración de la empresa superó los 1200 millones de dólares estadounidenses;
En ese momento, las noticias financieras de Light Years Away, que acababa de ser adquirida por Meituan, eran aún más confusas. Wang Huiwen negó una vez que la empresa hubiera recibido 230 millones de dólares en financiación de fuentes como Source Code, Tencent, Wuyuan y Suhua. , pero esta financiación finalmente fue rechazada y se confirmó debido al anuncio de adquisición emitido por Meituan.
Esta ola de inversores que persiguen a los emprendedores hizo pensar que el gran modelo activaría todo el círculo de capital de riesgo de la IA nacional, pero no es así. De hecho, a excepción de los equipos estelares con sus propios halos, es más probable que los inversores esperen, vean y examinen el espíritu empresarial a gran escala, y solo un pequeño número de personas gasta dinero real.
Ya a principios de este año, cuando la ola de ChatGPT barrió el mundo, "Jiazi Guangnian" intercambió puntos de vista con algunos inversores por primera vez. Durante ese tiempo, casi todos estaban aprendiendo rápidamente e invitaron a expertos a realizar divulgación científica dentro de la empresa.
En ese momento, hubo una discusión candente en el campo de la IA: ¿Es ChatGPT el momento del iPhone en el mundo de la inteligencia artificial? En este sentido, la respuesta dada por Xianfeng es no apresurarse a llegar a una conclusión. "Todavía no estamos seguros de cuán grande es este impacto, pero creemos que (el gran modelo) definitivamente cambiará algo", dijo Li Kang, vicepresidente de Xianfeng.
Sin embargo, algunas instituciones de inversión han expresado su preocupación por el modelo grande. Un inversionista del mercado primario le dijo a "Jiazi Guangnian" que estaba muy preocupado por la reacción exagerada de China. Después del estallido de ChatGPT, se detonaron las existencias de conceptos de IA nacionales. "Nuestros mercados primarios y secundarios deben considerar si la inversión relevante inyectada puede generar los rendimientos correspondientes. Si se trata de intereses a corto plazo, este tipo de inversión se desperdiciará fácilmente al final, porque realmente no promovió el desarrollo de la tecnología". , pero es una inversión conceptual".
En su opinión, los inversores deberían centrarse en explorar más ciencias básicas que tengan un impacto en el futuro de la humanidad, que es el verdadero poder tecnológico con un valor de mercado potencial profundo. "Es necesario integrarse con la dinámica del mercado, así como con el valor del mercado y el progreso social futuro real. No debemos seguir a ciegas. Debemos entender claramente qué puede cambiar el futuro. No debería ser una burbuja en una ola".
Sin embargo, un practicante de FA le dijo a "Jiazi Guangnian": "Recientemente, los inversionistas han comenzado gradualmente a invertir en proyectos modelo a gran escala, pero la cantidad no es grande".
“El problema esencial sigue siendo la cognición insuficiente.” Con respecto a la actitud cautelosa de los inversores, Zhang Gaonan, socio gerente de Huaying Capital, dio su propio entendimiento. Dijo además: "Casi nadie puede definir claramente el modelo grande. Necesitamos definir los límites del modelo grande antes de discutirlo. El modelo grande que mencionaste y el modelo grande que mencioné probablemente no sean lo mismo".
En opinión de algunas personas, la cautela de los inversores puede ser una señal negativa para el espíritu empresarial a gran escala, y está echando agua fría a los modelos a gran escala. Pero desde un punto de vista objetivo, la prudencia no significa rechazo, y un abrazo racional después de un pensamiento profundo es más precioso.
Ya sean inversores, empresarios o empresas tradicionales que deseen transformar y mejorar su propio negocio con la ayuda de modelos grandes, deben aclarar dos preguntas antes de ingresar realmente al mercado de modelos grandes: cuál es el límite de capacidad del modelo grande y si tienen Necesidad de introducir un modelo grande?
2. Antes de abrazar el gran modelo, aclara dos preguntas
Cuando surge una nueva tecnología, la pregunta central en el mundo de los negocios es: ¿dónde y cómo se puede usar esta tecnología?
Esto es especialmente importante para los modelos grandes, y también es una pregunta que las empresas que realmente no han ingresado al modelo grande deben considerar cuidadosamente.
Para responder a esta pregunta, primero es necesario delinear el límite de capacidad del modelo grande.
La característica especial del modelo grande es que su algoritmo de modelo interno es una enorme caja negra, y el proceso de generación del modelo grande es inexplicable e impredecible, por lo que es difícil definir su límite de capacidad. Pero lo cierto es que el modelo grande de propósito general no es una panacea.
Lin Yonghua, vicepresidente e ingeniero jefe del Instituto de Investigación Zhiyuan, mencionó una vez en un intercambio que desde la perspectiva de la implementación industrial, "modelo grande + aprendizaje rápido" no puede reemplazar todo.
Mencionó además que para muchas tareas específicas o tareas nuevas, el aprendizaje de sugerencias puede permitir que el modelo grande genere los resultados requeridos a través de múltiples rondas de sugerencias, pero el modelo grande "no puede recordar" este proceso, y si el desarrollador agrega la sugerencia completa en cada llamada, por un lado, puede hacerla más y más larga y exceder la capacidad de contexto del modelo grande, por otro lado, inevitablemente conducirá a un aumento en el costo de cada razonamiento, y el efecto será difícil al control. Esta inestabilidad es aún más fatal en la etapa de aterrizaje de productos que han invertido dinero real.
Zhang Yitian, experto jefe del Centro Nacional de Innovación del Habla, también dijo en la reunión anual de Huaying Capital en 2023: "El gran modelo es una lógica generativa, y lo que brinda es solo un agrupamiento óptimo de vocabulario, y no hay causa y efecto entre la respuesta y la pregunta. Lo que obtenemos es solo un 'resultado', que debe identificarse, no una 'respuesta'. Por lo tanto, si el modelo grande se puede aplicar directamente en campos serios como la educación, la atención médica, y la justicia puede ser un problema. Pero está en ayudar a la toma de decisiones. Es significativo. En términos de generar resultados directamente, si se va a comercializar y producir, creemos que todavía queda un largo camino por recorrer".
Por lo tanto, existe un consenso en la industria de que en el futuro cada industria tendrá su propio modelo vertical, y el punto clave es cómo integrar las capacidades del modelo general con los propios datos de la industria de la empresa.
Pero antes de considerar realmente la implementación del proyecto modelo a gran escala, los empresarios deben considerar una pregunta más importante pero que se pasa por alto fácilmente: ¿es el modelo a gran escala una "necesidad justa" para la empresa?
En este sentido, un equipo nacional de modelos multimodales a gran escala le dijo una vez a "Jiazi Guangnian" que si las empresas "solo necesitan" los modelos a gran escala, debe entenderse desde múltiples perspectivas. Para algunas empresas, no introducir un modelo a gran escala equivale a perder una ventaja competitiva en el mercado, y tienen que utilizar un modelo a gran escala para ganarse el favor de los clientes; esto también es una "necesidad justa".
Pero hasta cierto punto, esto es más un sentimiento del mercado en los primeros días de las tecnologías emergentes. A la larga, la industrialización de las tecnologías emergentes estará impulsada esencialmente por las necesidades empresariales. En este momento, si una empresa necesita un modelo grande, debe considerar múltiples factores.
Además de los problemas de implementación de proyectos específicos, las empresas también deben considerar los problemas de seguridad de los datos y el impacto de los modelos grandes en la estructura del mercado original.
Estos dos problemas han aparecido con frecuencia en la era de la información y digital y no se pueden erradicar, en la era inteligente, estos problemas pueden aparecer de una manera más sutil.
"Muchas empresas de consumo o basadas en plataformas, si adoptan el gran modelo sin reservas, el gran modelo tiene una gran capacidad para reaccionar contra la industria, porque significa que la industria se entrega fácilmente de la industria. El umbral de entrada y la clave cognitiva ”, Dijo Zhang Yitian.
En el contexto de la transformación digital, la mayoría de las industrias han logrado la transformación y actualización digital a través de tecnologías como big data y computación en la nube. Pero al mismo tiempo, las empresas tradicionales también han entregado una gran cantidad de datos de la industria a los fabricantes de tecnología digital. Los proveedores de tecnología digital se han convertido en un cuerpo principal que no se puede ignorar en la industria, y la estructura original del mercado ha cambiado.
Sin embargo, debido a la poca cantidad de datos en industrias como la industria y la construcción, y la dificultad de conectar datos entre líneas de negocio, las empresas tradicionales aún mantienen altas barreras de competencia.
Zhang Yitian dijo: "Actualmente, la industria de la construcción es la industria que está mejor protegida en el contexto de la digitalización. Ahora, la informatización de la industria de la construcción, a excepción de un Glodon que puede hacer un presupuesto, ningún gigante puede intervenir. ¿Por qué? Porque La arquitectura tiene dibujos de diseño, dibujos de construcción, dibujos de mantenimiento, dibujos de planificación, dibujos de archivo y otros ocho dibujos, todos los dibujos no están conectados entre sí, y los departamentos gubernamentales no se reconocen entre sí. El costo de abrir estos ocho dibujos de la "Todo el edificio es lo suficientemente alto, por lo que la industria de la construcción ha mantenido la diversificación de este tipo de competencia. Por lo general, pensamos que la diversificación de la competencia es la fuente de vitalidad y poder para el desarrollo industrial".
Por lo tanto, bajo la ola de modelos a gran escala, para las empresas cuyos estándares de la industria y ventajas competitivas no son perfectos, adoptar modelos a gran escala incondicionalmente es una pregunta que toda empresa debe considerar cuidadosamente.
3. No existe una respuesta estándar para la implementación de ingeniería de modelos grandes
Para los participantes que han invertido dinero real en el mercado de modelos grandes, lo siguiente que deben hacer es resolver el problema real de implementación del proyecto.
En este sentido, la industria ha formado gradualmente un consenso de que en el futuro, los modelos grandes y pequeños se complementarán entre sí en el proceso de implementación industrial.
Lin Yonghua dijo una vez que los escenarios de área estrecha que requieren alta precisión y baja capacidad de generalización son más adecuados para el paradigma de "modelo pequeño + aprendizaje de transferencia". Tales como inspección industrial, inspección de calidad industrial, análisis de imágenes médicas, etc.
Además, Xuan Xiaohua, el fundador de Huayuan Computing, también dijo que el modelo de negocios de las empresas de IA en el futuro es integrar el gran modelo general impulsado por los grandes datos y el modelo de pequeños datos impulsado por el conocimiento para industrias verticales para lograr dos transmisión de la rueda.
Zhang Gaonan también le dijo a "Jiazi Guangnian": "Cuando las empresas optimizan sus propios modelos o entrenan modelos verticales, pueden combinarlos con modelos grandes. No necesitan datos de alta dimensión como modelos grandes, y no necesitan aplicar completamente modelos grandes Sin embargo, es instructivo que la tecnología de modelos grandes se pueda combinar con otras tecnologías para formar un modelo vertical de la industria con bajos requisitos de potencia informática, y de ninguna manera es una aplicación simple de modelos grandes ".
Por ejemplo, para el problema de la "ilusión" de los modelos grandes que ha sido criticado repetidamente, puede ser necesario combinar la generación anterior de tecnología de IA para resolverlo a corto plazo.
"Hay muchas razones para las alucinaciones, y puede deberse a que los datos son relativamente escasos e insuficientes en un determinado dominio. En este caso, necesitamos proporcionar más datos al modelo para el entrenamiento. Además, cuando los usuarios hagan preguntas, proporcione claramente Más la información de fondo también es una forma de reducir las alucinaciones, o de bajar la 'temperatura'. A veces, las alucinaciones ocurren porque las preguntas no son lo suficientemente completas, carecen de antecedentes y premisas. Por lo tanto, la pregunta también es muy importante, y la ingeniería es la clave. Además, si los usuarios realmente quieren resolver problemas precisos al 100%, es posible que aún necesiten usar gráficos de conocimiento. Los gráficos de conocimiento pueden garantizar la precisión del razonamiento lógico, así como tecnologías más nuevas, incluido el "modelo mundial" propuesto por Yann Lecun, el jefe de Meta AI”, dijo Wu Xuening, CTO de Jinyou.com.
Además de combinarse con la generación anterior de tecnología de IA, también es una parte importante para combinar el proceso de entrenamiento de modelos grandes con datos industriales de alta calidad.
Por ejemplo, como una base de datos híbrida que sirve a la plataforma AI PaaS, Tianyun Data ha pasado por más de diez años y ahora ha llegado a la etapa de combinación con modelos grandes.
Li Congwu, vicepresidente de Tianyun Data, dijo que la combinación de sí mismo y el modelo grande se considerará desde dos aspectos: primero, cómo combinar datos de dominio privado con el modelo grande. Por ejemplo, Tianyun Data completó un proyecto similar de interpretación de políticas para la Comisión Reguladora de Valores de China. Al combinar varios datos, como regulaciones, precedentes e interpretaciones, Tianyun Data generó interpretaciones de violaciones, similares al proceso de sanciones judiciales. Datos para descifrar las causas de las violaciones.
En segundo lugar, Tianyun Data ha estado desarrollando una base de datos híbrida y es una de las primeras empresas de China. Ya alrededor de 2018, Tianyun Data propuso el concepto de base de datos nativa de IA, que en realidad es similar a la base de datos vectorial que admite modelos grandes en la actualidad. Tianyun Data lanzó una base de datos vectorial de desarrollo propio y la aplicó a sus propios modelos.
En general, no existe una respuesta estándar para la implementación de ingeniería de modelos grandes.
En el camino de la inteligencia artificial, China definitivamente abrirá un camino diferente al de otros países. Es difícil distinguir las ventajas y desventajas de los dos caminos, y se basan más en elecciones realistas bajo diferentes condiciones nacionales.
Li Kang, vicepresidente de Xianfeng, una vez hizo una analogía con "Jiazi Guangnian" en una entrevista, y todavía parece ser aplicable hoy: "Es injusto usar el éxito de OpenAI para describir los muchos problemas de los empresarios nacionales. Es es como dos personas jugando a las cartas. Es diferente, la otra parte de repente jugó una gran mano y obtuvo una escalera de color, solo dices que jugó bien, fui demasiado cauteloso, pero ¿por qué no lo dijiste cuando gané?
Zhang Yitian compartió que, desde la perspectiva del gobierno central, los modelos grandes, incluidos los problemas de inteligencia artificial, son una herramienta estratégica importante para ganar la iniciativa en la competencia global y una estrategia importante para promover el desarrollo a saltos de la ciencia y la tecnología de mi país, el optimización y mejora de la industrialización, y el salto general en la productividad de los recursos.
"Cuando el informe del 20º Congreso Nacional del Partido Comunista de China habló sobre cuestiones industriales, propuso la inteligencia artificial por separado de la nueva generación de tecnología de la información. Por lo tanto, desde un punto de vista político, el desarrollo de la inteligencia artificial y la gran Los modelos a escala no son solo un problema técnico y un problema industrial, sino también la competencia central de una economía nacional. El problema del poder, desde una perspectiva más profunda, es un problema político, y todos deberían entender este problema desde una perspectiva más alta ".
Si salimos de China y extendemos la línea de tiempo del desarrollo tecnológico, el alboroto causado por ChatGPT puede ser solo un punto en la historia del desarrollo de la tecnología de inteligencia artificial, y todos los juicios pueden ser prematuros.
Después de todo, incluso los técnicos que han estado inmersos en la primera línea de la investigación de la inteligencia artificial durante mucho tiempo aún no han llegado a un consenso sobre el futuro de la inteligencia artificial y se encuentran en un estado de profunda ansiedad.
En el libro recientemente popular "Por qué no se puede planificar la grandeza", los autores Kenneth Stanley y Joel Lehman escriben: "Tenemos que enfrentar el hecho incómodo de que no podemos Determinar si alguna regla general puede ser una guía confiable en la búsqueda de objetivos de IA ."
En la Conferencia de Zhiyuan de Beijing de 2023 que terminó no hace mucho, Huang Tiejun, director del Instituto de Investigación de Zhiyuan, también tenía una ansiedad muy similar. Usó directamente las cuatro palabras "incapaz de cerrar" como título del discurso de la ceremonia de clausura. Él dijo: "Estamos en un estado incierto. ¿Es este Near AGI más fuerte que nosotros? ¿Es más inteligente que nosotros? ¿O cuándo nos superará? No lo sé. Estamos completamente en un estado de estar fuera de control".
Al final del discurso de clausura, concluyó con esta frase: "Si podemos afrontar los riesgos con la misma ilusión que invertimos en grandes modelos, al menos es posible asir el futuro. Pero, ¿usted cree que los humanos podemos hacer eso? No lo sé.
Mirando todas las tecnologías e industrias, esta "sensación de pérdida de control" de los técnicos principales de primera línea no es común en otros campos. Ahora, casi todo el mundo cruza el río palpando las piedras. Cada empresa que ingresa al mercado hoy tiene el potencial de convertirse en pionera en la tierra virgen tecnológica.
Y el tiempo es la mejor prueba para demostrarlo todo.
Ver originales
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Los modelos a gran escala se han disparado durante medio año, y solo hay unos pocos inversores que han pagado dinero real
Autor|Liu Yangnan
Fuente|Año Luz Jiazi
El día 136 después de gritar "ser una versión china de OpenAI", Wang Huiwen vendió Light Years Away a Meituan.
El 29 de junio de 2023, Meituan anunció en la Bolsa de Valores de Hong Kong que adquirirá el 100 % de las acciones de "Light Years Beyond" el 29 de junio de 2023. El precio total de compra incluye: US$233,673 millones en efectivo + compromiso de Deuda de 366.924 millones de dólares estadounidenses en renminbi + 1 yuan, por un total de 2.065 millones de yuanes.
Es difícil imaginar que la primera start-up modelo a gran escala fundada por un gran jefe en China termine de esta manera, este final ha dejado innumerables dudas y especulaciones en el mercado.
Desde una perspectiva comercial general, la adquisición de Meituan a años luz de distancia es solo una adquisición común entre las empresas. Pero para la industria nacional de IA, esta adquisición parece indicar que la ola de emprendimiento a gran escala de IA que solo ha estado caliente durante medio año se está enfriando.
El mercado de capitales tiene una percepción más intuitiva de la temperatura del agua de la industria. Desde el 26 de junio, las acciones de concepto de IA como HKUST Xunfei, Kunlun Wanwei y 360 se han desplomado colectivamente.
No solo en China, las personas ya no buscan ChatGPT, al que alguna vez acudieron en masa.
Según los datos de la herramienta de análisis de datos de sitios web SimilarWeb, la tasa de crecimiento de las visitas de ChatGPT en la etapa inicial fue asombrosa. La tasa de crecimiento mensual fue del 131,6 % en enero, del 62,5 % en febrero y del 55,8 % en marzo. se desaceleró significativamente en abril, con una tasa de crecimiento intermensual del 12,6%, y en mayo esta cifra fue de sólo el 2,8%.
Cuando la popularidad de los modelos grandes desaparece, es fácil que la gente piense en una pregunta: ¿Es el modelo grande una buena oportunidad para iniciar un negocio?
Obviamente, no hay una respuesta estándar a esta pregunta, e incluso las opiniones de los grandes son bastante diferentes. Hace solo unos días, Fu Sheng, presidente y director ejecutivo de Cheetah Mobile, y Zhu Xiaohu, director gerente de GSR Venture Capital Fund, "discutieron" en el círculo de amigos sobre esto.
En la Conferencia Anual 2023 de China Film Capital celebrada el 16 de junio, hubo una acalorada discusión entre los inversores de China Film Capital y las empresas de tecnología de consumo y tecnología dura invertidas sobre cómo la industria adopta modelos a gran escala y AIGC.
Desde la perspectiva de "Jiazi Guangnian", el mercado de modelos a gran escala necesita con urgencia voces racionales, el ritmo de la innovación no se puede detener y aún quedan muchas cuestiones por aclarar: ¿se pueden lanzar modelos a gran escala? ¿Cómo lanzar? ¿Cuáles son los problemas para entrar en el modelo grande? ¿La comercialización futura de modelos grandes repetirá los errores de la industria de IA anterior?
No importa cuán preocupada esté la gente, es casi un hecho que la industria adopta el gran modelo; la pregunta es, de qué manera.
1. Inversores prudentes
Baichuan Intelligent, Lianyuan Technology, Lingxin Intelligent, Xihu Xinchen, MiniMax... Desde principios de 2023 hasta el presente, han surgido una tras otra nuevas empresas nacionales a gran escala. La fortaleza de cada empresa está altamente capitalizada.
Durante ese tiempo, no era raro que cierto empresario estrella dejara su trabajo para iniciar un negocio y entrara en un gran modelo para obtener una gran financiación.
Por ejemplo, el 1 de junio, se informó que MiniMax, una empresa nacional de puesta en marcha modelo a gran escala, estaba a punto de completar una ronda de financiación de más de 250 millones de dólares estadounidenses, y la valoración de la empresa superó los 1200 millones de dólares estadounidenses;
En ese momento, las noticias financieras de Light Years Away, que acababa de ser adquirida por Meituan, eran aún más confusas. Wang Huiwen negó una vez que la empresa hubiera recibido 230 millones de dólares en financiación de fuentes como Source Code, Tencent, Wuyuan y Suhua. , pero esta financiación finalmente fue rechazada y se confirmó debido al anuncio de adquisición emitido por Meituan.
Esta ola de inversores que persiguen a los emprendedores hizo pensar que el gran modelo activaría todo el círculo de capital de riesgo de la IA nacional, pero no es así. De hecho, a excepción de los equipos estelares con sus propios halos, es más probable que los inversores esperen, vean y examinen el espíritu empresarial a gran escala, y solo un pequeño número de personas gasta dinero real.
En ese momento, hubo una discusión candente en el campo de la IA: ¿Es ChatGPT el momento del iPhone en el mundo de la inteligencia artificial? En este sentido, la respuesta dada por Xianfeng es no apresurarse a llegar a una conclusión. "Todavía no estamos seguros de cuán grande es este impacto, pero creemos que (el gran modelo) definitivamente cambiará algo", dijo Li Kang, vicepresidente de Xianfeng.
Sin embargo, algunas instituciones de inversión han expresado su preocupación por el modelo grande. Un inversionista del mercado primario le dijo a "Jiazi Guangnian" que estaba muy preocupado por la reacción exagerada de China. Después del estallido de ChatGPT, se detonaron las existencias de conceptos de IA nacionales. "Nuestros mercados primarios y secundarios deben considerar si la inversión relevante inyectada puede generar los rendimientos correspondientes. Si se trata de intereses a corto plazo, este tipo de inversión se desperdiciará fácilmente al final, porque realmente no promovió el desarrollo de la tecnología". , pero es una inversión conceptual".
En su opinión, los inversores deberían centrarse en explorar más ciencias básicas que tengan un impacto en el futuro de la humanidad, que es el verdadero poder tecnológico con un valor de mercado potencial profundo. "Es necesario integrarse con la dinámica del mercado, así como con el valor del mercado y el progreso social futuro real. No debemos seguir a ciegas. Debemos entender claramente qué puede cambiar el futuro. No debería ser una burbuja en una ola".
Sin embargo, un practicante de FA le dijo a "Jiazi Guangnian": "Recientemente, los inversionistas han comenzado gradualmente a invertir en proyectos modelo a gran escala, pero la cantidad no es grande".
“El problema esencial sigue siendo la cognición insuficiente.” Con respecto a la actitud cautelosa de los inversores, Zhang Gaonan, socio gerente de Huaying Capital, dio su propio entendimiento. Dijo además: "Casi nadie puede definir claramente el modelo grande. Necesitamos definir los límites del modelo grande antes de discutirlo. El modelo grande que mencionaste y el modelo grande que mencioné probablemente no sean lo mismo".
En opinión de algunas personas, la cautela de los inversores puede ser una señal negativa para el espíritu empresarial a gran escala, y está echando agua fría a los modelos a gran escala. Pero desde un punto de vista objetivo, la prudencia no significa rechazo, y un abrazo racional después de un pensamiento profundo es más precioso.
Ya sean inversores, empresarios o empresas tradicionales que deseen transformar y mejorar su propio negocio con la ayuda de modelos grandes, deben aclarar dos preguntas antes de ingresar realmente al mercado de modelos grandes: cuál es el límite de capacidad del modelo grande y si tienen Necesidad de introducir un modelo grande?
2. Antes de abrazar el gran modelo, aclara dos preguntas
Cuando surge una nueva tecnología, la pregunta central en el mundo de los negocios es: ¿dónde y cómo se puede usar esta tecnología?
Esto es especialmente importante para los modelos grandes, y también es una pregunta que las empresas que realmente no han ingresado al modelo grande deben considerar cuidadosamente.
Para responder a esta pregunta, primero es necesario delinear el límite de capacidad del modelo grande.
La característica especial del modelo grande es que su algoritmo de modelo interno es una enorme caja negra, y el proceso de generación del modelo grande es inexplicable e impredecible, por lo que es difícil definir su límite de capacidad. Pero lo cierto es que el modelo grande de propósito general no es una panacea.
Lin Yonghua, vicepresidente e ingeniero jefe del Instituto de Investigación Zhiyuan, mencionó una vez en un intercambio que desde la perspectiva de la implementación industrial, "modelo grande + aprendizaje rápido" no puede reemplazar todo.
Mencionó además que para muchas tareas específicas o tareas nuevas, el aprendizaje de sugerencias puede permitir que el modelo grande genere los resultados requeridos a través de múltiples rondas de sugerencias, pero el modelo grande "no puede recordar" este proceso, y si el desarrollador agrega la sugerencia completa en cada llamada, por un lado, puede hacerla más y más larga y exceder la capacidad de contexto del modelo grande, por otro lado, inevitablemente conducirá a un aumento en el costo de cada razonamiento, y el efecto será difícil al control. Esta inestabilidad es aún más fatal en la etapa de aterrizaje de productos que han invertido dinero real.
Zhang Yitian, experto jefe del Centro Nacional de Innovación del Habla, también dijo en la reunión anual de Huaying Capital en 2023: "El gran modelo es una lógica generativa, y lo que brinda es solo un agrupamiento óptimo de vocabulario, y no hay causa y efecto entre la respuesta y la pregunta. Lo que obtenemos es solo un 'resultado', que debe identificarse, no una 'respuesta'. Por lo tanto, si el modelo grande se puede aplicar directamente en campos serios como la educación, la atención médica, y la justicia puede ser un problema. Pero está en ayudar a la toma de decisiones. Es significativo. En términos de generar resultados directamente, si se va a comercializar y producir, creemos que todavía queda un largo camino por recorrer".
Por lo tanto, existe un consenso en la industria de que en el futuro cada industria tendrá su propio modelo vertical, y el punto clave es cómo integrar las capacidades del modelo general con los propios datos de la industria de la empresa.
Pero antes de considerar realmente la implementación del proyecto modelo a gran escala, los empresarios deben considerar una pregunta más importante pero que se pasa por alto fácilmente: ¿es el modelo a gran escala una "necesidad justa" para la empresa?
En este sentido, un equipo nacional de modelos multimodales a gran escala le dijo una vez a "Jiazi Guangnian" que si las empresas "solo necesitan" los modelos a gran escala, debe entenderse desde múltiples perspectivas. Para algunas empresas, no introducir un modelo a gran escala equivale a perder una ventaja competitiva en el mercado, y tienen que utilizar un modelo a gran escala para ganarse el favor de los clientes; esto también es una "necesidad justa".
Pero hasta cierto punto, esto es más un sentimiento del mercado en los primeros días de las tecnologías emergentes. A la larga, la industrialización de las tecnologías emergentes estará impulsada esencialmente por las necesidades empresariales. En este momento, si una empresa necesita un modelo grande, debe considerar múltiples factores.
Además de los problemas de implementación de proyectos específicos, las empresas también deben considerar los problemas de seguridad de los datos y el impacto de los modelos grandes en la estructura del mercado original.
Estos dos problemas han aparecido con frecuencia en la era de la información y digital y no se pueden erradicar, en la era inteligente, estos problemas pueden aparecer de una manera más sutil.
"Muchas empresas de consumo o basadas en plataformas, si adoptan el gran modelo sin reservas, el gran modelo tiene una gran capacidad para reaccionar contra la industria, porque significa que la industria se entrega fácilmente de la industria. El umbral de entrada y la clave cognitiva ”, Dijo Zhang Yitian.
En el contexto de la transformación digital, la mayoría de las industrias han logrado la transformación y actualización digital a través de tecnologías como big data y computación en la nube. Pero al mismo tiempo, las empresas tradicionales también han entregado una gran cantidad de datos de la industria a los fabricantes de tecnología digital. Los proveedores de tecnología digital se han convertido en un cuerpo principal que no se puede ignorar en la industria, y la estructura original del mercado ha cambiado.
Sin embargo, debido a la poca cantidad de datos en industrias como la industria y la construcción, y la dificultad de conectar datos entre líneas de negocio, las empresas tradicionales aún mantienen altas barreras de competencia.
Zhang Yitian dijo: "Actualmente, la industria de la construcción es la industria que está mejor protegida en el contexto de la digitalización. Ahora, la informatización de la industria de la construcción, a excepción de un Glodon que puede hacer un presupuesto, ningún gigante puede intervenir. ¿Por qué? Porque La arquitectura tiene dibujos de diseño, dibujos de construcción, dibujos de mantenimiento, dibujos de planificación, dibujos de archivo y otros ocho dibujos, todos los dibujos no están conectados entre sí, y los departamentos gubernamentales no se reconocen entre sí. El costo de abrir estos ocho dibujos de la "Todo el edificio es lo suficientemente alto, por lo que la industria de la construcción ha mantenido la diversificación de este tipo de competencia. Por lo general, pensamos que la diversificación de la competencia es la fuente de vitalidad y poder para el desarrollo industrial".
Por lo tanto, bajo la ola de modelos a gran escala, para las empresas cuyos estándares de la industria y ventajas competitivas no son perfectos, adoptar modelos a gran escala incondicionalmente es una pregunta que toda empresa debe considerar cuidadosamente.
3. No existe una respuesta estándar para la implementación de ingeniería de modelos grandes
Para los participantes que han invertido dinero real en el mercado de modelos grandes, lo siguiente que deben hacer es resolver el problema real de implementación del proyecto.
En este sentido, la industria ha formado gradualmente un consenso de que en el futuro, los modelos grandes y pequeños se complementarán entre sí en el proceso de implementación industrial.
Lin Yonghua dijo una vez que los escenarios de área estrecha que requieren alta precisión y baja capacidad de generalización son más adecuados para el paradigma de "modelo pequeño + aprendizaje de transferencia". Tales como inspección industrial, inspección de calidad industrial, análisis de imágenes médicas, etc.
Además, Xuan Xiaohua, el fundador de Huayuan Computing, también dijo que el modelo de negocios de las empresas de IA en el futuro es integrar el gran modelo general impulsado por los grandes datos y el modelo de pequeños datos impulsado por el conocimiento para industrias verticales para lograr dos transmisión de la rueda.
Zhang Gaonan también le dijo a "Jiazi Guangnian": "Cuando las empresas optimizan sus propios modelos o entrenan modelos verticales, pueden combinarlos con modelos grandes. No necesitan datos de alta dimensión como modelos grandes, y no necesitan aplicar completamente modelos grandes Sin embargo, es instructivo que la tecnología de modelos grandes se pueda combinar con otras tecnologías para formar un modelo vertical de la industria con bajos requisitos de potencia informática, y de ninguna manera es una aplicación simple de modelos grandes ".
Por ejemplo, para el problema de la "ilusión" de los modelos grandes que ha sido criticado repetidamente, puede ser necesario combinar la generación anterior de tecnología de IA para resolverlo a corto plazo.
"Hay muchas razones para las alucinaciones, y puede deberse a que los datos son relativamente escasos e insuficientes en un determinado dominio. En este caso, necesitamos proporcionar más datos al modelo para el entrenamiento. Además, cuando los usuarios hagan preguntas, proporcione claramente Más la información de fondo también es una forma de reducir las alucinaciones, o de bajar la 'temperatura'. A veces, las alucinaciones ocurren porque las preguntas no son lo suficientemente completas, carecen de antecedentes y premisas. Por lo tanto, la pregunta también es muy importante, y la ingeniería es la clave. Además, si los usuarios realmente quieren resolver problemas precisos al 100%, es posible que aún necesiten usar gráficos de conocimiento. Los gráficos de conocimiento pueden garantizar la precisión del razonamiento lógico, así como tecnologías más nuevas, incluido el "modelo mundial" propuesto por Yann Lecun, el jefe de Meta AI”, dijo Wu Xuening, CTO de Jinyou.com.
Además de combinarse con la generación anterior de tecnología de IA, también es una parte importante para combinar el proceso de entrenamiento de modelos grandes con datos industriales de alta calidad.
Por ejemplo, como una base de datos híbrida que sirve a la plataforma AI PaaS, Tianyun Data ha pasado por más de diez años y ahora ha llegado a la etapa de combinación con modelos grandes.
Li Congwu, vicepresidente de Tianyun Data, dijo que la combinación de sí mismo y el modelo grande se considerará desde dos aspectos: primero, cómo combinar datos de dominio privado con el modelo grande. Por ejemplo, Tianyun Data completó un proyecto similar de interpretación de políticas para la Comisión Reguladora de Valores de China. Al combinar varios datos, como regulaciones, precedentes e interpretaciones, Tianyun Data generó interpretaciones de violaciones, similares al proceso de sanciones judiciales. Datos para descifrar las causas de las violaciones.
En segundo lugar, Tianyun Data ha estado desarrollando una base de datos híbrida y es una de las primeras empresas de China. Ya alrededor de 2018, Tianyun Data propuso el concepto de base de datos nativa de IA, que en realidad es similar a la base de datos vectorial que admite modelos grandes en la actualidad. Tianyun Data lanzó una base de datos vectorial de desarrollo propio y la aplicó a sus propios modelos.
En general, no existe una respuesta estándar para la implementación de ingeniería de modelos grandes.
En el camino de la inteligencia artificial, China definitivamente abrirá un camino diferente al de otros países. Es difícil distinguir las ventajas y desventajas de los dos caminos, y se basan más en elecciones realistas bajo diferentes condiciones nacionales.
Li Kang, vicepresidente de Xianfeng, una vez hizo una analogía con "Jiazi Guangnian" en una entrevista, y todavía parece ser aplicable hoy: "Es injusto usar el éxito de OpenAI para describir los muchos problemas de los empresarios nacionales. Es es como dos personas jugando a las cartas. Es diferente, la otra parte de repente jugó una gran mano y obtuvo una escalera de color, solo dices que jugó bien, fui demasiado cauteloso, pero ¿por qué no lo dijiste cuando gané?
Zhang Yitian compartió que, desde la perspectiva del gobierno central, los modelos grandes, incluidos los problemas de inteligencia artificial, son una herramienta estratégica importante para ganar la iniciativa en la competencia global y una estrategia importante para promover el desarrollo a saltos de la ciencia y la tecnología de mi país, el optimización y mejora de la industrialización, y el salto general en la productividad de los recursos.
"Cuando el informe del 20º Congreso Nacional del Partido Comunista de China habló sobre cuestiones industriales, propuso la inteligencia artificial por separado de la nueva generación de tecnología de la información. Por lo tanto, desde un punto de vista político, el desarrollo de la inteligencia artificial y la gran Los modelos a escala no son solo un problema técnico y un problema industrial, sino también la competencia central de una economía nacional. El problema del poder, desde una perspectiva más profunda, es un problema político, y todos deberían entender este problema desde una perspectiva más alta ".
Si salimos de China y extendemos la línea de tiempo del desarrollo tecnológico, el alboroto causado por ChatGPT puede ser solo un punto en la historia del desarrollo de la tecnología de inteligencia artificial, y todos los juicios pueden ser prematuros.
Después de todo, incluso los técnicos que han estado inmersos en la primera línea de la investigación de la inteligencia artificial durante mucho tiempo aún no han llegado a un consenso sobre el futuro de la inteligencia artificial y se encuentran en un estado de profunda ansiedad.
En el libro recientemente popular "Por qué no se puede planificar la grandeza", los autores Kenneth Stanley y Joel Lehman escriben: "Tenemos que enfrentar el hecho incómodo de que no podemos Determinar si alguna regla general puede ser una guía confiable en la búsqueda de objetivos de IA ."
En la Conferencia de Zhiyuan de Beijing de 2023 que terminó no hace mucho, Huang Tiejun, director del Instituto de Investigación de Zhiyuan, también tenía una ansiedad muy similar. Usó directamente las cuatro palabras "incapaz de cerrar" como título del discurso de la ceremonia de clausura. Él dijo: "Estamos en un estado incierto. ¿Es este Near AGI más fuerte que nosotros? ¿Es más inteligente que nosotros? ¿O cuándo nos superará? No lo sé. Estamos completamente en un estado de estar fuera de control".
Al final del discurso de clausura, concluyó con esta frase: "Si podemos afrontar los riesgos con la misma ilusión que invertimos en grandes modelos, al menos es posible asir el futuro. Pero, ¿usted cree que los humanos podemos hacer eso? No lo sé.
Mirando todas las tecnologías e industrias, esta "sensación de pérdida de control" de los técnicos principales de primera línea no es común en otros campos. Ahora, casi todo el mundo cruza el río palpando las piedras. Cada empresa que ingresa al mercado hoy tiene el potencial de convertirse en pionera en la tierra virgen tecnológica.
Y el tiempo es la mejor prueba para demostrarlo todo.