La "verdad" del cuerpo a cuerpo del modelo a gran escala de AI: los inversores ven más e invierten menos, 20 empresas solo recibieron 6 mil millones de yuanes en financiamiento
Figura: En la Conferencia Mundial de Inteligencia Artificial de 2023, muchas empresas exhibieron productos y aplicaciones modelo de IA a gran escala
“Mira más, vota menos”, “el ambiente de espera y observación es relativamente fuerte”. Hablando de la actitud de las instituciones de inversión hacia el modelo empresarial de inteligencia artificial a gran escala este año, este es el sentimiento de algunos inversores y empresarios nacionales.
Pero en la industria, los modelos grandes de IA siguen siendo populares. En la Conferencia Mundial de Inteligencia Artificial recién concluida, más de 30 modelos a gran escala mostraron sus músculos colectivamente. Las empresas nacionales de Internet y muchas empresas de inteligencia artificial han entrado en la pista caliente de los modelos a gran escala, y la batalla de los 100 modelos ya ha comenzado. .
En el mercado de capital de riesgo, grandes nombres como Wang Huiwen, Wang Xiaochuan y Li Kaifu ingresaron al mercado uno tras otro, llamando a ser OpenAI de China, ser el mejor modelo a gran escala en China, etc., convirtiéndose en un importante fuerza en esta ola de modelos a gran escala de IA.
Según estadísticas incompletas de Sohu Technology, en la primera mitad de este año, al menos 20 empresas modelo a gran escala recibieron más de 6.000 millones de yuanes en financiación. Desde una perspectiva global, la cantidad de financiamiento relacionado supera los 50, y China y Estados Unidos toman la delantera, con más de 20 cada uno, lo que implica un total de 100 mil millones de yuanes.
Aunque la cantidad de transacciones nacionales es relativamente grande, la cantidad solo representa el 6% del mundo.Los inversores nacionales no son generosos, y el mercado de inversión de modelos grandes de IA está un poco desierto.
Al mismo tiempo, no todas las partes han llegado a un consenso sobre el valor empresarial de los modelos grandes. Zhu Xiaohu, socio gerente de GSR Ventures, y Fu Sheng, presidente de Cheetah Mobile, han estado discutiendo entre ellos sobre esto anteriormente.
Cheng Hao, el fundador de Yuanwang Capital y Xunlei, consideró que no habrá más de 10 modelos de propósito general en el mundo y que hay pocas oportunidades para el espíritu empresarial. Básicamente, esto se ha convertido en un consenso en el círculo de inversión. El CEO de Baidu, Robin Li, también dijo antes que no hay necesidad de reinventar la rueda.
Pero a muchos empresarios les resulta difícil estar de acuerdo. Wang Xiaochuan cree que las nuevas empresas deben tener oportunidades y, sin la carga y la mayor presión comercial, funcionarán más rápido que las grandes empresas.
Li Wei, vicepresidente de ingeniería y científico jefe de Going out to Ask, dijo a Sohu Technology que es poco probable que los principales fabricantes monopolicen los modelos grandes de uso general. "Muchas empresas emergentes han lanzado modelos grandes, lo que demuestra que este asunto ya no es un gran problema".
A pesar de las diferencias, existe consenso en que la aplicación será clave. Desde esperar para ver si hacerlo, hasta la entrada de jugadores de todos los ámbitos de la vida, el gran modelo ha llegado a la etapa de responder cómo implementarlo. Ya sea una gran fábrica o una empresa nueva, esta es una hoja de respuestas obligadas.
El jefe tiene su propio halo cuando ingresa al juego, ¿quién está invirtiendo en el modelo grande?
Nació ChatGPT, marcando el pico del modelo grande de la tercera ola de IA, y un grupo de peces gordos comenzó sus propios negocios. Según las estadísticas incompletas de Sohu Technology, en la primera mitad de este año, al menos 20 empresas a gran escala obtuvieron financiamiento, y la mayoría de ellas se encontraban en la ronda ángel temprana o ronda A.
Estos empresarios básicamente tienen su propio halo, incluidos Kai-fu Lee, Wang Huiwen, Wang Xiaochuan, Li Zhifei, Zhou Bowen, etc., que tienen antecedentes empresariales o de gran escala, así como académicos novatos como la Universidad de Tsinghua, National People's Congreso y la Universidad de West Lake, entre las que destaca especialmente la Universidad de Tsinghua.Los profesores de Tsinghua respaldan la tecnología Shengshu, la tecnología Shenyan, el lado oscuro de la luna, la inteligencia Qingmao, la inteligencia Face Wall y la inteligencia Lingxin.
Figura: Empresas modelo de gran escala de IA que obtuvieron financiación pública en el primer semestre de este año Fuente: información pública, Tianyancha
Desde la perspectiva de los inversores, no solo existen capitales industriales como Tencent, Baidu Ventures, Ant Group y TAL, sino también capitales de riesgo como Sequoia, IDG, ZhenFund, Sinovation Ventures, Qiming Ventures, Matrix Partners y Qiji Ventures. elenco. Sequoia es la más activa, con al menos 5 tomas, incluidas Light Years Beyond, Shenyan Technology, The Dark Side of the Moon y Project AI 2.0, mientras que Tencent ha invertido en Light Years Beyond, MiniMax y Shenyan Technology.
En términos de escala de financiación, la financiación total revelada por los proyectos en estas estadísticas supera los 6.000 millones de yuanes. Según datos públicos, en la primera mitad de este año, hubo 51 financiamientos corporativos que involucran grandes modelos de IA en el mundo, con un monto de inversión y financiamiento superior a 100 mil millones de yuanes, es decir, el número de transacciones nacionales representó casi el 40% , pero el monto de la financiación fue solo alrededor del 6%.
Múltiples transacciones a gran escala en el mercado de EE. UU. representaron la mayoría, incluida la inversión de $ 10 mil millones de Microsoft en OpenAI, Bill Gates, Microsoft, Nvidia, etc. lideró la inversión de $ 1.3 mil millones en Inflection AI, y la empresa de datos de EE. UU. Databricks adquirió MosaicML para $ 1.3 mil millones. Estas tres transacciones por sí solas representaron alrededor del 90% del total mundial.
Esto también muestra en cierta medida que, aunque los modelos nacionales a gran escala están fuertemente involucrados y las acciones de concepto en el mercado de capitales se han duplicado y disparado, los inversores en el mercado primario todavía son relativamente cautelosos, especialmente en transacciones de gran valor.
Qu Kai, el fundador de Chapter 42, que se dedica al negocio de FA de capital de riesgo, reveló que casi todos los fondos en dólares estadounidenses actualmente están considerando la IA, y algunos fondos en RMB también están interesados. "Muchas instituciones son muy positivas, pero al final no son muchas las que se moverán. Probablemente serán cincuenta o sesenta".
Li Wei, vicepresidente de ingeniería y científico en jefe, también puede sentir que la comunidad inversora está realmente muy preocupada por los grandes modelos, pero también es muy cautelosa. "Después de todo, esta es una nueva dirección tecnológica con una gran inversión, pero el modelo comercial actualmente no está claro".
Guo Tao, un inversionista ángel y experto senior en inteligencia artificial, analizó Sohu Technology y dijo que cada vez más instituciones de inversión se han dado cuenta de que los grandes modelos de IA enfrentan grandes montos de inversión, largos períodos de recuperación, bajas tasas de éxito, competencia feroz en la industria, y regulaciones cada vez más estrictas Y otros temas, por lo que el tiro tiende a ser cauteloso, y la atmósfera actual de esperar y ver es relativamente fuerte.
Al mismo tiempo, Guo Tao cree que no hay muchas empresas de inteligencia artificial a gran escala en las que valga la pena invertir en la actualidad. La mayoría de las empresas emergentes casi no tienen ventajas significativas en tecnología, datos y ecología.
Además, las valoraciones de muchas empresas estrella prometedoras son demasiado caras, normalmente a años luz de distancia. En solo tres meses, la valoración ha saltado de 200 millones de dólares estadounidenses a mil millones de dólares estadounidenses, y muchas instituciones están desanimadas. El final de esta empresa también es bastante vergonzoso. Meituan de Wang Xing "salvó" a sus hermanos e inversores con más de 2 mil millones de yuanes, y Wang Huiwen se fue temprano debido a una enfermedad.
Continuar con la preferencia de inversión en Internet y comenzar a luchar después de que la fiebre disminuya
En términos de la dirección de inversión específica de los grandes modelos de IA, las instituciones de inversión casi han seguido las preferencias de la era de inversión en Internet, y la capa de aplicación es la más popular. Cheng Hao dijo que Yuanwang Capital invierte principalmente en empresas de capa de aplicaciones y middleware.
Según los datos revelados por Qu Kai, entre los proyectos de IA que han recibido dinero este año, el 10 %-20 % son para modelos, el 20 %-30 % son para capas infra/intermedias y el 60 %-70 % son para capas de aplicación. . Si no se cuentan los proyectos que obtienen dinero, los proyectos que realizan aplicaciones pueden llegar al 95%.
Desde la infraestructura subyacente (como chips, marcos y otra infraestructura), hasta la capa de modelo, el middleware y varias aplicaciones, la industria de modelos a gran escala de IA también ha formado una estructura de pirámide invertida similar a la industria de chips. En el caso de que la capa inferior se base en tecnología extranjera de código abierto y sea difícil de superar, la mayoría de las nuevas empresas nacionales apuestan por la capa de aplicación, y la capa de modelo de alto costo es solo un juego para unas pocas empresas.
Li Wei cree que las empresas emergentes realizan principalmente modelos básicos a gran escala y aplicaciones posteriores de modelos a gran escala, y no es ni realista ni necesario hacer modelos básicos a gran escala. "Por lo tanto, muchas empresas emergentes tienden a postularse en escenarios verticales. Por medio de llamadas de API o implementación de privatización de OEM, aprovecharán los servicios de modelos grandes de proveedores de modelos grandes para centrarse en la investigación y el desarrollo innovadores de datos y aplicaciones. Esto ser una dirección relativamente clara".
Sin embargo, esta ola de locura por las grandes modelos parece haber comenzado a enfriarse. El ejemplo que se cita a menudo es el pico del tráfico de ChatGPT. Según los datos del sitio web de terceros SimilarWeb, el tráfico global del sitio web y el cliente móvil de ChatGPT disminuyó un 9,7 % mensual en junio de este año, la primera caída desde finales del año pasado, y el tiempo dedicado por Las visitas al sitio web también disminuyeron un 8,5%. Además, el tráfico de sitios web como Microsoft Bing y Character.AI también disminuyó en diversos grados en junio.
"El mercado se ha estado enfriando en los últimos uno o dos meses, porque los cambios cualitativos en los modelos grandes han disminuido recientemente y hay menos nuevos empresarios y nuevas historias que contar que a principios de año. Pero cada pista y El punto de acceso tiene sus propias ventajas y desventajas. Fu, esto es normal ", dijo Qu Kai.
Él cree que en la próxima etapa del gran modelo de IA, debemos trabajar duro para implementarlo. La próxima ola de puntos calientes probablemente será dos o tres meses después. Una gran cantidad de proyectos que recibieron dinero en la primera mitad del El año tardará unos meses en completar el lanzamiento del producto. Vea si hay más y mejores aplicaciones asesinas, y vea quién será el líder de la capa de aplicaciones.
De hecho, los principales fabricantes se esfuerzan actualmente por el desembarco y la aplicación comercial de modelos de gran tamaño. Cuando Huawei lanzó Pangu 3.0 recientemente, expresó que espera usarlo para ayudar a todos los ámbitos de la vida, en lugar de centrarse en el nivel del modelo de voz. "Estamos tan ocupados haciendo cosas que no tenemos tiempo para la poesía".
Guo Tao cree que, aunque el modelo de IA se ha enfriado, durará aproximadamente un año en total y el enfoque cambiará gradualmente del nivel de tecnología subyacente al nivel de aplicación vertical.
Li Di, CEO de Xiaoice, consideró que la homogeneización de modelos grandes es grave ahora, y que no hay necesidad de tantos modelos grandes en el mercado. La fiebre debería disminuir en 2024, y se encuentra que quién está en la orilla y que está nadando desnudo.
¿No hay posibilidad de modelo general? La homogeneización de la pista vertical es grave
Para los empresarios, cómo pensar en la dirección antes de ingresar al mercado es extremadamente crítico. Zhu Xiaohu dijo que ChatGPT es muy poco amigable con las empresas nuevas y abandonará las fantasías financieras en los próximos dos o tres años. Fu Sheng se quejó de esto y dijo: "Nuestros inversores son ignorantes y los que no tienen miedo".
Más tarde, Zhu Xiaohu explicó que no negó las oportunidades empresariales en el campo de los modelos a gran escala, pero recordó a los empresarios que no deben ser supersticiosos con respecto a los modelos a gran escala de propósito general. "Para la mayoría de los empresarios, los escenarios son la prioridad y los datos son el rey".
Esta visión se ha convertido básicamente en el consenso del actual círculo de inversión nacional. Guo Tao cree que los modelos a gran escala de propósito general formarán una cierta situación de monopolio, y los empresarios y las "pequeñas fábricas" estarán en desventaja en términos de capital, tecnología, datos y ecología cuando implementen modelos a gran escala de propósito general. .
"El foso del modelo a gran escala de propósito general es muy alto y su efecto de red también es fuerte. Los comentarios de los usuarios lo harán cada vez más inteligente, y la empresa que lo fabrique primero tendrá la ventaja de ser el primero en moverse". Hao también cree que no hay ninguna posibilidad de que las empresas emergentes fabriquen un modelo a gran escala de propósito general, ya que solo las grandes fábricas pueden permitírselo.
Al mismo tiempo, cree que el modelo base general no requerirá tantas empresas en el futuro. "Tal vez no haya más de 10 modelos de propósito general de código cerrado y de código abierto que se puedan usar en el mundo en el futuro, lo cual es demasiado".
Pero muchos empresarios no están de acuerdo. "Muchas empresas de nueva creación han lanzado modelos a gran escala, lo que demuestra que este asunto no es un gran problema. Si se trata de alcanzar el nivel de GPT-4, también es muy difícil para los principales fabricantes, y parece imposible de monopolizar. ahora", dijo Li Wei.
Él cree que aunque las empresas emergentes no pueden competir con los fabricantes a gran escala en términos de recursos de hardware y fuerza de ingeniería, sus ventajas son que son más realistas y tienen una ruta de aterrizaje general o demanda de productos. modelos por el bien de los modelos grandes.
"El gran modelo básico no es monolítico, y hay espacio para la expansión. Las nuevas empresas pueden comenzar con un modelo de mil millones o diez mil millones, y luego decidir si continúan desarrollando un modelo de 100 mil millones de acuerdo con sus propias necesidades y seguir- aumentar los recursos", dijo Li Wei.
Muchas empresas de nueva creación siguen esta ruta al hacer modelos a gran escala. Por ejemplo, Baichuan Intelligence lanzó por primera vez un modelo de 7 000 millones de parámetros y todavía está entrenando un modelo de 50 000 millones de parámetros. Básicamente, ninguna empresa nueva elige hacer un modelo grande con 100 000 millones de parámetros.
En opinión de Li Wei, el tamaño del modelo no es el único indicador, y el escenario de aplicación también es una dimensión de referencia importante. "Para la mayoría de las aplicaciones, un modelo a gran escala es como un cañón que golpea a un mosquito. No solo lleva mucho tiempo inferirlo, sino que cuesta mucho y es difícil de aplicar y desplegar, y no hace mucho sentido en términos de efecto real".
Por lo tanto, Li Wei cree que competir ciegamente por la perfección no debería ser la corriente principal de la I + D y la innovación de modelos a gran escala. Es una competencia más significativa y saludable para promover que los modelos a gran escala sean livianos y verticalizados. importante.
Cheng Hao cree que en el futuro, muchas pequeñas y medianas empresas tendrán sus propios modelos verticales y las nuevas empresas tendrán más oportunidades para desarrollar aplicaciones o cadenas de herramientas en la vía vertical. "La mayoría de las instituciones de inversión todavía están buscando el camino de las industrias verticales, como Wang Xiaochuan y Wang Huiwen, en gran medida están apostando por las personas, no por hacer modelos a gran escala de propósito general".
Sin embargo, elegir la ruta técnica de la pista vertical también enfrenta muchos desafíos. Li Wei dijo francamente que la implementación a gran escala de modelos a gran escala en el campo vertical será más difícil de lo imaginado.
Él cree que uno de los desafíos actuales es que los cambios son demasiado rápidos y deslumbrantes. Es difícil para las empresas emergentes conectarse y seleccionar proveedores a gran escala. La mayoría de los modelos a gran escala aún no han producido servicios maduros que se puedan aplicar. , y el flujo ascendente y descendente no pueden ser perfectos El problema del acoplamiento y la coincidencia.
Al mismo tiempo, todavía existen problemas como la homogeneidad técnica y el interlaminado comercial. "Fomentar la competencia tecnológica y el desarrollo diferenciado de modelos, coordinar la cooperación empresarial y reducir la participación empresarial son las direcciones en las que las empresas tecnológicas y las comunidades deben trabajar juntas", apeló Li Wei.
Ver originales
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
La "verdad" del cuerpo a cuerpo del modelo a gran escala de AI: los inversores ven más e invierten menos, 20 empresas solo recibieron 6 mil millones de yuanes en financiamiento
Fuente: Tecnología Sohu
Autor: Liang Changjun
Editor: Yang Jin
“Mira más, vota menos”, “el ambiente de espera y observación es relativamente fuerte”. Hablando de la actitud de las instituciones de inversión hacia el modelo empresarial de inteligencia artificial a gran escala este año, este es el sentimiento de algunos inversores y empresarios nacionales.
Pero en la industria, los modelos grandes de IA siguen siendo populares. En la Conferencia Mundial de Inteligencia Artificial recién concluida, más de 30 modelos a gran escala mostraron sus músculos colectivamente. Las empresas nacionales de Internet y muchas empresas de inteligencia artificial han entrado en la pista caliente de los modelos a gran escala, y la batalla de los 100 modelos ya ha comenzado. .
En el mercado de capital de riesgo, grandes nombres como Wang Huiwen, Wang Xiaochuan y Li Kaifu ingresaron al mercado uno tras otro, llamando a ser OpenAI de China, ser el mejor modelo a gran escala en China, etc., convirtiéndose en un importante fuerza en esta ola de modelos a gran escala de IA.
Según estadísticas incompletas de Sohu Technology, en la primera mitad de este año, al menos 20 empresas modelo a gran escala recibieron más de 6.000 millones de yuanes en financiación. Desde una perspectiva global, la cantidad de financiamiento relacionado supera los 50, y China y Estados Unidos toman la delantera, con más de 20 cada uno, lo que implica un total de 100 mil millones de yuanes.
Aunque la cantidad de transacciones nacionales es relativamente grande, la cantidad solo representa el 6% del mundo.Los inversores nacionales no son generosos, y el mercado de inversión de modelos grandes de IA está un poco desierto.
Al mismo tiempo, no todas las partes han llegado a un consenso sobre el valor empresarial de los modelos grandes. Zhu Xiaohu, socio gerente de GSR Ventures, y Fu Sheng, presidente de Cheetah Mobile, han estado discutiendo entre ellos sobre esto anteriormente.
Cheng Hao, el fundador de Yuanwang Capital y Xunlei, consideró que no habrá más de 10 modelos de propósito general en el mundo y que hay pocas oportunidades para el espíritu empresarial. Básicamente, esto se ha convertido en un consenso en el círculo de inversión. El CEO de Baidu, Robin Li, también dijo antes que no hay necesidad de reinventar la rueda.
Pero a muchos empresarios les resulta difícil estar de acuerdo. Wang Xiaochuan cree que las nuevas empresas deben tener oportunidades y, sin la carga y la mayor presión comercial, funcionarán más rápido que las grandes empresas.
Li Wei, vicepresidente de ingeniería y científico jefe de Going out to Ask, dijo a Sohu Technology que es poco probable que los principales fabricantes monopolicen los modelos grandes de uso general. "Muchas empresas emergentes han lanzado modelos grandes, lo que demuestra que este asunto ya no es un gran problema".
A pesar de las diferencias, existe consenso en que la aplicación será clave. Desde esperar para ver si hacerlo, hasta la entrada de jugadores de todos los ámbitos de la vida, el gran modelo ha llegado a la etapa de responder cómo implementarlo. Ya sea una gran fábrica o una empresa nueva, esta es una hoja de respuestas obligadas.
El jefe tiene su propio halo cuando ingresa al juego, ¿quién está invirtiendo en el modelo grande?
Nació ChatGPT, marcando el pico del modelo grande de la tercera ola de IA, y un grupo de peces gordos comenzó sus propios negocios. Según las estadísticas incompletas de Sohu Technology, en la primera mitad de este año, al menos 20 empresas a gran escala obtuvieron financiamiento, y la mayoría de ellas se encontraban en la ronda ángel temprana o ronda A.
Estos empresarios básicamente tienen su propio halo, incluidos Kai-fu Lee, Wang Huiwen, Wang Xiaochuan, Li Zhifei, Zhou Bowen, etc., que tienen antecedentes empresariales o de gran escala, así como académicos novatos como la Universidad de Tsinghua, National People's Congreso y la Universidad de West Lake, entre las que destaca especialmente la Universidad de Tsinghua.Los profesores de Tsinghua respaldan la tecnología Shengshu, la tecnología Shenyan, el lado oscuro de la luna, la inteligencia Qingmao, la inteligencia Face Wall y la inteligencia Lingxin.
Desde la perspectiva de los inversores, no solo existen capitales industriales como Tencent, Baidu Ventures, Ant Group y TAL, sino también capitales de riesgo como Sequoia, IDG, ZhenFund, Sinovation Ventures, Qiming Ventures, Matrix Partners y Qiji Ventures. elenco. Sequoia es la más activa, con al menos 5 tomas, incluidas Light Years Beyond, Shenyan Technology, The Dark Side of the Moon y Project AI 2.0, mientras que Tencent ha invertido en Light Years Beyond, MiniMax y Shenyan Technology.
En términos de escala de financiación, la financiación total revelada por los proyectos en estas estadísticas supera los 6.000 millones de yuanes. Según datos públicos, en la primera mitad de este año, hubo 51 financiamientos corporativos que involucran grandes modelos de IA en el mundo, con un monto de inversión y financiamiento superior a 100 mil millones de yuanes, es decir, el número de transacciones nacionales representó casi el 40% , pero el monto de la financiación fue solo alrededor del 6%.
Múltiples transacciones a gran escala en el mercado de EE. UU. representaron la mayoría, incluida la inversión de $ 10 mil millones de Microsoft en OpenAI, Bill Gates, Microsoft, Nvidia, etc. lideró la inversión de $ 1.3 mil millones en Inflection AI, y la empresa de datos de EE. UU. Databricks adquirió MosaicML para $ 1.3 mil millones. Estas tres transacciones por sí solas representaron alrededor del 90% del total mundial.
Esto también muestra en cierta medida que, aunque los modelos nacionales a gran escala están fuertemente involucrados y las acciones de concepto en el mercado de capitales se han duplicado y disparado, los inversores en el mercado primario todavía son relativamente cautelosos, especialmente en transacciones de gran valor.
Qu Kai, el fundador de Chapter 42, que se dedica al negocio de FA de capital de riesgo, reveló que casi todos los fondos en dólares estadounidenses actualmente están considerando la IA, y algunos fondos en RMB también están interesados. "Muchas instituciones son muy positivas, pero al final no son muchas las que se moverán. Probablemente serán cincuenta o sesenta".
Li Wei, vicepresidente de ingeniería y científico en jefe, también puede sentir que la comunidad inversora está realmente muy preocupada por los grandes modelos, pero también es muy cautelosa. "Después de todo, esta es una nueva dirección tecnológica con una gran inversión, pero el modelo comercial actualmente no está claro".
Guo Tao, un inversionista ángel y experto senior en inteligencia artificial, analizó Sohu Technology y dijo que cada vez más instituciones de inversión se han dado cuenta de que los grandes modelos de IA enfrentan grandes montos de inversión, largos períodos de recuperación, bajas tasas de éxito, competencia feroz en la industria, y regulaciones cada vez más estrictas Y otros temas, por lo que el tiro tiende a ser cauteloso, y la atmósfera actual de esperar y ver es relativamente fuerte.
Al mismo tiempo, Guo Tao cree que no hay muchas empresas de inteligencia artificial a gran escala en las que valga la pena invertir en la actualidad. La mayoría de las empresas emergentes casi no tienen ventajas significativas en tecnología, datos y ecología.
Además, las valoraciones de muchas empresas estrella prometedoras son demasiado caras, normalmente a años luz de distancia. En solo tres meses, la valoración ha saltado de 200 millones de dólares estadounidenses a mil millones de dólares estadounidenses, y muchas instituciones están desanimadas. El final de esta empresa también es bastante vergonzoso. Meituan de Wang Xing "salvó" a sus hermanos e inversores con más de 2 mil millones de yuanes, y Wang Huiwen se fue temprano debido a una enfermedad.
Continuar con la preferencia de inversión en Internet y comenzar a luchar después de que la fiebre disminuya
En términos de la dirección de inversión específica de los grandes modelos de IA, las instituciones de inversión casi han seguido las preferencias de la era de inversión en Internet, y la capa de aplicación es la más popular. Cheng Hao dijo que Yuanwang Capital invierte principalmente en empresas de capa de aplicaciones y middleware.
Según los datos revelados por Qu Kai, entre los proyectos de IA que han recibido dinero este año, el 10 %-20 % son para modelos, el 20 %-30 % son para capas infra/intermedias y el 60 %-70 % son para capas de aplicación. . Si no se cuentan los proyectos que obtienen dinero, los proyectos que realizan aplicaciones pueden llegar al 95%.
Desde la infraestructura subyacente (como chips, marcos y otra infraestructura), hasta la capa de modelo, el middleware y varias aplicaciones, la industria de modelos a gran escala de IA también ha formado una estructura de pirámide invertida similar a la industria de chips. En el caso de que la capa inferior se base en tecnología extranjera de código abierto y sea difícil de superar, la mayoría de las nuevas empresas nacionales apuestan por la capa de aplicación, y la capa de modelo de alto costo es solo un juego para unas pocas empresas.
Li Wei cree que las empresas emergentes realizan principalmente modelos básicos a gran escala y aplicaciones posteriores de modelos a gran escala, y no es ni realista ni necesario hacer modelos básicos a gran escala. "Por lo tanto, muchas empresas emergentes tienden a postularse en escenarios verticales. Por medio de llamadas de API o implementación de privatización de OEM, aprovecharán los servicios de modelos grandes de proveedores de modelos grandes para centrarse en la investigación y el desarrollo innovadores de datos y aplicaciones. Esto ser una dirección relativamente clara".
Sin embargo, esta ola de locura por las grandes modelos parece haber comenzado a enfriarse. El ejemplo que se cita a menudo es el pico del tráfico de ChatGPT. Según los datos del sitio web de terceros SimilarWeb, el tráfico global del sitio web y el cliente móvil de ChatGPT disminuyó un 9,7 % mensual en junio de este año, la primera caída desde finales del año pasado, y el tiempo dedicado por Las visitas al sitio web también disminuyeron un 8,5%. Además, el tráfico de sitios web como Microsoft Bing y Character.AI también disminuyó en diversos grados en junio.
"El mercado se ha estado enfriando en los últimos uno o dos meses, porque los cambios cualitativos en los modelos grandes han disminuido recientemente y hay menos nuevos empresarios y nuevas historias que contar que a principios de año. Pero cada pista y El punto de acceso tiene sus propias ventajas y desventajas. Fu, esto es normal ", dijo Qu Kai.
Él cree que en la próxima etapa del gran modelo de IA, debemos trabajar duro para implementarlo. La próxima ola de puntos calientes probablemente será dos o tres meses después. Una gran cantidad de proyectos que recibieron dinero en la primera mitad del El año tardará unos meses en completar el lanzamiento del producto. Vea si hay más y mejores aplicaciones asesinas, y vea quién será el líder de la capa de aplicaciones.
De hecho, los principales fabricantes se esfuerzan actualmente por el desembarco y la aplicación comercial de modelos de gran tamaño. Cuando Huawei lanzó Pangu 3.0 recientemente, expresó que espera usarlo para ayudar a todos los ámbitos de la vida, en lugar de centrarse en el nivel del modelo de voz. "Estamos tan ocupados haciendo cosas que no tenemos tiempo para la poesía".
Guo Tao cree que, aunque el modelo de IA se ha enfriado, durará aproximadamente un año en total y el enfoque cambiará gradualmente del nivel de tecnología subyacente al nivel de aplicación vertical.
Li Di, CEO de Xiaoice, consideró que la homogeneización de modelos grandes es grave ahora, y que no hay necesidad de tantos modelos grandes en el mercado. La fiebre debería disminuir en 2024, y se encuentra que quién está en la orilla y que está nadando desnudo.
¿No hay posibilidad de modelo general? La homogeneización de la pista vertical es grave
Para los empresarios, cómo pensar en la dirección antes de ingresar al mercado es extremadamente crítico. Zhu Xiaohu dijo que ChatGPT es muy poco amigable con las empresas nuevas y abandonará las fantasías financieras en los próximos dos o tres años. Fu Sheng se quejó de esto y dijo: "Nuestros inversores son ignorantes y los que no tienen miedo".
Más tarde, Zhu Xiaohu explicó que no negó las oportunidades empresariales en el campo de los modelos a gran escala, pero recordó a los empresarios que no deben ser supersticiosos con respecto a los modelos a gran escala de propósito general. "Para la mayoría de los empresarios, los escenarios son la prioridad y los datos son el rey".
Esta visión se ha convertido básicamente en el consenso del actual círculo de inversión nacional. Guo Tao cree que los modelos a gran escala de propósito general formarán una cierta situación de monopolio, y los empresarios y las "pequeñas fábricas" estarán en desventaja en términos de capital, tecnología, datos y ecología cuando implementen modelos a gran escala de propósito general. .
"El foso del modelo a gran escala de propósito general es muy alto y su efecto de red también es fuerte. Los comentarios de los usuarios lo harán cada vez más inteligente, y la empresa que lo fabrique primero tendrá la ventaja de ser el primero en moverse". Hao también cree que no hay ninguna posibilidad de que las empresas emergentes fabriquen un modelo a gran escala de propósito general, ya que solo las grandes fábricas pueden permitírselo.
Al mismo tiempo, cree que el modelo base general no requerirá tantas empresas en el futuro. "Tal vez no haya más de 10 modelos de propósito general de código cerrado y de código abierto que se puedan usar en el mundo en el futuro, lo cual es demasiado".
Pero muchos empresarios no están de acuerdo. "Muchas empresas de nueva creación han lanzado modelos a gran escala, lo que demuestra que este asunto no es un gran problema. Si se trata de alcanzar el nivel de GPT-4, también es muy difícil para los principales fabricantes, y parece imposible de monopolizar. ahora", dijo Li Wei.
Él cree que aunque las empresas emergentes no pueden competir con los fabricantes a gran escala en términos de recursos de hardware y fuerza de ingeniería, sus ventajas son que son más realistas y tienen una ruta de aterrizaje general o demanda de productos. modelos por el bien de los modelos grandes.
"El gran modelo básico no es monolítico, y hay espacio para la expansión. Las nuevas empresas pueden comenzar con un modelo de mil millones o diez mil millones, y luego decidir si continúan desarrollando un modelo de 100 mil millones de acuerdo con sus propias necesidades y seguir- aumentar los recursos", dijo Li Wei.
Muchas empresas de nueva creación siguen esta ruta al hacer modelos a gran escala. Por ejemplo, Baichuan Intelligence lanzó por primera vez un modelo de 7 000 millones de parámetros y todavía está entrenando un modelo de 50 000 millones de parámetros. Básicamente, ninguna empresa nueva elige hacer un modelo grande con 100 000 millones de parámetros.
En opinión de Li Wei, el tamaño del modelo no es el único indicador, y el escenario de aplicación también es una dimensión de referencia importante. "Para la mayoría de las aplicaciones, un modelo a gran escala es como un cañón que golpea a un mosquito. No solo lleva mucho tiempo inferirlo, sino que cuesta mucho y es difícil de aplicar y desplegar, y no hace mucho sentido en términos de efecto real".
Por lo tanto, Li Wei cree que competir ciegamente por la perfección no debería ser la corriente principal de la I + D y la innovación de modelos a gran escala. Es una competencia más significativa y saludable para promover que los modelos a gran escala sean livianos y verticalizados. importante.
Cheng Hao cree que en el futuro, muchas pequeñas y medianas empresas tendrán sus propios modelos verticales y las nuevas empresas tendrán más oportunidades para desarrollar aplicaciones o cadenas de herramientas en la vía vertical. "La mayoría de las instituciones de inversión todavía están buscando el camino de las industrias verticales, como Wang Xiaochuan y Wang Huiwen, en gran medida están apostando por las personas, no por hacer modelos a gran escala de propósito general".
Sin embargo, elegir la ruta técnica de la pista vertical también enfrenta muchos desafíos. Li Wei dijo francamente que la implementación a gran escala de modelos a gran escala en el campo vertical será más difícil de lo imaginado.
Él cree que uno de los desafíos actuales es que los cambios son demasiado rápidos y deslumbrantes. Es difícil para las empresas emergentes conectarse y seleccionar proveedores a gran escala. La mayoría de los modelos a gran escala aún no han producido servicios maduros que se puedan aplicar. , y el flujo ascendente y descendente no pueden ser perfectos El problema del acoplamiento y la coincidencia.
Al mismo tiempo, todavía existen problemas como la homogeneidad técnica y el interlaminado comercial. "Fomentar la competencia tecnológica y el desarrollo diferenciado de modelos, coordinar la cooperación empresarial y reducir la participación empresarial son las direcciones en las que las empresas tecnológicas y las comunidades deben trabajar juntas", apeló Li Wei.