Fuente original: Agencia de Selección de Ballenas AI
Fuente de la imagen: Generada por Unbounded AI
En 2023, la noticia de que la conocida institución de inversión Tiger Fund no logró recaudar fondos se extendió silenciosamente por Internet.
En los últimos 10 años, cuando me acostumbré a montar un negocio en el viento, parece que apareció por primera vez el "invierno inversor". Esto está estrechamente relacionado con varios factores desfavorables, como el nuevo consumo, la transmisión en vivo y Metaverse. Los canales de salida, como las fusiones y adquisiciones y las acciones conceptuales chinas, están medio cerrados. El mercado de capital de riesgo parece estar realmente desierto.
Es difícil para las empresas de nueva creación recaudar fondos, y es difícil para el jefe encontrar una dirección para su segunda empresa. Wang Huiwen, quien se retiró de Meituan, ha estudiado Web3 y Metaverse durante mucho tiempo. Wang Xiaochuan, quien dejó la compañía después de ser adquirida por Tencent, probó las aguas de la atención médica de IA. Pero todo cambió a fines de 2022, cuando se lanzó ChatGPT 3.5, que rápidamente formó un consenso en el mercado.Llegó la era de AGI (Inteligencia Artificial General), y toda la industria comenzó a toparse con modelos a gran escala.
Se entiende que Wang Xiaochuan, que en ese momento estaba iniciando un negocio discreto, ya había establecido una empresa para fabricar hardware inteligente. Destinado a ayudar a cientos de millones de personas con trastornos del sueño, crea una almohada inteligente para tratar los ronquidos. Cuando surgió el auge de los modelos a gran escala en marzo, Wang Xiaochuan pasó dos semanas tomando la decisión de abandonar este proyecto empresarial y diseñar modelos a gran escala.
Wang Xiaochuan reclutó al ex CTO de Sogou, Yang Hongtao, para ayudar a hacerse cargo del proyecto médico. Las acciones del ex COO de Sogou, Ru Liyun, también se intercambiaron a Yang Hongtao, siguiendo el modelo comercial a gran escala de Wang Xiaochuan. Wang Xiaochuan gastó un total de 50 millones de dólares estadounidenses para establecer "Baichuan Smart" e invitó a los talentos técnicos de Soul a ser la persona a cargo del algoritmo para acelerar la producción de modelos grandes. Y la historia de Wang Huiwen, todos están muy familiarizados con ella. Se publicaron puestos de reclutamiento de héroes en la mesa de vino, y se estableció una compañía a años luz de distancia para hacer un modelo grande.
En las grandes empresas de Internet, el gran modelo también ha traído una influencia trascendental. El responsable del proyecto con una gran maqueta se propuso dimitir hace unos años por el problema de no conseguir el ascenso. Tres meses más tarde, el director general del grupo se convirtió en director general del modelo grande, aprovechando la fuerza de la empresa para Todo en el modelo grande.
Nadie quiere perderse esta ola de la era AGI, todos creen que después de tres altibajos en el desarrollo de la IA, la singularidad de la inteligencia artificial general está llegando. Después de todo, bajo el auge de la IA, docenas de empresas como ChatGPT y Midjourney han creado una valoración de alrededor de 4 000 millones de USD. El valor de mercado total de las "Siete Grandes" en el mercado de valores de EE. , un aumento del 60%. Estas emocionantes historias de crecimiento explosivo han agitado una vez más el mercado empresarial tecnológico nacional.
** Entre las principales empresas de Internet en China, Li Yanhong, Zhang Yong, Zhang Yiming, Wang Xing y otros grandes nombres ya han tomado personalmente el mando. Se puede decir que, excepto Pinduoduo, todos ellos han entrado en el gran modelo. ** El 19 de julio, el valor de mercado de Microsoft y Nvidia aumentó en $ 175 mil millones, se maravilló Musk al evaluar los tweets relacionados: "Tiempos locos".
El mercado de la tecnología y los negocios que está a punto de quedarse en silencio dio paso repentinamente al estimulante de la IA, que también llevó a Internet a su último carnaval.
1. Un Nuevo Amanecer en el Valle Bajo
Li Ming es el director ejecutivo de una empresa nueva con un equipo de más de 100 personas. 2023 es el año en el que más le preocupa la financiación.
El proceso de iniciar un negocio fue muy sencillo al principio, y en la etapa inicial obtuvo financiamiento ángel y de ronda A de instituciones de inversión ángel conocidas. "En ese momento, Internet industrial todavía era una pista popular y no era tan exagerada como muchos proyectos de IA", dijo Li Ming a AI Jingxuan, pero a mediados de 2023, en la nueva ronda de financiación que lanzó, lentamente descubrió que el mercado no estaba bien. .
Las instituciones de inversión no solo analizan los datos y las historias, sino también los ingresos. Li Ming, que antes estaba obsesionado con la producción, no se ha dado cuenta del cambio de dirección del viento de inversión en absoluto. Según el discurso de Wu Shichun, socio fundador de Meihua Venture Capital, los proyectos de inversión actuales "no solo necesitan (tecnología), sino también (datos) e (ingresos)". De ninguna manera, comenzó a buscar instituciones de FA para ayudarlo con el financiamiento, y las rondas de financiamiento también retrocedieron, solicitando una A ++.
“FA ayudó a encontrar más de 30 instituciones de inversión, pero no pasó nada.” El fracaso de la financiación hizo que Li Ming se desanimara un poco. Pero en junio, sintió el poder del gran modelo, por lo que lanzó un negocio industrializado basado en ChatGPT internamente. "Aún no hemos recaudado fondos, pero los inversores tomarán la iniciativa de comunicarse con ellos y la otra parte obviamente está interesada".
Para la tecnología de primera clase de Yuan Jinhui, el modelo grande también es una pajita que salva vidas. En 2022, esta empresa, que crea un marco de aprendizaje profundo de IA, ha llegado al punto en que la financiación no es fluida y tiene que despedir empleados para sobrevivir. La compañía estuvo a punto de romper su cadena de capital tres veces antes, y todos pidieron dinero prestado a Su Hua, un inversionista ángel que también era el director ejecutivo de Kuaishou en ese momento.
"Lo que hacemos es similar a Flying Paddle de Baidu y Shengsi de Huawei. Lo más importante es que el negocio del entrenamiento de modelos a gran escala en el mercado aún no ha comenzado". la empresa pertenece al momento en que es rico (2021)) no tiene negocios, y cuando hay negocios (2023), no habrá dinero.
Justo cuando Yuan Jinhui sintió que el futuro no tenía esperanza, la compañía también presentó una oportunidad de adquisición en 2023. En abril de 2023, en la empresa de tecnología de primera clase en el Parque Científico y Tecnológico de Tsinghua, se recibió a un invitado distinguido: Wang Huiwen, cofundador de Meituan, quien acababa de anunciar su entrada en el modelo a gran escala.
El precio de compra final no fue malo. Un empleado de tecnología de primera clase que fue despedido le dijo a AI Whale Selection Agency: "Es comparable a la valoración de la última ronda de inversión de Hillhouse Capital, y también se han encontrado mis propias opciones".
Y Yuan Jinhui, quien se convirtió en cofundador de Light Years Away, finalmente ya no tiene que preocuparse por la financiación. La capacidad financiera de Wang Huiwen es insuperable en el círculo de capital de riesgo actual. Según el acuerdo de adquisición posterior de Meituan, Light Years Away recaudó 2 mil millones de yuanes sin productos modelo a gran escala.
Por supuesto, los inversores que se desplegaron antes en esta ola de acciones han cazado unicornios con éxito.
Minimax se estableció en noviembre de 2021, recibió una inversión de ronda ángel en enero de 2022 y la valoración de la empresa alcanzó el nivel de unicornio a principios de 2023. Entre las primeras cuatro instituciones de inversión, también se encuentra la compañía de juegos de Shanghai Mihayou.Se informa que los dos ejecutivos fundadores tienen lazos familiares. Según Jingxuan News, Zhipu también ha recaudado fondos recientemente con una valoración de 10.000 millones de yuanes.
**Estas dos empresas se establecieron hace menos de 2 años, pero ambas se han convertido en unicornios y la velocidad de desarrollo de la pista de modelos a gran escala es asombrosa. **
Y el auge de AGI también es una salvación para esas viejas empresas de IA. Anteriormente, la historia de salir a preguntar por el listado de IoT ha pasado varias veces sin éxito. Con el lanzamiento de la historia del modelo a gran escala "Serial Monkey" y cuatro productos AIGC, aunque el modelo a gran escala todavía tiene cuidado de no ser evaluado públicamente, también permite que Momenwen finalmente tenga una nueva historia que contar, y se ha presentado la solicitud de cotización en el mercado de valores de Hong Kong.
Más modelos a gran escala y emprendedores AIGC están en camino. Incluso en un campamento de inicio, el 60% de los proyectos están relacionados con la IA. Con las ventajas de activos ligeros, barreras altas y techos altos, AGI se ha convertido completamente en la competencia más candente. en este momento carretera.
**2.Lleva el sueño de AGI a su punto máximo
Si 2023 es el "primer año" del emprendimiento modelo a gran escala. Luego, el "año de origen" cuando los gigantes de Internet ingresaron por primera vez al gran modelo se remonta a 2019.
Ali comenzó a diseñar el modelo grande en septiembre de 2019 y lanzó el modelo grande PLUG en abril de 2021. Antes del lanzamiento de ChaTGPT 3.0, ya había muchos modelos grandes con billones de parámetros en China, como el M6 de Bodhidharma Academy, el modelo Pangu de Huawei Cloud y el Enlightenment 2.0 de Zhiyuan. En comparación con ChaTGPT, aunque se superan los parámetros del modelo, la abundancia de datos no es la misma y el efecto no se puede comparar. Según Zhang Cong de Dharma Academy, lo más importante es que los grandes modelos domésticos no se hacen dos cosas.
Lo primero es que no se hace ninguna alineación. En ese momento, Ali tenía muchos modelos grandes y pequeños, y principalmente no alineaba los resultados del entrenamiento. "Puedes ver que ChatGPT puede componer poemas y chatear, lo cual es muy similar a la inteligencia humana. De hecho, está alineado con los valores humanos", dijo Zhang Cong, todo esto requiere ajustes artificiales a los resultados del razonamiento, en lugar de la lógica de la máquina. . .
En segundo lugar, no hay un conjunto de datos de alta calidad. ChatGPT usó profesores universitarios en Filipinas para el etiquetado de datos en los primeros días, mientras que estudiantes de escuelas secundarias técnicas nacionales se usaron para el etiquetado. El problema del corpus también afectó en gran medida los resultados. En opinión de Zhang Cong, el modelo de Chat perfeccionado de Llama 2 lanzado el 19 de julio se entrenó con 1 millón de datos etiquetados por humanos, y la cantidad total de tokens de entrenamiento aumentó en un 40 %. En comparación con Llama, la mejora es integral. . "** Entonces, el modelo grande no es una invención de milagros, sino una creación de ingeniería bien diseñada". **
Y mirando hacia atrás en la industria nacional de IA, también enfrentará la interferencia de muchos otros factores. En ese momento, la Academia Bodhidharma tenía dos equipos principales trabajando en modelos a gran escala, uno era el equipo de inteligencia artificial dirigido por Jin Rong, y Si Luo estaba a cargo de AliciMind; el otro era el laboratorio de lenguaje natural dirigido por Zhou Jingren, de que Yang Hongxia estuvo a cargo del modelo a gran escala M6.
En la evaluación a fines de 2022, los resultados del modelo grande M6 tienen una ligera ventaja, y los dos finalmente se integran en el modelo grande Tongyi actual. "En realidad, solo hay 20 o 30 personas en el gran equipo modelo del Instituto Dharma, y su entrenamiento previo se realiza principalmente en Alibaba Cloud", dijo Zhang Cong a la Agencia de Selección de Ballenas AI, pero ahora Tongyi es un proyecto importante del grupo. Son más de 600 personas, y ahora se dedican muchos recursos a modelos grandes.El CEO del grupo pregunta sobre el progreso técnico cada 2 semanas.
Para Baidu, esta ola de auge de AGI, pero la era de la IA que ha predicho desde 2016, naturalmente no se la perderá.
Fue aprobado oficialmente internamente el 7 de febrero de este año y lanzado oficialmente el 16 de marzo. Durante este período, fue ascendido directamente al proyecto de mayor prioridad del Grupo Baidu. Li Yanhong supervisó personalmente la batalla, y el CTO Dr. Wang Haifeng se hizo cargo directamente. En ese momento, el Centro de Supercomputación Baidu Yangquan se dedicó al entrenamiento de modelos a gran escala. .
El ingeniero de algoritmos de Baidu, Zhao Hui, le dijo a AI Whale que el Departamento de Procesamiento del Lenguaje Natural de Baidu ha estado investigando la PNL y otras tecnologías, y que el científico jefe Wu Hua también ha sido el líder. Hay cientos de personas en este departamento. ERNIE2.0 de Baidu se ha transformado en un modelo grande de Wenxin, "Solía hacer cerebros de Baidu, pero ahora se dice que es un modelo grande de Wenxin".
Hay similitudes en lo que hacen, pero por supuesto que hay diferencias. Zhao Hui mencionó que en el pasado, Baidu hacía mucho ranking de búsqueda vertical, solo para reordenar los resultados de búsqueda en función de los clics humanos. Después de la aparición del modelo grande, estas capacidades se depositarán en el algoritmo del modelo grande, lo que también ayudará a dar respuestas más precisas.
Para Baidu, el modelo grande promueve cambios cualitativos en la próxima generación de búsqueda, que se ha escrito en el OKR de Robin Li. Sin embargo, en términos de ecología, el modelo Wenxin de Baidu se basa en el modelo Bert. "GLM, incluido el de Zhiyuan, es una ruta técnica independiente, que es diferente del GPT internacional". no hay necesidad de preocuparse por esto Wenxin Qianfan tiene todo tipo de modelos, y GPT2, 3 y 4 también son muy diferentes.
En cuanto a Yang Hongxia, quien renunció a Ali, también fue contratada por ByteDance para ser la jefa de investigación y desarrollo de modelos grandes de América del Norte después de que se fue al extranjero. Zhang Yiming ha estado investigando si el modelo grande será de código abierto o cerrado, por lo que no pidió concentrarse en el trabajo. "Habrá un gran avance antes de fin de año", dijo Yang Hongxia a la Agencia de Selección de Ballenas AI.
En general, ByteDance debería ser una empresa que se adapte mejor al gran modelo en los negocios después de Baidu. Un cazatalentos le dijo a la Agencia de Selección de Ballenas AI que, aunque el gran modelo no tiene prisa, sigue siendo bastante radical en el campo de AIGC. Por ejemplo, Tiktok está haciendo negocios publicitarios creativos AIGC, el puesto de director otorga un presupuesto de 100-150 W y el requisito es liderar el equipo después de 1988.
Hasta ahora, excepto Pinduoduo, todas las principales empresas de Internet han entrado en el gran modelo. El entusiasmo de los grandes fabricantes por entrar en el juego es incluso mayor que el de O2O y la transmisión en vivo en ese entonces.
**3.La noche en que apareció de repente la cuenca
En junio, en el Edificio Sohu en Beijing, esta empresa modelo a gran escala con la mayor cantidad de financiamiento está en pleno apogeo.
El marco de aprendizaje profundo Oneflow de la tecnología original de primera clase todavía está pensando en continuar haciéndolo, pero el gran modelo de negocio ha transferido a muchas personas. Pero el 23 de junio, alguien reveló repentinamente en las redes sociales que Wang Huiwen estaba enfermo. En ese momento, alguien de la compañía fue a verificarlo, pero no recibieron tal noticia. Sin embargo, en la noche del 25, Meituan anunció repentinamente que el cofundador Wang Huiwen fue hospitalizado debido a una depresión y renunció al cargo de director de la empresa.
Por un tiempo, la noticia de que Wang Huiwen se escapó temprano se convirtió en una conjetura de algunas personas. La noticia que Jingxuan recibió del círculo de inversionistas es que la condición de Wang Huiwen es realmente muy grave. Al final, el hermano de Wang Huiwen que dormía en la litera superior, Wang Xing, el fundador de Meituan, ayudó a hacerse cargo del negocio a años luz de distancia.
¿Está realmente muerta la gran modelo?Todo el mundo tiene esta pregunta. Durante ese período, Zhu Xiaohu, un conocido inversor, y Fu Sheng, el fundador de Cheetah, también discutían en el círculo de amigos si había una burbuja en la industria de modelos a gran escala. Zhu Xiaohu es extremadamente pesimista sobre la situación actual del mercado que acude en masa para fabricar modelos a gran escala de uso general, y cree que la mayoría de ellos morirán a finales de año.
¿El cambio activo que está a años luz de distancia también confirma los comentarios de Zhu Xiaohu?
Según la información obtenida de la AI Whale Selection Agency, la adquisición de Meituan, que está a años luz, no ha detenido el ritmo de los grandes modelos. No solo ha invertido exclusivamente varios cientos de millones de yuanes en Zhipu AI, sino que actualmente también está reclutando directores de proyectos para modelos a gran escala, con un salario anual de hasta 3 millones de yuanes, e incluso estableció un instituto de investigación tecnológica en los Estados Unidos. . Meituan, que gana dinero ganado con tanto esfuerzo, no quiere quedarse atrás en esta ola de tecnología, especialmente después de que Ele.me claramente quiere conectarse al modelo grande de Tongyi, y Ctrip, que tiene competencia comercial, también ha lanzado un modelo grande. .
Pero para el mercado interno, de hecho, hay demasiados modelos grandes de propósito general. Según estadísticas incompletas, en menos de 8 meses se han lanzado al mercado más de 85 modelos grandes, muchos de los cuales se han convertido en conceptos de cash-out de empresas cotizadas.
Los datos de Wind muestran que en 2023, 24 "acciones conceptuales de AIGC" han sufrido un total de 67 reducciones de acciones, y la ola de divorcios de los principales accionistas también es sorprendente. Desde principios de 2023, las familias de los principales accionistas de casi diez empresas del sector de la IA han estado expuestas al divorcio. Lo que ha llamado mucho la atención es que Kunlun Wanwei, una empresa de inteligencia artificial con acciones A, informó recientemente que la Sra. Li Qiong (la ex esposa del fundador Zhou Yahui), que representa el 11 % de las acciones, planea reducir sus participaciones. por el 3% de las acciones (alrededor de 1,3 mil millones de yuanes), y luego pagar intereses prestados a la empresa. Según la introducción del informante a Jingxuan, Kunlun Wanwei, que sintió los beneficios de AGI, no solo fabricó modelos a gran escala, sino que también formó un equipo de manera intensiva recientemente y se esforzó al máximo para crear Copilot, que es un punto de referencia frente a Microsoft.
Las empresas que cotizan en bolsa utilizan AGI para aprovechar el concepto de especulación y retiro de efectivo. Startups de grandes modelos introvertidas hasta la muerte.
Zhang Yang, un inversionista que recientemente estableció AIGC Fund, le dijo a AI Whale que con el lanzamiento de Llama 2, de código abierto, gratuito y poderoso, muchas empresas a gran escala inevitablemente enfrentarán dificultades financieras en la segunda mitad del año.
Ahora todo ya está en el horizonte. El 11 de julio, Baichuan Intelligent lanzó el Baichuan-13B, un modelo grande con decenas de miles de millones de parámetros. No solo anunció que era de código abierto, sino también gratuito para uso comercial. Aunque la escala de parámetros de Baichuan-13B no es grande, según el entrenamiento preciso del corpus chino, Baichuan a menudo ocupa el primer lugar entre los modelos grandes con decenas de miles de millones de parámetros.
La estrategia gratuita de Baichuan-13B ha tenido un gran impacto en el mercado pago de modelos a gran escala en China. En la actualidad, Zhiyuan AI anunció el día 14 que el registro empresarial ha sido autorizado para permitir el uso comercial gratuito de ChatGLM-6B y ChatGLM2-6B.
Después de que más y más modelos grandes sean de código abierto y gratuitos, comienza oficialmente la competencia de eliminación directa para modelos grandes. Un CTO de una empresa nueva basada en modelos a gran escala le dijo a AI Whale Selection Agency que los modelos a gran escala de Zhiyuan costaron 20 millones de yuanes desde el despliegue inicial del dominio privado, y el precio de las llamadas a principios de año fue de 1,8 millones a 300.000 paquetes La industria está cambiando muy rápido. **Fu Sheng cree que esta es la transición del mercado de una competencia de parámetros de modelos grandes a una competencia de escala ecológica. **
Las grandes empresas de Internet no se preocupan por la construcción ecológica. Como hay muchos modelos internos, también hay modelos gratuitos y de pago. Los modelos grandes más importantes siguen siendo de código cerrado y de pago. Es más difícil para las empresas de nueva creación establecer una ecología. Muchas empresas de nueva creación han agotado sus esfuerzos para construir un modelo a gran escala, y es inevitable que no puedan hacer la ecología. Se entiende que MiniMax es actualmente una de las pocas empresas emergentes que se adhiere a la nube pública y es una empresa a gran escala en el modelo MaaS.
Fan Kai, CTO de Clove Garden, describió esta ola de código abierto y gratuito, como llevar plantas de agua (modelos grandes) a los hogares de los usuarios de forma gratuita, para que todos tengan un grifo. Para esas plantas de agua de código cerrado, es mejor que su el agua es invencible y deliciosa, todos están dispuestos a pagar para ir a ti.
**4.El desarrollo de AGI entra en una bifurcación en el camino
Después del surgimiento de la línea divisoria de aguas, el ex presidente del comité técnico del Grupo Jingdong y fundador de Lianyuan Technology le dijo a AI Whale que la competencia empresarial actual ya ha desarrollado tres facciones.
Un grupo insiste en modelos grandes completamente desarrollados por ellos mismos, y este grupo está formado por jugadores poderosos. Esta facción está compuesta principalmente por las principales empresas de Internet como Baidu, Ali y Byte, así como por empresas emergentes como Zhipu, MiniMAX y Lianyuan. Pero estos poderosos jugadores también se dividen en dos tipos de empresas.
La primera categoría es insistir en hacer modelos grandes de uso general de desarrollo propio, compararlos con ChatGPT y ponerse constantemente al día con la velocidad de iteración de ChatGPT.
En opinión de Chen Yu, socio gerente de Yunqi Capital, los modelos a gran escala de propósito general son el único camino a seguir, y el desarrollo de modelos verticales a gran escala es limitado. "Porque para el modelo grande general, no es necesario volver a entrenar el campo vertical. El modelo grande general se puede profundizar a través de la base de datos vectorial, pero el modelo grande vertical es difícil de emerger de manera inteligente".
A juzgar por la situación actual, aquellos que tienen un sueño deben hacer un modelo a gran escala de propósito general, después de todo, puede convertirse en la próxima gran empresa de Internet. ChatGPT ha demostrado este potencial disruptivo en los campos de la oficina colaborativa, el comercio electrónico, la generación de código y el diseño auxiliar.
La segunda categoría es reconocer la realidad, enfocarse en aterrizar e insistir en hacer modelos verticales a gran escala. Este grupo incluye a Zhu Xiaohu y Fu Sheng, quienes finalmente llegaron a un consenso. Ambos creen que los modelos verticales a gran escala tendrán más aplicabilidad industrial.
Los modelos grandes de propósito general generalmente tienen más de 100 mil millones de parámetros, mientras que los modelos grandes verticales tienen una escala de alrededor de 10 mil millones o 7 mil millones. Al igual que el producto modelo a gran escala ProductGPT de Lianyuan Technology y el producto modelo a gran escala Cao Zhi de Daguan Data, los parámetros están en las decenas de miles de millones.
Lianyuan Technology no es una escuela paramétrica de modelos grandes. "Tenemos las capacidades básicas de los modelos grandes generales, pero creemos que los algoritmos técnicos, las iteraciones de modelos y los bucles cerrados de escena son todos más críticos".
En comparación con Lianyuan, que presta más atención a la escena, Daguan presta más atención a los datos.
Según Chen Yunwen, CEO de Daguan Data, le dijo a AI Jingxuan que el modelo grande "Cao Zhi" adopta un esquema de datos de entrenamiento mixto, que es 50 % de corpus mixto general + 50 % de corpus profesional vertical. "Hemos estado haciendo inteligencia de texto en los campos de finanzas y asuntos gubernamentales durante muchos años. Muchos datos son únicos y los clientes también nos piden que hagamos capacitación en privatización". Chen Yunwen le dijo a AI Whale Selection Agency: "En el pasado, cuatro o cinco personas solían hacer un trabajo a la semana. Informe, ahora la IA se hace en medio día".
Solo renunciando al sueño de convertirse en el próximo ChatGPT puede aterrizar lo antes posible en la escena comercial, que es la cognición sobria de muchos modelos verticales.
** Desde la perspectiva de la industria, la segunda ruta al templo AGI se basa en los modelos de otras personas (como GPT) y luego se combina con su propia industria Know-how para la capacitación. ** "Creo que tomará tiempo verificar si la segunda categoría puede tener éxito. Todavía no está claro. La razón es que todavía no todos saben cómo integrar el Know-how de la industria con el modelo grande. Al mismo tiempo tiempo, hay un modelo de negocio sostenible, que aún se desconoce”.
"En particular, se sospecha que muchos modelos grandes han sido bombardeados", dijo Zhang Yang, un inversionista, a la Agencia de Selección de Ballenas AI. Al combinar industrias para la comercialización, se enfrentarán a muchos problemas. Se informa que los modelos grandes de dos empresarios conocidos con el mismo apellido se basan en Llama de código abierto de Facebook; una empresa de juegos y protección utiliza el marco básico del modelo grande de Zhiyuan.
Se acerca un modelo de código abierto más fuerte. Meta lanzó recientemente la versión comercial gratuita Llama 2. Fu Sheng dijo en el círculo de amigos: "No sé cuántas empresas se despiertan riendo en medio de la noche, cuántas empresas lloran". en el baño ... "Zhu Xiaohu también comentó sobre esto: muchas personas están a punto de despertarse, todos pueden tomar un viaje gratis".
El "despertar con una sonrisa" de Fu Sheng es ligeramente diferente al de Zhu Xiaohu. Fu Shengxiaoxing se refiere a las empresas que utilizan modelos grandes de código abierto para desarrollar aplicaciones AIGC y también pueden producir mejores productos. Zhu Xiaohu Xiaoxing se refiere a esas empresas modelo a gran escala que afirman ser de desarrollo propio pero en realidad cubren el caparazón. Recientemente, ellos anunciará una actualización. . A lo que todos se refieren es a lo mismo, son todas empresas de modelos a gran escala que dicen ser de desarrollo propio, Llama 2, uno de los modelos a gran escala extranjeros más potentes, anunció que es de código abierto y gratuito. en el mismo modelo grande de código abierto.¿Cómo hacer capacidades únicas en la industria?
**La tercera ruta de AGI es la aplicación pura, que consiste en usar el modelo directamente, que tendrá barreras más bajas. **Zhu Xiaohu tampoco es optimista sobre este tipo de modelo, pensando que si ChatGPT proporciona el 90% de las capacidades, entonces las aplicaciones AIGC no tienen valor de inversión.
En el ecosistema OpenAI, Sam Altman prometió evitar hacer la capa de aplicación tanto como fuera posible y competir con los desarrolladores del ecosistema, por lo que imitó a Google e hizo el complemento ChatGPT.Desde el punto de vista actual, nadie en China ha hecho tal compromiso. .
Ha habido cientos de actualizaciones de funciones para Wenxinyiyan y Tongyiqianwen, y estas funciones también han cubierto el trabajo de algunos desarrolladores. Aunque Wenxin Yiyan también tiene complementos, actualmente solo hay dos, uno es Baidu Search y el otro es ChatFile (capacidades de análisis y procesamiento para documentos largos). Cómo coordinar el desarrollo ecológico de Baidu Qianfan y Alimodao sigue siendo una propuesta desafiante.
Zhu Xiaohu, quien es firmemente optimista sobre AGI, cree que la ventana de inversión y emprendimiento para modelos a gran escala de uso general ha pasado, y AIGC, que no depende absolutamente de las capacidades de un cierto modelo a gran escala, es el bajo -Fruto colgante de la era AGI. Por ejemplo, la "Cámara Miaoya", que de repente se ha vuelto popular en el círculo de amigos recientemente, es el primer producto AIGC que se vuelve popular en China, y un producto similar "lensa" también se ha hecho popular en el extranjero, con un ingreso mensual de 8 millones de dólares.
Cuando llegó la ola de los tiempos, el inversionista Wu Shichun una vez le preguntó en broma a Zhu Xiaohu: "¿El dinero ganado al invertir en IA compensó el dinero perdido al invertir en SaaS?" Zhu Xiaohu respondió, todavía no, pero la IA tiene perspectivas ilimitadas. .
En la actualidad, el círculo de capital de riesgo también reconoce la verdad expresada por Zhu Xiaohu, pero muchas personas no esperan que Zhu Xiaohu diga la verdad, como "ChatGPT es muy hostil para las empresas nuevas, abandone las ilusiones financieras en el próximo dos o tres años" Estas escalofriantes palabras.
"El gran modelo es la propiedad inmobiliaria de Internet, incluso si hay una burbuja, es una burbuja hermosa", dijo un empresario que acababa de terminar la educación y capacitación vocacional de IA. Lei Jun gritó una vez cuando el dividendo de Internet desaparecido en 2013, hay que creer en El poder de Internet, hoy también hay que creer en AGI, tenga burbuja o no.
Nota: Li Ming, Zhang Cong, Zhao Hui, etc. son seudónimos en este artículo.
Ver originales
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
El Momento de la Singularidad, el Último Carnaval de Internet
Fuente original: Agencia de Selección de Ballenas AI
En 2023, la noticia de que la conocida institución de inversión Tiger Fund no logró recaudar fondos se extendió silenciosamente por Internet.
En los últimos 10 años, cuando me acostumbré a montar un negocio en el viento, parece que apareció por primera vez el "invierno inversor". Esto está estrechamente relacionado con varios factores desfavorables, como el nuevo consumo, la transmisión en vivo y Metaverse. Los canales de salida, como las fusiones y adquisiciones y las acciones conceptuales chinas, están medio cerrados. El mercado de capital de riesgo parece estar realmente desierto.
Es difícil para las empresas de nueva creación recaudar fondos, y es difícil para el jefe encontrar una dirección para su segunda empresa. Wang Huiwen, quien se retiró de Meituan, ha estudiado Web3 y Metaverse durante mucho tiempo. Wang Xiaochuan, quien dejó la compañía después de ser adquirida por Tencent, probó las aguas de la atención médica de IA. Pero todo cambió a fines de 2022, cuando se lanzó ChatGPT 3.5, que rápidamente formó un consenso en el mercado.Llegó la era de AGI (Inteligencia Artificial General), y toda la industria comenzó a toparse con modelos a gran escala.
Se entiende que Wang Xiaochuan, que en ese momento estaba iniciando un negocio discreto, ya había establecido una empresa para fabricar hardware inteligente. Destinado a ayudar a cientos de millones de personas con trastornos del sueño, crea una almohada inteligente para tratar los ronquidos. Cuando surgió el auge de los modelos a gran escala en marzo, Wang Xiaochuan pasó dos semanas tomando la decisión de abandonar este proyecto empresarial y diseñar modelos a gran escala.
Wang Xiaochuan reclutó al ex CTO de Sogou, Yang Hongtao, para ayudar a hacerse cargo del proyecto médico. Las acciones del ex COO de Sogou, Ru Liyun, también se intercambiaron a Yang Hongtao, siguiendo el modelo comercial a gran escala de Wang Xiaochuan. Wang Xiaochuan gastó un total de 50 millones de dólares estadounidenses para establecer "Baichuan Smart" e invitó a los talentos técnicos de Soul a ser la persona a cargo del algoritmo para acelerar la producción de modelos grandes. Y la historia de Wang Huiwen, todos están muy familiarizados con ella. Se publicaron puestos de reclutamiento de héroes en la mesa de vino, y se estableció una compañía a años luz de distancia para hacer un modelo grande.
En las grandes empresas de Internet, el gran modelo también ha traído una influencia trascendental. El responsable del proyecto con una gran maqueta se propuso dimitir hace unos años por el problema de no conseguir el ascenso. Tres meses más tarde, el director general del grupo se convirtió en director general del modelo grande, aprovechando la fuerza de la empresa para Todo en el modelo grande.
Nadie quiere perderse esta ola de la era AGI, todos creen que después de tres altibajos en el desarrollo de la IA, la singularidad de la inteligencia artificial general está llegando. Después de todo, bajo el auge de la IA, docenas de empresas como ChatGPT y Midjourney han creado una valoración de alrededor de 4 000 millones de USD. El valor de mercado total de las "Siete Grandes" en el mercado de valores de EE. , un aumento del 60%. Estas emocionantes historias de crecimiento explosivo han agitado una vez más el mercado empresarial tecnológico nacional.
** Entre las principales empresas de Internet en China, Li Yanhong, Zhang Yong, Zhang Yiming, Wang Xing y otros grandes nombres ya han tomado personalmente el mando. Se puede decir que, excepto Pinduoduo, todos ellos han entrado en el gran modelo. ** El 19 de julio, el valor de mercado de Microsoft y Nvidia aumentó en $ 175 mil millones, se maravilló Musk al evaluar los tweets relacionados: "Tiempos locos".
1. Un Nuevo Amanecer en el Valle Bajo
Li Ming es el director ejecutivo de una empresa nueva con un equipo de más de 100 personas. 2023 es el año en el que más le preocupa la financiación.
El proceso de iniciar un negocio fue muy sencillo al principio, y en la etapa inicial obtuvo financiamiento ángel y de ronda A de instituciones de inversión ángel conocidas. "En ese momento, Internet industrial todavía era una pista popular y no era tan exagerada como muchos proyectos de IA", dijo Li Ming a AI Jingxuan, pero a mediados de 2023, en la nueva ronda de financiación que lanzó, lentamente descubrió que el mercado no estaba bien. .
Las instituciones de inversión no solo analizan los datos y las historias, sino también los ingresos. Li Ming, que antes estaba obsesionado con la producción, no se ha dado cuenta del cambio de dirección del viento de inversión en absoluto. Según el discurso de Wu Shichun, socio fundador de Meihua Venture Capital, los proyectos de inversión actuales "no solo necesitan (tecnología), sino también (datos) e (ingresos)". De ninguna manera, comenzó a buscar instituciones de FA para ayudarlo con el financiamiento, y las rondas de financiamiento también retrocedieron, solicitando una A ++.
“FA ayudó a encontrar más de 30 instituciones de inversión, pero no pasó nada.” El fracaso de la financiación hizo que Li Ming se desanimara un poco. Pero en junio, sintió el poder del gran modelo, por lo que lanzó un negocio industrializado basado en ChatGPT internamente. "Aún no hemos recaudado fondos, pero los inversores tomarán la iniciativa de comunicarse con ellos y la otra parte obviamente está interesada".
Para la tecnología de primera clase de Yuan Jinhui, el modelo grande también es una pajita que salva vidas. En 2022, esta empresa, que crea un marco de aprendizaje profundo de IA, ha llegado al punto en que la financiación no es fluida y tiene que despedir empleados para sobrevivir. La compañía estuvo a punto de romper su cadena de capital tres veces antes, y todos pidieron dinero prestado a Su Hua, un inversionista ángel que también era el director ejecutivo de Kuaishou en ese momento.
"Lo que hacemos es similar a Flying Paddle de Baidu y Shengsi de Huawei. Lo más importante es que el negocio del entrenamiento de modelos a gran escala en el mercado aún no ha comenzado". la empresa pertenece al momento en que es rico (2021)) no tiene negocios, y cuando hay negocios (2023), no habrá dinero.
Justo cuando Yuan Jinhui sintió que el futuro no tenía esperanza, la compañía también presentó una oportunidad de adquisición en 2023. En abril de 2023, en la empresa de tecnología de primera clase en el Parque Científico y Tecnológico de Tsinghua, se recibió a un invitado distinguido: Wang Huiwen, cofundador de Meituan, quien acababa de anunciar su entrada en el modelo a gran escala.
El precio de compra final no fue malo. Un empleado de tecnología de primera clase que fue despedido le dijo a AI Whale Selection Agency: "Es comparable a la valoración de la última ronda de inversión de Hillhouse Capital, y también se han encontrado mis propias opciones".
Y Yuan Jinhui, quien se convirtió en cofundador de Light Years Away, finalmente ya no tiene que preocuparse por la financiación. La capacidad financiera de Wang Huiwen es insuperable en el círculo de capital de riesgo actual. Según el acuerdo de adquisición posterior de Meituan, Light Years Away recaudó 2 mil millones de yuanes sin productos modelo a gran escala.
Por supuesto, los inversores que se desplegaron antes en esta ola de acciones han cazado unicornios con éxito.
Minimax se estableció en noviembre de 2021, recibió una inversión de ronda ángel en enero de 2022 y la valoración de la empresa alcanzó el nivel de unicornio a principios de 2023. Entre las primeras cuatro instituciones de inversión, también se encuentra la compañía de juegos de Shanghai Mihayou.Se informa que los dos ejecutivos fundadores tienen lazos familiares. Según Jingxuan News, Zhipu también ha recaudado fondos recientemente con una valoración de 10.000 millones de yuanes.
**Estas dos empresas se establecieron hace menos de 2 años, pero ambas se han convertido en unicornios y la velocidad de desarrollo de la pista de modelos a gran escala es asombrosa. **
Y el auge de AGI también es una salvación para esas viejas empresas de IA. Anteriormente, la historia de salir a preguntar por el listado de IoT ha pasado varias veces sin éxito. Con el lanzamiento de la historia del modelo a gran escala "Serial Monkey" y cuatro productos AIGC, aunque el modelo a gran escala todavía tiene cuidado de no ser evaluado públicamente, también permite que Momenwen finalmente tenga una nueva historia que contar, y se ha presentado la solicitud de cotización en el mercado de valores de Hong Kong.
Más modelos a gran escala y emprendedores AIGC están en camino. Incluso en un campamento de inicio, el 60% de los proyectos están relacionados con la IA. Con las ventajas de activos ligeros, barreras altas y techos altos, AGI se ha convertido completamente en la competencia más candente. en este momento carretera.
**2.Lleva el sueño de AGI a su punto máximo
Si 2023 es el "primer año" del emprendimiento modelo a gran escala. Luego, el "año de origen" cuando los gigantes de Internet ingresaron por primera vez al gran modelo se remonta a 2019.
Ali comenzó a diseñar el modelo grande en septiembre de 2019 y lanzó el modelo grande PLUG en abril de 2021. Antes del lanzamiento de ChaTGPT 3.0, ya había muchos modelos grandes con billones de parámetros en China, como el M6 de Bodhidharma Academy, el modelo Pangu de Huawei Cloud y el Enlightenment 2.0 de Zhiyuan. En comparación con ChaTGPT, aunque se superan los parámetros del modelo, la abundancia de datos no es la misma y el efecto no se puede comparar. Según Zhang Cong de Dharma Academy, lo más importante es que los grandes modelos domésticos no se hacen dos cosas.
Lo primero es que no se hace ninguna alineación. En ese momento, Ali tenía muchos modelos grandes y pequeños, y principalmente no alineaba los resultados del entrenamiento. "Puedes ver que ChatGPT puede componer poemas y chatear, lo cual es muy similar a la inteligencia humana. De hecho, está alineado con los valores humanos", dijo Zhang Cong, todo esto requiere ajustes artificiales a los resultados del razonamiento, en lugar de la lógica de la máquina. . .
En segundo lugar, no hay un conjunto de datos de alta calidad. ChatGPT usó profesores universitarios en Filipinas para el etiquetado de datos en los primeros días, mientras que estudiantes de escuelas secundarias técnicas nacionales se usaron para el etiquetado. El problema del corpus también afectó en gran medida los resultados. En opinión de Zhang Cong, el modelo de Chat perfeccionado de Llama 2 lanzado el 19 de julio se entrenó con 1 millón de datos etiquetados por humanos, y la cantidad total de tokens de entrenamiento aumentó en un 40 %. En comparación con Llama, la mejora es integral. . "** Entonces, el modelo grande no es una invención de milagros, sino una creación de ingeniería bien diseñada". **
Y mirando hacia atrás en la industria nacional de IA, también enfrentará la interferencia de muchos otros factores. En ese momento, la Academia Bodhidharma tenía dos equipos principales trabajando en modelos a gran escala, uno era el equipo de inteligencia artificial dirigido por Jin Rong, y Si Luo estaba a cargo de AliciMind; el otro era el laboratorio de lenguaje natural dirigido por Zhou Jingren, de que Yang Hongxia estuvo a cargo del modelo a gran escala M6.
En la evaluación a fines de 2022, los resultados del modelo grande M6 tienen una ligera ventaja, y los dos finalmente se integran en el modelo grande Tongyi actual. "En realidad, solo hay 20 o 30 personas en el gran equipo modelo del Instituto Dharma, y su entrenamiento previo se realiza principalmente en Alibaba Cloud", dijo Zhang Cong a la Agencia de Selección de Ballenas AI, pero ahora Tongyi es un proyecto importante del grupo. Son más de 600 personas, y ahora se dedican muchos recursos a modelos grandes.El CEO del grupo pregunta sobre el progreso técnico cada 2 semanas.
Para Baidu, esta ola de auge de AGI, pero la era de la IA que ha predicho desde 2016, naturalmente no se la perderá.
Fue aprobado oficialmente internamente el 7 de febrero de este año y lanzado oficialmente el 16 de marzo. Durante este período, fue ascendido directamente al proyecto de mayor prioridad del Grupo Baidu. Li Yanhong supervisó personalmente la batalla, y el CTO Dr. Wang Haifeng se hizo cargo directamente. En ese momento, el Centro de Supercomputación Baidu Yangquan se dedicó al entrenamiento de modelos a gran escala. .
El ingeniero de algoritmos de Baidu, Zhao Hui, le dijo a AI Whale que el Departamento de Procesamiento del Lenguaje Natural de Baidu ha estado investigando la PNL y otras tecnologías, y que el científico jefe Wu Hua también ha sido el líder. Hay cientos de personas en este departamento. ERNIE2.0 de Baidu se ha transformado en un modelo grande de Wenxin, "Solía hacer cerebros de Baidu, pero ahora se dice que es un modelo grande de Wenxin".
Hay similitudes en lo que hacen, pero por supuesto que hay diferencias. Zhao Hui mencionó que en el pasado, Baidu hacía mucho ranking de búsqueda vertical, solo para reordenar los resultados de búsqueda en función de los clics humanos. Después de la aparición del modelo grande, estas capacidades se depositarán en el algoritmo del modelo grande, lo que también ayudará a dar respuestas más precisas.
Para Baidu, el modelo grande promueve cambios cualitativos en la próxima generación de búsqueda, que se ha escrito en el OKR de Robin Li. Sin embargo, en términos de ecología, el modelo Wenxin de Baidu se basa en el modelo Bert. "GLM, incluido el de Zhiyuan, es una ruta técnica independiente, que es diferente del GPT internacional". no hay necesidad de preocuparse por esto Wenxin Qianfan tiene todo tipo de modelos, y GPT2, 3 y 4 también son muy diferentes.
En cuanto a Yang Hongxia, quien renunció a Ali, también fue contratada por ByteDance para ser la jefa de investigación y desarrollo de modelos grandes de América del Norte después de que se fue al extranjero. Zhang Yiming ha estado investigando si el modelo grande será de código abierto o cerrado, por lo que no pidió concentrarse en el trabajo. "Habrá un gran avance antes de fin de año", dijo Yang Hongxia a la Agencia de Selección de Ballenas AI.
En general, ByteDance debería ser una empresa que se adapte mejor al gran modelo en los negocios después de Baidu. Un cazatalentos le dijo a la Agencia de Selección de Ballenas AI que, aunque el gran modelo no tiene prisa, sigue siendo bastante radical en el campo de AIGC. Por ejemplo, Tiktok está haciendo negocios publicitarios creativos AIGC, el puesto de director otorga un presupuesto de 100-150 W y el requisito es liderar el equipo después de 1988.
Hasta ahora, excepto Pinduoduo, todas las principales empresas de Internet han entrado en el gran modelo. El entusiasmo de los grandes fabricantes por entrar en el juego es incluso mayor que el de O2O y la transmisión en vivo en ese entonces.
**3.La noche en que apareció de repente la cuenca
En junio, en el Edificio Sohu en Beijing, esta empresa modelo a gran escala con la mayor cantidad de financiamiento está en pleno apogeo.
El marco de aprendizaje profundo Oneflow de la tecnología original de primera clase todavía está pensando en continuar haciéndolo, pero el gran modelo de negocio ha transferido a muchas personas. Pero el 23 de junio, alguien reveló repentinamente en las redes sociales que Wang Huiwen estaba enfermo. En ese momento, alguien de la compañía fue a verificarlo, pero no recibieron tal noticia. Sin embargo, en la noche del 25, Meituan anunció repentinamente que el cofundador Wang Huiwen fue hospitalizado debido a una depresión y renunció al cargo de director de la empresa.
Por un tiempo, la noticia de que Wang Huiwen se escapó temprano se convirtió en una conjetura de algunas personas. La noticia que Jingxuan recibió del círculo de inversionistas es que la condición de Wang Huiwen es realmente muy grave. Al final, el hermano de Wang Huiwen que dormía en la litera superior, Wang Xing, el fundador de Meituan, ayudó a hacerse cargo del negocio a años luz de distancia.
¿Está realmente muerta la gran modelo?Todo el mundo tiene esta pregunta. Durante ese período, Zhu Xiaohu, un conocido inversor, y Fu Sheng, el fundador de Cheetah, también discutían en el círculo de amigos si había una burbuja en la industria de modelos a gran escala. Zhu Xiaohu es extremadamente pesimista sobre la situación actual del mercado que acude en masa para fabricar modelos a gran escala de uso general, y cree que la mayoría de ellos morirán a finales de año.
¿El cambio activo que está a años luz de distancia también confirma los comentarios de Zhu Xiaohu?
Según la información obtenida de la AI Whale Selection Agency, la adquisición de Meituan, que está a años luz, no ha detenido el ritmo de los grandes modelos. No solo ha invertido exclusivamente varios cientos de millones de yuanes en Zhipu AI, sino que actualmente también está reclutando directores de proyectos para modelos a gran escala, con un salario anual de hasta 3 millones de yuanes, e incluso estableció un instituto de investigación tecnológica en los Estados Unidos. . Meituan, que gana dinero ganado con tanto esfuerzo, no quiere quedarse atrás en esta ola de tecnología, especialmente después de que Ele.me claramente quiere conectarse al modelo grande de Tongyi, y Ctrip, que tiene competencia comercial, también ha lanzado un modelo grande. .
Pero para el mercado interno, de hecho, hay demasiados modelos grandes de propósito general. Según estadísticas incompletas, en menos de 8 meses se han lanzado al mercado más de 85 modelos grandes, muchos de los cuales se han convertido en conceptos de cash-out de empresas cotizadas.
Los datos de Wind muestran que en 2023, 24 "acciones conceptuales de AIGC" han sufrido un total de 67 reducciones de acciones, y la ola de divorcios de los principales accionistas también es sorprendente. Desde principios de 2023, las familias de los principales accionistas de casi diez empresas del sector de la IA han estado expuestas al divorcio. Lo que ha llamado mucho la atención es que Kunlun Wanwei, una empresa de inteligencia artificial con acciones A, informó recientemente que la Sra. Li Qiong (la ex esposa del fundador Zhou Yahui), que representa el 11 % de las acciones, planea reducir sus participaciones. por el 3% de las acciones (alrededor de 1,3 mil millones de yuanes), y luego pagar intereses prestados a la empresa. Según la introducción del informante a Jingxuan, Kunlun Wanwei, que sintió los beneficios de AGI, no solo fabricó modelos a gran escala, sino que también formó un equipo de manera intensiva recientemente y se esforzó al máximo para crear Copilot, que es un punto de referencia frente a Microsoft.
Las empresas que cotizan en bolsa utilizan AGI para aprovechar el concepto de especulación y retiro de efectivo. Startups de grandes modelos introvertidas hasta la muerte.
Zhang Yang, un inversionista que recientemente estableció AIGC Fund, le dijo a AI Whale que con el lanzamiento de Llama 2, de código abierto, gratuito y poderoso, muchas empresas a gran escala inevitablemente enfrentarán dificultades financieras en la segunda mitad del año.
Ahora todo ya está en el horizonte. El 11 de julio, Baichuan Intelligent lanzó el Baichuan-13B, un modelo grande con decenas de miles de millones de parámetros. No solo anunció que era de código abierto, sino también gratuito para uso comercial. Aunque la escala de parámetros de Baichuan-13B no es grande, según el entrenamiento preciso del corpus chino, Baichuan a menudo ocupa el primer lugar entre los modelos grandes con decenas de miles de millones de parámetros.
La estrategia gratuita de Baichuan-13B ha tenido un gran impacto en el mercado pago de modelos a gran escala en China. En la actualidad, Zhiyuan AI anunció el día 14 que el registro empresarial ha sido autorizado para permitir el uso comercial gratuito de ChatGLM-6B y ChatGLM2-6B.
Después de que más y más modelos grandes sean de código abierto y gratuitos, comienza oficialmente la competencia de eliminación directa para modelos grandes. Un CTO de una empresa nueva basada en modelos a gran escala le dijo a AI Whale Selection Agency que los modelos a gran escala de Zhiyuan costaron 20 millones de yuanes desde el despliegue inicial del dominio privado, y el precio de las llamadas a principios de año fue de 1,8 millones a 300.000 paquetes La industria está cambiando muy rápido. **Fu Sheng cree que esta es la transición del mercado de una competencia de parámetros de modelos grandes a una competencia de escala ecológica. **
Las grandes empresas de Internet no se preocupan por la construcción ecológica. Como hay muchos modelos internos, también hay modelos gratuitos y de pago. Los modelos grandes más importantes siguen siendo de código cerrado y de pago. Es más difícil para las empresas de nueva creación establecer una ecología. Muchas empresas de nueva creación han agotado sus esfuerzos para construir un modelo a gran escala, y es inevitable que no puedan hacer la ecología. Se entiende que MiniMax es actualmente una de las pocas empresas emergentes que se adhiere a la nube pública y es una empresa a gran escala en el modelo MaaS.
Fan Kai, CTO de Clove Garden, describió esta ola de código abierto y gratuito, como llevar plantas de agua (modelos grandes) a los hogares de los usuarios de forma gratuita, para que todos tengan un grifo. Para esas plantas de agua de código cerrado, es mejor que su el agua es invencible y deliciosa, todos están dispuestos a pagar para ir a ti.
**4.El desarrollo de AGI entra en una bifurcación en el camino
Después del surgimiento de la línea divisoria de aguas, el ex presidente del comité técnico del Grupo Jingdong y fundador de Lianyuan Technology le dijo a AI Whale que la competencia empresarial actual ya ha desarrollado tres facciones.
Un grupo insiste en modelos grandes completamente desarrollados por ellos mismos, y este grupo está formado por jugadores poderosos. Esta facción está compuesta principalmente por las principales empresas de Internet como Baidu, Ali y Byte, así como por empresas emergentes como Zhipu, MiniMAX y Lianyuan. Pero estos poderosos jugadores también se dividen en dos tipos de empresas.
La primera categoría es insistir en hacer modelos grandes de uso general de desarrollo propio, compararlos con ChatGPT y ponerse constantemente al día con la velocidad de iteración de ChatGPT.
En opinión de Chen Yu, socio gerente de Yunqi Capital, los modelos a gran escala de propósito general son el único camino a seguir, y el desarrollo de modelos verticales a gran escala es limitado. "Porque para el modelo grande general, no es necesario volver a entrenar el campo vertical. El modelo grande general se puede profundizar a través de la base de datos vectorial, pero el modelo grande vertical es difícil de emerger de manera inteligente".
A juzgar por la situación actual, aquellos que tienen un sueño deben hacer un modelo a gran escala de propósito general, después de todo, puede convertirse en la próxima gran empresa de Internet. ChatGPT ha demostrado este potencial disruptivo en los campos de la oficina colaborativa, el comercio electrónico, la generación de código y el diseño auxiliar.
La segunda categoría es reconocer la realidad, enfocarse en aterrizar e insistir en hacer modelos verticales a gran escala. Este grupo incluye a Zhu Xiaohu y Fu Sheng, quienes finalmente llegaron a un consenso. Ambos creen que los modelos verticales a gran escala tendrán más aplicabilidad industrial.
Los modelos grandes de propósito general generalmente tienen más de 100 mil millones de parámetros, mientras que los modelos grandes verticales tienen una escala de alrededor de 10 mil millones o 7 mil millones. Al igual que el producto modelo a gran escala ProductGPT de Lianyuan Technology y el producto modelo a gran escala Cao Zhi de Daguan Data, los parámetros están en las decenas de miles de millones.
Lianyuan Technology no es una escuela paramétrica de modelos grandes. "Tenemos las capacidades básicas de los modelos grandes generales, pero creemos que los algoritmos técnicos, las iteraciones de modelos y los bucles cerrados de escena son todos más críticos".
En comparación con Lianyuan, que presta más atención a la escena, Daguan presta más atención a los datos.
Según Chen Yunwen, CEO de Daguan Data, le dijo a AI Jingxuan que el modelo grande "Cao Zhi" adopta un esquema de datos de entrenamiento mixto, que es 50 % de corpus mixto general + 50 % de corpus profesional vertical. "Hemos estado haciendo inteligencia de texto en los campos de finanzas y asuntos gubernamentales durante muchos años. Muchos datos son únicos y los clientes también nos piden que hagamos capacitación en privatización". Chen Yunwen le dijo a AI Whale Selection Agency: "En el pasado, cuatro o cinco personas solían hacer un trabajo a la semana. Informe, ahora la IA se hace en medio día".
Solo renunciando al sueño de convertirse en el próximo ChatGPT puede aterrizar lo antes posible en la escena comercial, que es la cognición sobria de muchos modelos verticales.
** Desde la perspectiva de la industria, la segunda ruta al templo AGI se basa en los modelos de otras personas (como GPT) y luego se combina con su propia industria Know-how para la capacitación. ** "Creo que tomará tiempo verificar si la segunda categoría puede tener éxito. Todavía no está claro. La razón es que todavía no todos saben cómo integrar el Know-how de la industria con el modelo grande. Al mismo tiempo tiempo, hay un modelo de negocio sostenible, que aún se desconoce”.
"En particular, se sospecha que muchos modelos grandes han sido bombardeados", dijo Zhang Yang, un inversionista, a la Agencia de Selección de Ballenas AI. Al combinar industrias para la comercialización, se enfrentarán a muchos problemas. Se informa que los modelos grandes de dos empresarios conocidos con el mismo apellido se basan en Llama de código abierto de Facebook; una empresa de juegos y protección utiliza el marco básico del modelo grande de Zhiyuan.
Se acerca un modelo de código abierto más fuerte. Meta lanzó recientemente la versión comercial gratuita Llama 2. Fu Sheng dijo en el círculo de amigos: "No sé cuántas empresas se despiertan riendo en medio de la noche, cuántas empresas lloran". en el baño ... "Zhu Xiaohu también comentó sobre esto: muchas personas están a punto de despertarse, todos pueden tomar un viaje gratis".
El "despertar con una sonrisa" de Fu Sheng es ligeramente diferente al de Zhu Xiaohu. Fu Shengxiaoxing se refiere a las empresas que utilizan modelos grandes de código abierto para desarrollar aplicaciones AIGC y también pueden producir mejores productos. Zhu Xiaohu Xiaoxing se refiere a esas empresas modelo a gran escala que afirman ser de desarrollo propio pero en realidad cubren el caparazón. Recientemente, ellos anunciará una actualización. . A lo que todos se refieren es a lo mismo, son todas empresas de modelos a gran escala que dicen ser de desarrollo propio, Llama 2, uno de los modelos a gran escala extranjeros más potentes, anunció que es de código abierto y gratuito. en el mismo modelo grande de código abierto.¿Cómo hacer capacidades únicas en la industria?
**La tercera ruta de AGI es la aplicación pura, que consiste en usar el modelo directamente, que tendrá barreras más bajas. **Zhu Xiaohu tampoco es optimista sobre este tipo de modelo, pensando que si ChatGPT proporciona el 90% de las capacidades, entonces las aplicaciones AIGC no tienen valor de inversión.
En el ecosistema OpenAI, Sam Altman prometió evitar hacer la capa de aplicación tanto como fuera posible y competir con los desarrolladores del ecosistema, por lo que imitó a Google e hizo el complemento ChatGPT.Desde el punto de vista actual, nadie en China ha hecho tal compromiso. .
Ha habido cientos de actualizaciones de funciones para Wenxinyiyan y Tongyiqianwen, y estas funciones también han cubierto el trabajo de algunos desarrolladores. Aunque Wenxin Yiyan también tiene complementos, actualmente solo hay dos, uno es Baidu Search y el otro es ChatFile (capacidades de análisis y procesamiento para documentos largos). Cómo coordinar el desarrollo ecológico de Baidu Qianfan y Alimodao sigue siendo una propuesta desafiante.
Zhu Xiaohu, quien es firmemente optimista sobre AGI, cree que la ventana de inversión y emprendimiento para modelos a gran escala de uso general ha pasado, y AIGC, que no depende absolutamente de las capacidades de un cierto modelo a gran escala, es el bajo -Fruto colgante de la era AGI. Por ejemplo, la "Cámara Miaoya", que de repente se ha vuelto popular en el círculo de amigos recientemente, es el primer producto AIGC que se vuelve popular en China, y un producto similar "lensa" también se ha hecho popular en el extranjero, con un ingreso mensual de 8 millones de dólares.
Cuando llegó la ola de los tiempos, el inversionista Wu Shichun una vez le preguntó en broma a Zhu Xiaohu: "¿El dinero ganado al invertir en IA compensó el dinero perdido al invertir en SaaS?" Zhu Xiaohu respondió, todavía no, pero la IA tiene perspectivas ilimitadas. .
En la actualidad, el círculo de capital de riesgo también reconoce la verdad expresada por Zhu Xiaohu, pero muchas personas no esperan que Zhu Xiaohu diga la verdad, como "ChatGPT es muy hostil para las empresas nuevas, abandone las ilusiones financieras en el próximo dos o tres años" Estas escalofriantes palabras.
"El gran modelo es la propiedad inmobiliaria de Internet, incluso si hay una burbuja, es una burbuja hermosa", dijo un empresario que acababa de terminar la educación y capacitación vocacional de IA. Lei Jun gritó una vez cuando el dividendo de Internet desaparecido en 2013, hay que creer en El poder de Internet, hoy también hay que creer en AGI, tenga burbuja o no.
Nota: Li Ming, Zhang Cong, Zhao Hui, etc. son seudónimos en este artículo.