Después de medio año de soplar el viento del modelo grande, finalmente tiene una nueva dirección.
El 7 de julio, en la Conferencia Mundial de Inteligencia Artificial de 2023 (WAIC 2023), el **Grupo General de Estandarización de Inteligencia Artificial bajo la dirección del Comité Nacional de Estándares anunció que el líder del primer grupo de trabajo de estandarización de modelos a gran escala de mi país será liderado por el Laboratorio de Inteligencia Artificial de Shanghái y Baidu., Huawei, Ali y otras empresas son responsables conjuntamente. **
El mundo exterior no está sorprendido por el primer lote de alineaciones seleccionadas de "selección nacional". Después de todo, el desarrollo de modelos grandes debe ser liderado por jugadores con una fuerza técnica excepcionalmente fuerte. Después de que el estado aclaró su estado y tareas, la dirección del viento del mercado nacional de modelos a gran escala comenzó a sufrir nuevos cambios.
01 Huracán durante medio año, la industria marcó el comienzo de la "selección nacional"
Desde principios de este año, el modelo grande se ha disparado hasta el final y la velocidad ha superado el proceso de desarrollo de cualquier tecnología anterior. Si en el primer trimestre de este año, varios jugadores acudieron a la entrada del modelo grande, todavía discutiendo el tema de "si hacerlo o no", para el segundo trimestre, cada jugador ha evolucionado al tema de "cómo hazlo".
Y una escena tan animada marcó el comienzo de un clímax en WAIC 2023. **Más de 400 empresas participaron en esta conferencia, y más de 30 modelos a gran escala se centraron en los aspectos más destacados.El área de exposición alcanzó los 50.000 metros cuadrados, estableciendo un nuevo récord. **
En esta animada conferencia, muchas personas no pudieron ingresar al lugar de la conferencia porque no concertaron una cita con anticipación. En la conferencia, que los expertos de la industria llaman "alto estándar", la celebridad de Internet Musk, Yang Likun, uno de los gigantes del Premio Turing, Hu Houkun, presidente rotativo de Huawei, Tang Xiaoge, profesor de la Universidad China de Hong Kong, y círculos académicos y empresariales Los peces gordos aparecieron uno tras otro.
En la sala de exposiciones, la era de los modelos a gran escala, la IA generativa y la inteligencia artificial general, estas palabras que no eran familiares hace medio año, ahora se han convertido en símbolos que se pueden ver en todas partes de la sala de exposiciones.
Por supuesto, los jugadores de más de 30 modelos a gran escala en la conferencia no decepcionaron al mundo exterior y dieron sus propias respuestas a los modelos a gran escala. Especialmente las acciones de los miembros de la "selección nacional" han llamado la atención del mundo exterior.
Por ejemplo, Baidu, como el primer fabricante en China en anunciar Todo en inteligencia artificial, su sala de exposiciones en el sitio de la conferencia es particularmente atractiva. Por supuesto, en esta importante ocasión, Baidu exhibirá naturalmente el "tesoro del ayuntamiento” que más personas pueden experimentar. Este producto, llamado Wenxinyige, permite que la audiencia que ingresa a la sala de exhibición se dé cuenta de la libertad de las imágenes P.
Huawei trasladó su "clúster de entrenamiento de IA más rápido del mundo" Atlas 900 PoD A2 al sitio. Hu Houkun, vicepresidente de Huawei, dijo que con Atlas 900, las personas pueden completar el entrenamiento de la red neuronal típica ResNet-50 en el conjunto de datos de ImageNet en solo 59,8 segundos, que es un 15 % más rápido que el segundo lugar con la misma precisión. . "Esto es equivalente a llegar a la meta en la parte superior del campo de velocidad y luego beber una botella de agua para ver al segundo corredor llegar a la línea de meta". audiencias asombradas La atención pasó de la complejidad del modelo grande a la competencia en el lado del hardware.
En el foro de Alibaba Cloud, la "Familia Tongyi" de Alibaba Cloud agregó un modelo de pintura de IA "Tongyi Wanxiang". Se dice que este modelo puede ayudar a los humanos en la creación gráfica y se puede aplicar al diseño de arte, comercio electrónico, juegos y la creación cultural en el futuro y otros escenarios de aplicación. Zhou Jingren, CTO de Alibaba Cloud Intelligence Group, dijo en la escena que este es un paso clave para que el gran modelo de Alibaba Cloud aproveche completamente la capacidad multimodal, y esta capacidad se abrirá gradualmente a los clientes de la industria en el futuro.
"Dinero, personas, tecnología y escenas" son las ventajas innatas de los grandes fabricantes en la fabricación de modelos a gran escala. Al mismo tiempo, también es un vacío que muchas empresas emergentes son difíciles de llenar. Algunas personas incluso señalaron directamente en el lugar donde aterrizaron los modelos a gran escala de China, solo estará entre los cinco principales fabricantes, a saber, BAT+Huawei+Tencent.
Pero, ¿qué van a hacer los gigantes? Adónde va después es una gran pregunta.
02 Abandonando conceptos y sentimientos, los gigantes se han centrado en aterrizar en la escena
Conferencia de inteligencia artificial de este año, el modelo grande se ha convertido en una clase superior bien merecida.
Ali Tongyi, Baidu Wenxin, Huawei Pangu y otros equipos nacionales han demostrado su poder duro. Al mismo tiempo, más de 30 modelos verticales a gran escala como Xunfei Xinghuo, Shangtang Rixin y Netease Fuxi no han perdido su impulso. Trabaja duro. en sus respectivos campos.
Pero a juzgar por la situación en el lugar, parecen haber abandonado las prácticas grandes y vacías, la narración de historias y el habla emocional, y en su lugar comenzaron a centrarse en hablar sobre escenarios y casos de aterrizaje. Esta es la única forma de que los modelos grandes avancen, y también es muy probable que se convierta en el punto culminante de la próxima etapa.
En la conferencia, se lanzó oficialmente Huawei Cloud Pangu Large Model 3.0, lo que atrajo a muchas personas de la industria para mirar. Lo que impresionó aún más a la industria es lo que dijo Zhang Ping'an, director ejecutivo de Huawei y CEO de Huawei Cloud: el modelo Pangu está muy ocupado, ocupado haciendo cosas y no tiene tiempo para escribir poemas. Y escribir poemas es exactamente lo que más les gusta hacer a los jugadores que lanzaron el gran modelo en los seis meses anteriores.
En opinión de Zhang Ping'an, Huawei espera que el modelo Pangu pueda ayudar a varias industrias, como finanzas, asuntos gubernamentales, minería, meteorología, etc., en lugar de centrarse en el nivel del modelo lingüístico. Según su divulgación, a partir de ahora, el modelo grande de Pangu se ha implementado en los campos de la meteorología, la investigación y el desarrollo médicos y la energía eléctrica, y ha entregado múltiples modelos grandes con cientos de miles de millones de parámetros.
Baidu también puso la escena en práctica. Como uno de los primeros jugadores, Baidu lanzó el modelo grande de Wenxin hace cuatro años, pero la industria no prestó suficiente atención al modelo grande en ese momento, por lo que no despertó demasiada atención. Pero para Baidu, el modelo grande de Wenxin es un diseño avanzado que está un paso por delante de la industria. Hoy, este producto con visión de futuro también ha ganado mucho.
En el sitio de WAIC 2023, el director de tecnología de Baidu, Wang Haifeng, dijo que Baidu ahora se actualizó a la versión 3.5 del modelo grande de Wenxin. En comparación con la versión anterior, el efecto se mejoró en un 50 %, la velocidad de entrenamiento se duplicó y la velocidad de razonamiento se ha incrementado en 30 veces. En términos de costo, se ha reducido al 10% del pasado.
"Asumir la promoción de la prosperidad de la ecología modelo a gran escala de China como el objetivo principal y brindar servicios integrales a las empresas emergentes a gran escala". El CTO de Alibaba Cloud, Zhou Jingren, lo dijo. Obviamente, esto continúa con el concepto MaaS (Model as a Service) propuesto por Alibaba Cloud.
Tencent, que fue el último en ingresar al campo de los modelos grandes, ha estado haciendo movimientos constantes en los últimos 20 días. El 19 de junio, Tencent reveló públicamente su pensamiento sobre modelos grandes por primera vez; el 26 de junio, reveló por primera vez su red informática de alto rendimiento Xingmai de desarrollo propio; el 7 de julio en WAIC 2023, el vicepresidente de Tencent Cloud y la persona a cargo de Tencent Cloud Intelligence, Wu Yunsheng, revelaron los logros innovadores de Tencent en la aplicación de modelos grandes y dijeron que las capacidades de modelos grandes de la industria de Tencent Cloud se han aplicado a escenarios como el control de riesgos financieros, la traducción interactiva y el cliente digital inteligente. servicio, que ha mejorado la eficiencia de las aplicaciones inteligentes.
Por supuesto, los modelos grandes en campos subdivididos también muestran una fuerte vitalidad. Tang Wenbin, cofundador y CTO de Megvii Technology, dijo en una entrevista con los medios: "La implementación de aplicaciones es el único criterio para medir el valor de los modelos grandes. Megvii Technology pasará de modelos grandes visuales a modelos grandes multimodales generales. ."
** Concéntrese en la implementación de escenarios y brinde de manera efectiva a los usuarios empresariales soluciones que reduzcan los costos y mejoren la eficiencia, lo que se ha convertido en el enfoque de los jugadores actuales del modelo a gran escala. **En el futuro, los modelos a gran escala ya han pasado de "hacer o no hacer" a "cómo hacerlo". Y ese es el siguiente paso en la guerra de las megamodelos.
03 Participa en la batalla por el futuro, responde primero estas cuatro preguntas
Aunque los modelos grandes son muy populares, todavía queda un largo camino por recorrer desde el principio hasta el mercado. En el proceso, se han expuesto muchas dificultades.
Sin embargo, a juicio de 1DU Finance and Economics, la futura competencia por el modelo más grande probablemente se lanzará en cuatro latitudes. Es decir: tecnología, talento, capital y comercialización. **
**Primer vistazo al nivel técnico. ** No hay duda de que la inteligencia artificial es una de las tecnologías más avanzadas en la actualidad, a nivel técnico es imposible compensar la acumulación que necesita en un corto período de tiempo. La "gran" potencia informática, los "grandes" datos y los "grandes" modelos son las características básicas de los modelos grandes en la actualidad, y también son desafíos para la industrialización de los modelos grandes. En la actualidad, aunque la escala de los datos es grande, la la calidad de los datos es desigual. En segundo lugar, el tamaño del modelo es grande y la dificultad de entrenamiento es mayor. El tercero es que la escala de la potencia informática es grande y los requisitos para el rendimiento del hardware serán mayores.
Esto también significa que ** no tiene suficientes fondos para mantenerlo, por lo que es difícil formar un equipo tan súper fuerte. **Un fundador de marketing cloud mencionado en comunicación con 1DU Finance and Economics: "Desde la inversión en el modelo a gran escala de la industria en marzo, la inversión de capital general ha sido muy grande, incluso superando la suma del establecimiento de la empresa a la gran- modelo a escala". Sin embargo, también mencionó que si se hace, definitivamente será una garantía para el desarrollo de la compañía en los próximos diez años.
Antes de esto, muchas personas en la industria han propuesto que "los modelos grandes son un juego para que los grandes fabricantes quemen dinero". Esta afirmación no carece de razón.
Aunque los modelos grandes son muy populares, el capital no ha seguido el ritmo de la recuperación tecnológica a escala mundial. La financiación global de capital de riesgo se redujo casi a la mitad en los primeros seis meses de este año, cayendo un 48 % a 173 900 millones de dólares, mientras que la cantidad de acuerdos también cayó un 19 %, según la firma de investigación PitchBook.
En China, a finales de junio de este año, más de una docena de grandes empresas de nueva creación han obtenido financiación. Entre las empresas que han anunciado el monto de la financiación, MiniMax tiene la escala de financiación más grande. En junio de este año, recibió más de 250 millones de dólares estadounidenses en financiación Serie A de Tencent; años atrás, antes de ser adquirida por Meituan, también recibió una ronda de financiación ángel+ de 230 millones de dólares.
Veamos la inversión de los principales fabricantes. Anteriormente, las estadísticas de Titanium Media pueden explicar el problema. En 2022, la inversión de Huawei en gastos de I+D será de 161.500 millones de yuanes, convirtiéndose en la empresa con la mayor inversión en I+D de China; seguida de Tencent, aunque no es bajo Sin embargo, se mantuvo en el nivel de 61,4 mil millones de yuanes. Ali ocupó el tercer lugar, con gastos de I + D de 55,5 mil millones de yuanes. Según la información pública, Baidu, como uno de los primeros actores en inteligencia artificial, ha invertido más de 100 mil millones de yuanes en el campo de la IA en los últimos diez años. Tales estándares de inversión obviamente no son comparables a las empresas ordinarias.
Con tecnología y capital, las grandes fábricas son relativamente más atractivas para los talentos. A principios de este año, cada empresa inició una loca competencia de talentos. Baidu contrata ingenieros de algoritmos de modelos a gran escala de IA con un salario mensual de 25 000 a 40 000, y el más generoso Ali recluta ingenieros de algoritmos y de formación de modelos a gran escala con un salario mensual de 40 000 a 70 000.
Después de buscar la palabra clave "modelo grande" en una plataforma de reclutamiento, encontrará que algunas empresas están dispuestas a dar un salario mensual de 15-25K a los graduados de 2023. Al mismo tiempo, algunas empresas de vías verticales también participaron en esta ronda de competencia. Por ejemplo, una empresa comercial contrató a un gerente de producto de modelo médico a gran escala con un rango de salario de 25-50K, y una empresa de juegos contrató a un ingeniero de algoritmos para un modelo de lenguaje a gran escala, y también le dio un salario de hasta 50K. Incluso el salario anual de un gerente de producto de plataforma modelo grande contratado por China Telecom puede llegar a 840.000.
Los talentos, la tecnología y el capital, que suben con la marea, instan a los jugadores de los grandes modelos a aterrizar y comercializar lo antes posible, después de todo, de acuerdo con las leyes de los negocios, al final, estos insumos deben ser devueltos. para ser valioso.
Sin embargo, el costo de aterrizaje de los modelos grandes también es un obstáculo que los principales jugadores deben cruzar. Algunas personas en la industria estimaron una vez que el costo de entrenar un modelo grande es extremadamente alto, alcanzando los 2-120 millones de dólares estadounidenses. Esto también significa que la comercialización de modelos grandes de IA puede tener que volver a la contabilidad de costos.
Conclusión
Mirando el modelo grande desde el momento presente, la situación general es muy similar a Internet en 1998. Estaba en su infancia, con muchas burbujas y grandes oportunidades. En este caso, una buena empresa con fuerza real tendrá un mejor crecimiento y mayor valor en el futuro. **
Ver originales
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Termina la 'Selección Nacional', y el gran modelo 'rueda' a una nueva latitud
Fuente original: One DU Finance
Después de medio año de soplar el viento del modelo grande, finalmente tiene una nueva dirección.
El 7 de julio, en la Conferencia Mundial de Inteligencia Artificial de 2023 (WAIC 2023), el **Grupo General de Estandarización de Inteligencia Artificial bajo la dirección del Comité Nacional de Estándares anunció que el líder del primer grupo de trabajo de estandarización de modelos a gran escala de mi país será liderado por el Laboratorio de Inteligencia Artificial de Shanghái y Baidu., Huawei, Ali y otras empresas son responsables conjuntamente. **
El mundo exterior no está sorprendido por el primer lote de alineaciones seleccionadas de "selección nacional". Después de todo, el desarrollo de modelos grandes debe ser liderado por jugadores con una fuerza técnica excepcionalmente fuerte. Después de que el estado aclaró su estado y tareas, la dirección del viento del mercado nacional de modelos a gran escala comenzó a sufrir nuevos cambios.
01 Huracán durante medio año, la industria marcó el comienzo de la "selección nacional"
Desde principios de este año, el modelo grande se ha disparado hasta el final y la velocidad ha superado el proceso de desarrollo de cualquier tecnología anterior. Si en el primer trimestre de este año, varios jugadores acudieron a la entrada del modelo grande, todavía discutiendo el tema de "si hacerlo o no", para el segundo trimestre, cada jugador ha evolucionado al tema de "cómo hazlo".
Y una escena tan animada marcó el comienzo de un clímax en WAIC 2023. **Más de 400 empresas participaron en esta conferencia, y más de 30 modelos a gran escala se centraron en los aspectos más destacados.El área de exposición alcanzó los 50.000 metros cuadrados, estableciendo un nuevo récord. **
En esta animada conferencia, muchas personas no pudieron ingresar al lugar de la conferencia porque no concertaron una cita con anticipación. En la conferencia, que los expertos de la industria llaman "alto estándar", la celebridad de Internet Musk, Yang Likun, uno de los gigantes del Premio Turing, Hu Houkun, presidente rotativo de Huawei, Tang Xiaoge, profesor de la Universidad China de Hong Kong, y círculos académicos y empresariales Los peces gordos aparecieron uno tras otro.
En la sala de exposiciones, la era de los modelos a gran escala, la IA generativa y la inteligencia artificial general, estas palabras que no eran familiares hace medio año, ahora se han convertido en símbolos que se pueden ver en todas partes de la sala de exposiciones.
Por supuesto, los jugadores de más de 30 modelos a gran escala en la conferencia no decepcionaron al mundo exterior y dieron sus propias respuestas a los modelos a gran escala. Especialmente las acciones de los miembros de la "selección nacional" han llamado la atención del mundo exterior.
Por ejemplo, Baidu, como el primer fabricante en China en anunciar Todo en inteligencia artificial, su sala de exposiciones en el sitio de la conferencia es particularmente atractiva. Por supuesto, en esta importante ocasión, Baidu exhibirá naturalmente el "tesoro del ayuntamiento” que más personas pueden experimentar. Este producto, llamado Wenxinyige, permite que la audiencia que ingresa a la sala de exhibición se dé cuenta de la libertad de las imágenes P.
Huawei trasladó su "clúster de entrenamiento de IA más rápido del mundo" Atlas 900 PoD A2 al sitio. Hu Houkun, vicepresidente de Huawei, dijo que con Atlas 900, las personas pueden completar el entrenamiento de la red neuronal típica ResNet-50 en el conjunto de datos de ImageNet en solo 59,8 segundos, que es un 15 % más rápido que el segundo lugar con la misma precisión. . "Esto es equivalente a llegar a la meta en la parte superior del campo de velocidad y luego beber una botella de agua para ver al segundo corredor llegar a la línea de meta". audiencias asombradas La atención pasó de la complejidad del modelo grande a la competencia en el lado del hardware.
En el foro de Alibaba Cloud, la "Familia Tongyi" de Alibaba Cloud agregó un modelo de pintura de IA "Tongyi Wanxiang". Se dice que este modelo puede ayudar a los humanos en la creación gráfica y se puede aplicar al diseño de arte, comercio electrónico, juegos y la creación cultural en el futuro y otros escenarios de aplicación. Zhou Jingren, CTO de Alibaba Cloud Intelligence Group, dijo en la escena que este es un paso clave para que el gran modelo de Alibaba Cloud aproveche completamente la capacidad multimodal, y esta capacidad se abrirá gradualmente a los clientes de la industria en el futuro.
Pero, ¿qué van a hacer los gigantes? Adónde va después es una gran pregunta.
02 Abandonando conceptos y sentimientos, los gigantes se han centrado en aterrizar en la escena
Conferencia de inteligencia artificial de este año, el modelo grande se ha convertido en una clase superior bien merecida.
Ali Tongyi, Baidu Wenxin, Huawei Pangu y otros equipos nacionales han demostrado su poder duro. Al mismo tiempo, más de 30 modelos verticales a gran escala como Xunfei Xinghuo, Shangtang Rixin y Netease Fuxi no han perdido su impulso. Trabaja duro. en sus respectivos campos.
Pero a juzgar por la situación en el lugar, parecen haber abandonado las prácticas grandes y vacías, la narración de historias y el habla emocional, y en su lugar comenzaron a centrarse en hablar sobre escenarios y casos de aterrizaje. Esta es la única forma de que los modelos grandes avancen, y también es muy probable que se convierta en el punto culminante de la próxima etapa.
En la conferencia, se lanzó oficialmente Huawei Cloud Pangu Large Model 3.0, lo que atrajo a muchas personas de la industria para mirar. Lo que impresionó aún más a la industria es lo que dijo Zhang Ping'an, director ejecutivo de Huawei y CEO de Huawei Cloud: el modelo Pangu está muy ocupado, ocupado haciendo cosas y no tiene tiempo para escribir poemas. Y escribir poemas es exactamente lo que más les gusta hacer a los jugadores que lanzaron el gran modelo en los seis meses anteriores.
En opinión de Zhang Ping'an, Huawei espera que el modelo Pangu pueda ayudar a varias industrias, como finanzas, asuntos gubernamentales, minería, meteorología, etc., en lugar de centrarse en el nivel del modelo lingüístico. Según su divulgación, a partir de ahora, el modelo grande de Pangu se ha implementado en los campos de la meteorología, la investigación y el desarrollo médicos y la energía eléctrica, y ha entregado múltiples modelos grandes con cientos de miles de millones de parámetros.
Baidu también puso la escena en práctica. Como uno de los primeros jugadores, Baidu lanzó el modelo grande de Wenxin hace cuatro años, pero la industria no prestó suficiente atención al modelo grande en ese momento, por lo que no despertó demasiada atención. Pero para Baidu, el modelo grande de Wenxin es un diseño avanzado que está un paso por delante de la industria. Hoy, este producto con visión de futuro también ha ganado mucho.
"Asumir la promoción de la prosperidad de la ecología modelo a gran escala de China como el objetivo principal y brindar servicios integrales a las empresas emergentes a gran escala". El CTO de Alibaba Cloud, Zhou Jingren, lo dijo. Obviamente, esto continúa con el concepto MaaS (Model as a Service) propuesto por Alibaba Cloud.
Tencent, que fue el último en ingresar al campo de los modelos grandes, ha estado haciendo movimientos constantes en los últimos 20 días. El 19 de junio, Tencent reveló públicamente su pensamiento sobre modelos grandes por primera vez; el 26 de junio, reveló por primera vez su red informática de alto rendimiento Xingmai de desarrollo propio; el 7 de julio en WAIC 2023, el vicepresidente de Tencent Cloud y la persona a cargo de Tencent Cloud Intelligence, Wu Yunsheng, revelaron los logros innovadores de Tencent en la aplicación de modelos grandes y dijeron que las capacidades de modelos grandes de la industria de Tencent Cloud se han aplicado a escenarios como el control de riesgos financieros, la traducción interactiva y el cliente digital inteligente. servicio, que ha mejorado la eficiencia de las aplicaciones inteligentes.
Por supuesto, los modelos grandes en campos subdivididos también muestran una fuerte vitalidad. Tang Wenbin, cofundador y CTO de Megvii Technology, dijo en una entrevista con los medios: "La implementación de aplicaciones es el único criterio para medir el valor de los modelos grandes. Megvii Technology pasará de modelos grandes visuales a modelos grandes multimodales generales. ."
** Concéntrese en la implementación de escenarios y brinde de manera efectiva a los usuarios empresariales soluciones que reduzcan los costos y mejoren la eficiencia, lo que se ha convertido en el enfoque de los jugadores actuales del modelo a gran escala. **En el futuro, los modelos a gran escala ya han pasado de "hacer o no hacer" a "cómo hacerlo". Y ese es el siguiente paso en la guerra de las megamodelos.
03 Participa en la batalla por el futuro, responde primero estas cuatro preguntas
Aunque los modelos grandes son muy populares, todavía queda un largo camino por recorrer desde el principio hasta el mercado. En el proceso, se han expuesto muchas dificultades.
Sin embargo, a juicio de 1DU Finance and Economics, la futura competencia por el modelo más grande probablemente se lanzará en cuatro latitudes. Es decir: tecnología, talento, capital y comercialización. **
**Primer vistazo al nivel técnico. ** No hay duda de que la inteligencia artificial es una de las tecnologías más avanzadas en la actualidad, a nivel técnico es imposible compensar la acumulación que necesita en un corto período de tiempo. La "gran" potencia informática, los "grandes" datos y los "grandes" modelos son las características básicas de los modelos grandes en la actualidad, y también son desafíos para la industrialización de los modelos grandes. En la actualidad, aunque la escala de los datos es grande, la la calidad de los datos es desigual. En segundo lugar, el tamaño del modelo es grande y la dificultad de entrenamiento es mayor. El tercero es que la escala de la potencia informática es grande y los requisitos para el rendimiento del hardware serán mayores.
Esto también significa que ** no tiene suficientes fondos para mantenerlo, por lo que es difícil formar un equipo tan súper fuerte. **Un fundador de marketing cloud mencionado en comunicación con 1DU Finance and Economics: "Desde la inversión en el modelo a gran escala de la industria en marzo, la inversión de capital general ha sido muy grande, incluso superando la suma del establecimiento de la empresa a la gran- modelo a escala". Sin embargo, también mencionó que si se hace, definitivamente será una garantía para el desarrollo de la compañía en los próximos diez años.
Antes de esto, muchas personas en la industria han propuesto que "los modelos grandes son un juego para que los grandes fabricantes quemen dinero". Esta afirmación no carece de razón.
Aunque los modelos grandes son muy populares, el capital no ha seguido el ritmo de la recuperación tecnológica a escala mundial. La financiación global de capital de riesgo se redujo casi a la mitad en los primeros seis meses de este año, cayendo un 48 % a 173 900 millones de dólares, mientras que la cantidad de acuerdos también cayó un 19 %, según la firma de investigación PitchBook.
En China, a finales de junio de este año, más de una docena de grandes empresas de nueva creación han obtenido financiación. Entre las empresas que han anunciado el monto de la financiación, MiniMax tiene la escala de financiación más grande. En junio de este año, recibió más de 250 millones de dólares estadounidenses en financiación Serie A de Tencent; años atrás, antes de ser adquirida por Meituan, también recibió una ronda de financiación ángel+ de 230 millones de dólares.
Veamos la inversión de los principales fabricantes. Anteriormente, las estadísticas de Titanium Media pueden explicar el problema. En 2022, la inversión de Huawei en gastos de I+D será de 161.500 millones de yuanes, convirtiéndose en la empresa con la mayor inversión en I+D de China; seguida de Tencent, aunque no es bajo Sin embargo, se mantuvo en el nivel de 61,4 mil millones de yuanes. Ali ocupó el tercer lugar, con gastos de I + D de 55,5 mil millones de yuanes. Según la información pública, Baidu, como uno de los primeros actores en inteligencia artificial, ha invertido más de 100 mil millones de yuanes en el campo de la IA en los últimos diez años. Tales estándares de inversión obviamente no son comparables a las empresas ordinarias.
Después de buscar la palabra clave "modelo grande" en una plataforma de reclutamiento, encontrará que algunas empresas están dispuestas a dar un salario mensual de 15-25K a los graduados de 2023. Al mismo tiempo, algunas empresas de vías verticales también participaron en esta ronda de competencia. Por ejemplo, una empresa comercial contrató a un gerente de producto de modelo médico a gran escala con un rango de salario de 25-50K, y una empresa de juegos contrató a un ingeniero de algoritmos para un modelo de lenguaje a gran escala, y también le dio un salario de hasta 50K. Incluso el salario anual de un gerente de producto de plataforma modelo grande contratado por China Telecom puede llegar a 840.000.
Los talentos, la tecnología y el capital, que suben con la marea, instan a los jugadores de los grandes modelos a aterrizar y comercializar lo antes posible, después de todo, de acuerdo con las leyes de los negocios, al final, estos insumos deben ser devueltos. para ser valioso.
Sin embargo, el costo de aterrizaje de los modelos grandes también es un obstáculo que los principales jugadores deben cruzar. Algunas personas en la industria estimaron una vez que el costo de entrenar un modelo grande es extremadamente alto, alcanzando los 2-120 millones de dólares estadounidenses. Esto también significa que la comercialización de modelos grandes de IA puede tener que volver a la contabilidad de costos.
Conclusión
Mirando el modelo grande desde el momento presente, la situación general es muy similar a Internet en 1998. Estaba en su infancia, con muchas burbujas y grandes oportunidades. En este caso, una buena empresa con fuerza real tendrá un mejor crecimiento y mayor valor en el futuro. **