Después de más de 200 días de emprendimiento a gran escala, la mentalidad de los exploradores chinos ha cambiado de la emoción ideal a la realidad.
Antes de esto, además de la propia empresa, el espíritu empresarial del modelo de IA estaba dotado de más significados, como el sentimiento nacional y la tendencia de la época.Al enfrentarse al surgimiento del modelo de propósito general ChatGPT, los empresarios chinos rápidamente llegaron a un consenso sobre cómo construir una versión china de OpenAI y ChatGPT.
No hay duda de que ChatGPT es el mejor jugador del mundo este año. Por ello, el tráfico del sitio web de OpenAI superó los 1.800 millones en abril, ubicándose entre los 20 primeros en el ranking de tráfico global. Sin embargo, según los datos publicados por la empresa de análisis web Similarweb, después de seis meses de rápido crecimiento, las visitas de ChatGPT experimentaron un crecimiento negativo por primera vez, y las visitas en junio cayeron un 9,7% respecto al mes anterior.
La caída repentina en el tráfico de ChatGPT ha generado preocupaciones y discusiones en la comunidad tecnológica mundial sobre el riesgo de una burbuja en la industria de la IA. La revista The Economist incluso llegó a la conclusión de que "el camino hacia una IA más grande y mejor ya no es factible". La idea de convertirse en una "versión china de ChatGPT" también se está alejando del círculo empresarial chino.
Zhu Xiaohu, socio fundador de GSR, escribió en Moments: "No seas supersticioso con el modelo general, porque el próximo año GPT-3.5 se convertirá en mercancía (infraestructura general) y tres años después, GPT-4 también lo será. Para la mayoría de los empresarios, la escena es la prioridad, ¡y los datos son los reyes!".
Al mismo tiempo que ha cambiado la mentalidad de los profesionales, el mercado empresarial a gran escala ha comenzado a dividirse.
Las empresas de modelos a gran escala de China ya no están obsesionadas con el objetivo idealizado de "convertirse en la OpenAI de China", ni están obsesionadas con la búsqueda de modelos paramétricos y poder de cómputo. Tienen respuestas más pragmáticas y prestan más atención a resolver problemas en escenarios industriales reales.
La competencia de los modelos grandes de IA ha dado paso a un nuevo nodo de pista.
Pragmatismo colectivo
A principios de este año, Liang Jianzhang, el fundador y presidente de la junta directiva de Ctrip, comenzó a contactar a ChatGPT. En los últimos años, ha estado activo en los círculos académicos y empresariales como demógrafo, pero también fue el programador más antiguo y más joven de China, y casi se doctoró en inteligencia artificial.
A la edad de 13 años, Liang Jianzhang diseñó un programa para escribir poemas métricos y ganó un premio nacional. A la edad de 15 años, fue admitido en la clase junior de la Universidad de Fudan. Después de graduarse, fue a los Estados Unidos para estudiar y obtuvo una maestría en informática del Instituto de Tecnología de Georgia a la edad de 21 años. A la edad de 22 años, Liang Jianzhang, que estaba estudiando para obtener un doctorado, de repente se dio cuenta de las limitaciones del conocimiento teórico y decidió abandonar su doctorado para unirse a Oracle en los Estados Unidos.
La aparición de ChatGPT hizo que Liang Jianzhang se alegrara de no seguir estudiando para obtener un doctorado en inteligencia artificial, porque "Todos estos algoritmos de procesamiento de lenguaje natural fueron derrotados por completo por (ChatGPT)". Recordó que cuando entró en contacto por primera vez con ChatGPT, estaba "muy, muy sorprendido", y el segundo sentimiento fue la humildad: "El algoritmo más inteligente que finalmente creamos estaba tan cerca de la estructura biológica del cerebro humano".
Liang Jianzhang comenzó a pensar en la combinación del modelo grande de IA y el negocio de Ctrip.
En opinión de Liang Jianzhang, bajo el trasfondo de la sociedad inteligente, el turismo, como una "industria de demanda espiritual que es difícil de automatizar", su demanda aumentará con la mejora de la riqueza social general y su proporción en la economía también se expandirá. Se fijó en el modelo vertical de la industria del turismo.
En los últimos seis meses, miembros de varios negocios de Ctrip formaron el equipo técnico de modelos a gran escala de Ctrip. En la etapa inicial del desarrollo del modelo grande, Ctrip ajustó su estructura organizativa de acuerdo con los requisitos estratégicos del modelo grande y formó diferentes departamentos, incluido el equipo técnico general, el equipo de estrategia de contenido, el equipo de listas, etc., y adaptó el equipo técnico de acuerdo con la actualización continua y la iteración de los productos del modelo grande.
Liang Jianzhang dijo que Ctrip no escatimará esfuerzos para invertir en el modelo grande: "Deberíamos invertir muy firmemente a largo plazo si es valioso para nuestros clientes o comerciantes. Este (modelo grande) es muy nuevo, y el equipo técnico optimiza constantemente el monto de su inversión, pero no tenemos límite".
A mediados de julio, Ctrip lanzó oficialmente un gran modelo vertical de la industria del turismo. Asked ha examinado 20 000 millones de datos de turismo no estructurados, combinados con los datos estructurados en tiempo real existentes de Ctrip y los robots y algoritmos de búsqueda históricamente entrenados de Ctrip, y ha llevado a cabo una formación de modelos verticales de desarrollo propio. "Al mismo tiempo, hemos invertido una gran cantidad de mano de obra en generar y verificar el contenido general de respuesta de viajes", enfatizó Liang Jianzhang.
Antes de la publicación de la pregunta, Ctrip había realizado una prueba interna y el personal de servicio al cliente, Wang Yun, obviamente sintió que su trabajo había experimentado grandes cambios. En el pasado, tenía que responder más de 150 llamadas al día para responder las preguntas de los clientes sobre cancelaciones de pedidos posventa y pérdida de equipaje; ahora, Wang Yun se ha transformado para recomendar el servicio al cliente antes del viaje y entra a la sala de transmisión en vivo desde detrás de escena para brindar a los internautas servicios y sugerencias que deben prepararse antes del viaje.
En opinión de Liang Jianzhang, sobre la base de un modelo a gran escala de propósito general, resolver el problema de la precisión en la industria del turismo sigue siendo la clave: "Los viajes son una industria de alto consumo. Incluso si la planificación ahorra media hora, puede haber un 5 % de posibilidades de que el resultado del itinerario o el hotel recomendado sea incorrecto". .
Aunque no es tan bueno como el modelo grande general en términos de parámetros, ni tiene los estrictos requisitos de potencia de cómputo y otras condiciones del modelo grande general, pero el modelo grande vertical presenta requisitos más altos para datos y escenarios.
El mayor desafío en el entrenamiento del modelo a gran escala de Ask es que en la escena real, en el proceso de los usuarios que obtienen información de viaje, múltiples rondas de recopilación y limpieza de datos interactivos, el volumen de datos y la precisión de los datos deben corregirse constantemente, especialmente la industria del turismo ha experimentado cambios tremendos, y la información del destino hace tres años puede estar completamente desactualizada ahora, especialmente el impacto de la epidemia en la industria del turismo mundial ha exacerbado la puntualidad de los datos.
Al igual que Ctrip, cada vez más empresas colocan la pista de modelos grandes en el campo vertical.
La hoja de respuestas del modelo a gran escala de Yanxi entregada por JD.com también toma el modelo industrial a gran escala como una característica importante. Según Xu Ran, el nuevo director ejecutivo de Jingdong Group, el desarrollo de la tecnología de inteligencia artificial en el pasado ha estado al borde de la explosión de aplicaciones varias veces, pero al final a menudo duró poco y una de las razones importantes es que la tecnología no ha formado una aplicación sólida en la industria**.
En la conferencia de prensa de Huawei Pangu Large Model 3.0 el 7 de julio, Zhang Pingan, CEO de Huawei Cloud, incluso dijo sin rodeos: "Pangu Large Model no tiene tiempo para escribir poemas y conversar. No importa cuántos parámetros y cuán buena sea la capacidad de diálogo, si no puede resolver problemas prácticos, no será de mucha utilidad".
Tencent aún no ha anunciado el progreso del modelo general a gran escala Hunyuan, pero ha anunciado la ruta del modelo a gran escala de la industria de manera destacada, lanzando más de 50 soluciones para 10 industrias importantes de una sola vez. Li Qiang, vicepresidente de Tencent y presidente de negocios gubernamentales y empresariales de Tencent, también dijo: "Los modelos grandes generales no son la única dirección para la aplicación de modelos, y los modelos para industrias verticales se convertirán en el punto de inflexión del valor de los modelos grandes".
Cambio de mentalidad
Un nodo obvio en el cambio de mentalidad de los empresarios a gran escala comenzó cuando a Wang Huiwen le diagnosticaron depresión y Meituan lo adquirió a años luz de su fundación. De repente, todos se dieron cuenta de que incluso la compañía estrella que todos esperaban y tenían grandes esperanzas podría dejar de funcionar debido a varios accidentes.
Hace solo medio año, otros puntos de venta parecían disiparse de la noche a la mañana, y solo el modelo grande estaba en la posición C. Los empresarios e inversores en los círculos tecnológicos de China volaron a Silicon Valley para aprender de OpenAI. Zhang Yiming, Ma Huateng y Wang Xing, las figuras centrales número 1 o de toma de decisiones de estos gigantes, regresaron de la noche a la mañana al estado de entusiasmo y curiosidad cuando comenzaron sus negocios, leyendo documentos e intercambiando tecnologías a altas horas de la noche.
En ese momento, parecía que todos los exploradores de modelos chinos a gran escala pensaban en problemas con los sentimientos de familia y país. Ante la rápida iteración de ChatGPT, los objetivos que se marcan los empresarios chinos son cómo lograr adelantamientos en cuánto tiempo.
Li Yanhong dijo: "Baidu Wenxinyiyan estaba en la etapa de investigación y desarrollo, y el equipo técnico de Baidu realizó una prueba comparativa con ChatGPT. En ese momento, la brecha era de 40 puntos y podría recuperarse en un mes". Wang Xiaochuan también dijo que hará el mejor modelo de lenguaje grande en China para fin de año.
Zhou Hongyi, el fundador de 360, dijo en una entrevista con "Chinese Entrepreneur" que los modelos grandes ya no son la dimensión de la competencia comercial. Si el cierre de Internet chino y el problema de la isla de datos entre las aplicaciones causado por Internet móvil no se resuelven, es probable que conduzca a limitaciones en el entrenamiento del motor de inteligencia artificial, lo que puede conducir a una nueva ronda de revolución de IA entre China y Estados Unidos. Brecha intergeneracional.
En cuanto a por qué ninguna empresa como OpenAI nació en China, los empresarios chinos incluso comenzaron a reflexionar en ese momento. En el pasado, la exploración de inteligencia artificial doméstica era demasiado pragmática y todo estaba orientado a KPI, por lo que no todos tenían la determinación y la paciencia para invertir en ella, por lo que se perdieron un nodo tan importante.
Bajo el entusiasmo, después de que Baidu Wenxin disparó el primer tiro, ** surgieron más de 80 modelos de IA a gran escala en medio año **, y más de 30 modelos a gran escala aparecieron solo en la Conferencia Mundial de Inteligencia Artificial de 2023 celebrada en Shanghái No es una exageración describir la popularidad de los modelos a gran escala como "una guerra de cien modelos".
Pero, ¿realmente necesitamos tantos modelos grandes? ¿Qué tipo de modelo grande necesitamos?
De hecho, Robin Li propuso desde el principio: "No tiene mucho sentido que las empresas emergentes recreen ChatGPT. Creo que existe una gran oportunidad para desarrollar aplicaciones basadas en este modelo de lenguaje extenso. No hay necesidad de reinventar la rueda. Una vez que la rueda esté disponible, el valor de fabricar automóviles y aviones puede ser mayor que el de la rueda".
He Xiaodong, vicepresidente de tecnología de JD Group, también se dio cuenta desde el principio: "Para que el gran modelo sea valioso, debe colocarse en la industria, y es mejor estar en un campo con un alto valor industrial. Solo de esta manera puede convertirse realmente en algo sostenible a largo plazo, de lo contrario, puede convertirse en algo de corta duración".
NUEVA VARIABLE
Justo cuando los empresarios nacionales luchaban por explorar el modelo de IA, el gran movimiento de Zuckerberg trajo nuevas variables a este campo en constante cambio.
En la madrugada del 19 de julio, hora de Beijing, Meta lanzó el modelo grande de código abierto Llama 2, que una vez más detonó el círculo de la IA: Llama 2 no solo tiene el mismo rendimiento que GPT-3, sino que también es gratuito, de código abierto y disponible comercialmente. Llama 2 es la continuación del modelo Llama lanzado por Meta a principios de marzo.
En la posterior conferencia de socios de Microsoft Inspire, el CEO de Microsoft, Satya Nadella, anunció la noticia de la cooperación entre Meta y Microsoft, que permite que Llama 2 se ejecute en el servicio en la nube de Microsoft, Microsoft Azure. Al mismo tiempo, la nube de Amazon AWS también se unió a la cooperación con Meta.
La importancia de Llama 2 para los empresarios de modelos a gran escala es que, al igual que el sistema Android para el desarrollo de aplicaciones, los desarrolladores no necesitan reinventar la rueda y obtienen directamente la infraestructura de los modelos a gran escala al menor costo, para que puedan concentrarse más en sus propios escenarios industriales.
Hasta cierto punto, esto también significa que para la mayoría de los emprendedores, elegir enfocarse en aplicaciones verticales de la industria ha demostrado ser un camino más práctico.
Sin embargo, a diferencia de los modelos grandes generales, **Los modelos grandes industriales también presentan diferentes umbrales y requisitos para los participantes de la industria: **Por un lado, los modelos grandes industriales requieren que los desarrolladores tengan cierta acumulación técnica y fortaleza; por otro lado, los modelos grandes industriales también requieren que los operadores tengan escenarios de práctica de aplicación industrial ricos.
Liang Jianzhang dijo a "Chinese Entrepreneur": "El indicador más importante de un modelo grande general puede ser cuántos parámetros o cuántas GPU se usan, etc., pero el modelo grande vertical y el modelo de lenguaje grande son solo una parte. También tiene una combinación con otros datos, incluida la verificación manual, etc. Estos son más importantes. En última instancia, apunta a si es posible probar cuánto se puede mejorar la eficiencia, la precisión y la confiabilidad de estas preguntas y respuestas de los clientes".
"El mayor problema en el turismo es la confiabilidad. De hecho, esto es más complicado que la IA escribiendo poemas, artículos y novelas. También es un trabajo a largo plazo. Vale la pena hacer cualquier cosa que pueda mejorar esto al 80%, 90%, 95% o incluso al 99%", dijo finalmente Liang Jianzhang.
Ver originales
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
modelo, guay
Después de más de 200 días de emprendimiento a gran escala, la mentalidad de los exploradores chinos ha cambiado de la emoción ideal a la realidad.
Antes de esto, además de la propia empresa, el espíritu empresarial del modelo de IA estaba dotado de más significados, como el sentimiento nacional y la tendencia de la época.Al enfrentarse al surgimiento del modelo de propósito general ChatGPT, los empresarios chinos rápidamente llegaron a un consenso sobre cómo construir una versión china de OpenAI y ChatGPT.
No hay duda de que ChatGPT es el mejor jugador del mundo este año. Por ello, el tráfico del sitio web de OpenAI superó los 1.800 millones en abril, ubicándose entre los 20 primeros en el ranking de tráfico global. Sin embargo, según los datos publicados por la empresa de análisis web Similarweb, después de seis meses de rápido crecimiento, las visitas de ChatGPT experimentaron un crecimiento negativo por primera vez, y las visitas en junio cayeron un 9,7% respecto al mes anterior.
La caída repentina en el tráfico de ChatGPT ha generado preocupaciones y discusiones en la comunidad tecnológica mundial sobre el riesgo de una burbuja en la industria de la IA. La revista The Economist incluso llegó a la conclusión de que "el camino hacia una IA más grande y mejor ya no es factible". La idea de convertirse en una "versión china de ChatGPT" también se está alejando del círculo empresarial chino.
Zhu Xiaohu, socio fundador de GSR, escribió en Moments: "No seas supersticioso con el modelo general, porque el próximo año GPT-3.5 se convertirá en mercancía (infraestructura general) y tres años después, GPT-4 también lo será. Para la mayoría de los empresarios, la escena es la prioridad, ¡y los datos son los reyes!".
Al mismo tiempo que ha cambiado la mentalidad de los profesionales, el mercado empresarial a gran escala ha comenzado a dividirse.
Las empresas de modelos a gran escala de China ya no están obsesionadas con el objetivo idealizado de "convertirse en la OpenAI de China", ni están obsesionadas con la búsqueda de modelos paramétricos y poder de cómputo. Tienen respuestas más pragmáticas y prestan más atención a resolver problemas en escenarios industriales reales.
La competencia de los modelos grandes de IA ha dado paso a un nuevo nodo de pista.
Pragmatismo colectivo
A principios de este año, Liang Jianzhang, el fundador y presidente de la junta directiva de Ctrip, comenzó a contactar a ChatGPT. En los últimos años, ha estado activo en los círculos académicos y empresariales como demógrafo, pero también fue el programador más antiguo y más joven de China, y casi se doctoró en inteligencia artificial.
A la edad de 13 años, Liang Jianzhang diseñó un programa para escribir poemas métricos y ganó un premio nacional. A la edad de 15 años, fue admitido en la clase junior de la Universidad de Fudan. Después de graduarse, fue a los Estados Unidos para estudiar y obtuvo una maestría en informática del Instituto de Tecnología de Georgia a la edad de 21 años. A la edad de 22 años, Liang Jianzhang, que estaba estudiando para obtener un doctorado, de repente se dio cuenta de las limitaciones del conocimiento teórico y decidió abandonar su doctorado para unirse a Oracle en los Estados Unidos.
La aparición de ChatGPT hizo que Liang Jianzhang se alegrara de no seguir estudiando para obtener un doctorado en inteligencia artificial, porque "Todos estos algoritmos de procesamiento de lenguaje natural fueron derrotados por completo por (ChatGPT)". Recordó que cuando entró en contacto por primera vez con ChatGPT, estaba "muy, muy sorprendido", y el segundo sentimiento fue la humildad: "El algoritmo más inteligente que finalmente creamos estaba tan cerca de la estructura biológica del cerebro humano".
Liang Jianzhang comenzó a pensar en la combinación del modelo grande de IA y el negocio de Ctrip.
En opinión de Liang Jianzhang, bajo el trasfondo de la sociedad inteligente, el turismo, como una "industria de demanda espiritual que es difícil de automatizar", su demanda aumentará con la mejora de la riqueza social general y su proporción en la economía también se expandirá. Se fijó en el modelo vertical de la industria del turismo.
En los últimos seis meses, miembros de varios negocios de Ctrip formaron el equipo técnico de modelos a gran escala de Ctrip. En la etapa inicial del desarrollo del modelo grande, Ctrip ajustó su estructura organizativa de acuerdo con los requisitos estratégicos del modelo grande y formó diferentes departamentos, incluido el equipo técnico general, el equipo de estrategia de contenido, el equipo de listas, etc., y adaptó el equipo técnico de acuerdo con la actualización continua y la iteración de los productos del modelo grande.
Liang Jianzhang dijo que Ctrip no escatimará esfuerzos para invertir en el modelo grande: "Deberíamos invertir muy firmemente a largo plazo si es valioso para nuestros clientes o comerciantes. Este (modelo grande) es muy nuevo, y el equipo técnico optimiza constantemente el monto de su inversión, pero no tenemos límite".
A mediados de julio, Ctrip lanzó oficialmente un gran modelo vertical de la industria del turismo. Asked ha examinado 20 000 millones de datos de turismo no estructurados, combinados con los datos estructurados en tiempo real existentes de Ctrip y los robots y algoritmos de búsqueda históricamente entrenados de Ctrip, y ha llevado a cabo una formación de modelos verticales de desarrollo propio. "Al mismo tiempo, hemos invertido una gran cantidad de mano de obra en generar y verificar el contenido general de respuesta de viajes", enfatizó Liang Jianzhang.
Antes de la publicación de la pregunta, Ctrip había realizado una prueba interna y el personal de servicio al cliente, Wang Yun, obviamente sintió que su trabajo había experimentado grandes cambios. En el pasado, tenía que responder más de 150 llamadas al día para responder las preguntas de los clientes sobre cancelaciones de pedidos posventa y pérdida de equipaje; ahora, Wang Yun se ha transformado para recomendar el servicio al cliente antes del viaje y entra a la sala de transmisión en vivo desde detrás de escena para brindar a los internautas servicios y sugerencias que deben prepararse antes del viaje.
En opinión de Liang Jianzhang, sobre la base de un modelo a gran escala de propósito general, resolver el problema de la precisión en la industria del turismo sigue siendo la clave: "Los viajes son una industria de alto consumo. Incluso si la planificación ahorra media hora, puede haber un 5 % de posibilidades de que el resultado del itinerario o el hotel recomendado sea incorrecto". .
Aunque no es tan bueno como el modelo grande general en términos de parámetros, ni tiene los estrictos requisitos de potencia de cómputo y otras condiciones del modelo grande general, pero el modelo grande vertical presenta requisitos más altos para datos y escenarios.
El mayor desafío en el entrenamiento del modelo a gran escala de Ask es que en la escena real, en el proceso de los usuarios que obtienen información de viaje, múltiples rondas de recopilación y limpieza de datos interactivos, el volumen de datos y la precisión de los datos deben corregirse constantemente, especialmente la industria del turismo ha experimentado cambios tremendos, y la información del destino hace tres años puede estar completamente desactualizada ahora, especialmente el impacto de la epidemia en la industria del turismo mundial ha exacerbado la puntualidad de los datos.
Al igual que Ctrip, cada vez más empresas colocan la pista de modelos grandes en el campo vertical.
La hoja de respuestas del modelo a gran escala de Yanxi entregada por JD.com también toma el modelo industrial a gran escala como una característica importante. Según Xu Ran, el nuevo director ejecutivo de Jingdong Group, el desarrollo de la tecnología de inteligencia artificial en el pasado ha estado al borde de la explosión de aplicaciones varias veces, pero al final a menudo duró poco y una de las razones importantes es que la tecnología no ha formado una aplicación sólida en la industria**.
En la conferencia de prensa de Huawei Pangu Large Model 3.0 el 7 de julio, Zhang Pingan, CEO de Huawei Cloud, incluso dijo sin rodeos: "Pangu Large Model no tiene tiempo para escribir poemas y conversar. No importa cuántos parámetros y cuán buena sea la capacidad de diálogo, si no puede resolver problemas prácticos, no será de mucha utilidad".
Tencent aún no ha anunciado el progreso del modelo general a gran escala Hunyuan, pero ha anunciado la ruta del modelo a gran escala de la industria de manera destacada, lanzando más de 50 soluciones para 10 industrias importantes de una sola vez. Li Qiang, vicepresidente de Tencent y presidente de negocios gubernamentales y empresariales de Tencent, también dijo: "Los modelos grandes generales no son la única dirección para la aplicación de modelos, y los modelos para industrias verticales se convertirán en el punto de inflexión del valor de los modelos grandes".
Cambio de mentalidad
Un nodo obvio en el cambio de mentalidad de los empresarios a gran escala comenzó cuando a Wang Huiwen le diagnosticaron depresión y Meituan lo adquirió a años luz de su fundación. De repente, todos se dieron cuenta de que incluso la compañía estrella que todos esperaban y tenían grandes esperanzas podría dejar de funcionar debido a varios accidentes.
Hace solo medio año, otros puntos de venta parecían disiparse de la noche a la mañana, y solo el modelo grande estaba en la posición C. Los empresarios e inversores en los círculos tecnológicos de China volaron a Silicon Valley para aprender de OpenAI. Zhang Yiming, Ma Huateng y Wang Xing, las figuras centrales número 1 o de toma de decisiones de estos gigantes, regresaron de la noche a la mañana al estado de entusiasmo y curiosidad cuando comenzaron sus negocios, leyendo documentos e intercambiando tecnologías a altas horas de la noche.
En ese momento, parecía que todos los exploradores de modelos chinos a gran escala pensaban en problemas con los sentimientos de familia y país. Ante la rápida iteración de ChatGPT, los objetivos que se marcan los empresarios chinos son cómo lograr adelantamientos en cuánto tiempo.
Li Yanhong dijo: "Baidu Wenxinyiyan estaba en la etapa de investigación y desarrollo, y el equipo técnico de Baidu realizó una prueba comparativa con ChatGPT. En ese momento, la brecha era de 40 puntos y podría recuperarse en un mes". Wang Xiaochuan también dijo que hará el mejor modelo de lenguaje grande en China para fin de año.
Zhou Hongyi, el fundador de 360, dijo en una entrevista con "Chinese Entrepreneur" que los modelos grandes ya no son la dimensión de la competencia comercial. Si el cierre de Internet chino y el problema de la isla de datos entre las aplicaciones causado por Internet móvil no se resuelven, es probable que conduzca a limitaciones en el entrenamiento del motor de inteligencia artificial, lo que puede conducir a una nueva ronda de revolución de IA entre China y Estados Unidos. Brecha intergeneracional.
En cuanto a por qué ninguna empresa como OpenAI nació en China, los empresarios chinos incluso comenzaron a reflexionar en ese momento. En el pasado, la exploración de inteligencia artificial doméstica era demasiado pragmática y todo estaba orientado a KPI, por lo que no todos tenían la determinación y la paciencia para invertir en ella, por lo que se perdieron un nodo tan importante.
Bajo el entusiasmo, después de que Baidu Wenxin disparó el primer tiro, ** surgieron más de 80 modelos de IA a gran escala en medio año **, y más de 30 modelos a gran escala aparecieron solo en la Conferencia Mundial de Inteligencia Artificial de 2023 celebrada en Shanghái No es una exageración describir la popularidad de los modelos a gran escala como "una guerra de cien modelos".
Pero, ¿realmente necesitamos tantos modelos grandes? ¿Qué tipo de modelo grande necesitamos?
De hecho, Robin Li propuso desde el principio: "No tiene mucho sentido que las empresas emergentes recreen ChatGPT. Creo que existe una gran oportunidad para desarrollar aplicaciones basadas en este modelo de lenguaje extenso. No hay necesidad de reinventar la rueda. Una vez que la rueda esté disponible, el valor de fabricar automóviles y aviones puede ser mayor que el de la rueda".
He Xiaodong, vicepresidente de tecnología de JD Group, también se dio cuenta desde el principio: "Para que el gran modelo sea valioso, debe colocarse en la industria, y es mejor estar en un campo con un alto valor industrial. Solo de esta manera puede convertirse realmente en algo sostenible a largo plazo, de lo contrario, puede convertirse en algo de corta duración".
NUEVA VARIABLE
Justo cuando los empresarios nacionales luchaban por explorar el modelo de IA, el gran movimiento de Zuckerberg trajo nuevas variables a este campo en constante cambio.
En la madrugada del 19 de julio, hora de Beijing, Meta lanzó el modelo grande de código abierto Llama 2, que una vez más detonó el círculo de la IA: Llama 2 no solo tiene el mismo rendimiento que GPT-3, sino que también es gratuito, de código abierto y disponible comercialmente. Llama 2 es la continuación del modelo Llama lanzado por Meta a principios de marzo.
En la posterior conferencia de socios de Microsoft Inspire, el CEO de Microsoft, Satya Nadella, anunció la noticia de la cooperación entre Meta y Microsoft, que permite que Llama 2 se ejecute en el servicio en la nube de Microsoft, Microsoft Azure. Al mismo tiempo, la nube de Amazon AWS también se unió a la cooperación con Meta.
La importancia de Llama 2 para los empresarios de modelos a gran escala es que, al igual que el sistema Android para el desarrollo de aplicaciones, los desarrolladores no necesitan reinventar la rueda y obtienen directamente la infraestructura de los modelos a gran escala al menor costo, para que puedan concentrarse más en sus propios escenarios industriales.
Hasta cierto punto, esto también significa que para la mayoría de los emprendedores, elegir enfocarse en aplicaciones verticales de la industria ha demostrado ser un camino más práctico.
Sin embargo, a diferencia de los modelos grandes generales, **Los modelos grandes industriales también presentan diferentes umbrales y requisitos para los participantes de la industria: **Por un lado, los modelos grandes industriales requieren que los desarrolladores tengan cierta acumulación técnica y fortaleza; por otro lado, los modelos grandes industriales también requieren que los operadores tengan escenarios de práctica de aplicación industrial ricos.
Liang Jianzhang dijo a "Chinese Entrepreneur": "El indicador más importante de un modelo grande general puede ser cuántos parámetros o cuántas GPU se usan, etc., pero el modelo grande vertical y el modelo de lenguaje grande son solo una parte. También tiene una combinación con otros datos, incluida la verificación manual, etc. Estos son más importantes. En última instancia, apunta a si es posible probar cuánto se puede mejorar la eficiencia, la precisión y la confiabilidad de estas preguntas y respuestas de los clientes".
"El mayor problema en el turismo es la confiabilidad. De hecho, esto es más complicado que la IA escribiendo poemas, artículos y novelas. También es un trabajo a largo plazo. Vale la pena hacer cualquier cosa que pueda mejorar esto al 80%, 90%, 95% o incluso al 99%", dijo finalmente Liang Jianzhang.