En la niebla de los negocios, esas "oportunidades" aparentemente doradas son a menudo un grillete que atrapa a las personas.
Las últimas noticias de CNBC dijeron que el gigante mundial de chips Qualcomm tiene la intención de recortar alrededor de 1.258 empleados en dos bases principales en California. De hecho, Qualcomm ha enviado durante mucho tiempo esta "lista de la muerte" al departamento de empleo de California: 1.064 en San Diego y 194 en Santa Clara. Se espera que el terremoto entre en erupción el 13 de diciembre.
El informe de Qualcomm del último trimestre ha insinuado este "baño de sangre". Desde el punto de vista de la estructura financiera, los chips para teléfonos móviles son la principal fuente de ingresos de Qualcomm, representando más de la mitad, pero los ingresos cayeron un 21,6% interanual en el tercer trimestre. La saturación del mercado de teléfonos inteligentes, como una mano invisible, está sofocando silenciosamente a los gigantes de la cadena de suministro ascendente.
El crecimiento del mercado de la telefonía móvil ahora depende principalmente del ciclo de actualización del dispositivo. Desde 2019, el auge del reemplazo de teléfonos con tecnología 5G ha estado ocurriendo durante casi cuatro años. Pero Peter Richardson, analista senior de Counterpoint, reveló una cruda verdad: para 2022, el ciclo global de reemplazo de teléfonos móviles ha alcanzado los 43 meses más largos de la historia.
En los últimos cinco años, la industria de la telefonía móvil ha luchado por cambiar el impasse siguiendo el camino de la innovación. Pero mientras que incluso los líderes del mercado como Apple luchan por crear nuevas características impresionantes, otros proveedores luchan por mantener su posición en el mercado. Cada vez son más los consumidores que empiezan a preguntarse, ¿cuál es el valor de cambiar a un nuevo teléfono móvil?
Algunos expertos de la industria señalaron que el verdadero punto de quiebre puede ser el poder detrás del software, especialmente los modelos grandes como LLM y Transformer en el campo de la IA.
Aunque no está claro cómo maximizar estos potenciales, esto no impide que los gigantes de la telefonía móvil nacional intenten abrirse paso. Huami OV y otros han puesto su mirada en los grandes modelos de IA y están ansiosos por abrir un nuevo campo de batalla.
01 Teléfono móvil Batalla gigante Gran Modelo Arena
** Durante un tiempo, los fabricantes nacionales de teléfonos móviles parecen haberse puesto al día con el protagonismo de los modelos grandes. **
El 14 de agosto, en la conferencia de prensa anual de Xiaomi, se presentó el modelo grande Xiaomi AI y se convirtió en el centro de atención en un instante. En las dos principales plataformas de prueba de C- y CMMLU, ganó el décimo y el primer lugar en China, respectivamente.
Lei Jun anunció con confianza que el modelo grande de 1.300 millones de parámetros de Xiaomi ha estado funcionando perfectamente en el teléfono móvil, y su fuerza puede incluso igualar el modelo de nube de 6.000 millones de parámetros en algunos escenarios. El conocido compañero de clase de Xiaoai también fortalecerá la capacidad de los modelos grandes de IA, y la prueba de invitación ha comenzado el día de la conferencia.
El humo del lobo dirigido al gran modelo de IA no solo está aumentando en Xiaomi.
Ya en la Conferencia de Desarrolladores de Huawei 2023 el 4 de agosto, Yu Chengdong agitó la mano y anunció que HarmonyOS 4 se beneficiaría de la bendición del "modelo Pangu". Lo que es diferente es que Huawei decidió integrar profundamente el modelo grande en el sistema de telefonía móvil para lograr un mayor nivel de integración.
**Después de Huami, vivo y OPPO siguen mostrando sus ambiciones en el campo de los modelos grandes. **
Recientemente, OPPO anunció la primera ronda de pruebas públicas de su nuevo "Xiaobu Assistant", que atrajo la atención de la industria. Este producto se basa en la tecnología de modelos grandes AndesGPT.
El modelo AndesGPT es un modelo de lenguaje grande generativo de alto nivel basado en una arquitectura de nube híbrida basada en el equipo Andean Intelligent Cloud de OPPO. Los usuarios pueden participar en el registro de la versión beta pública de Xiaobu 1.0 activando el asistente de voz de Xiaobu y diciendo "Xiaobu Big Model". Se anunciará más información en el lanzamiento de ColorOS 14 el 16 de noviembre.
Al igual que la publicidad de sus pares, AndesGPT también ha ganado el título de "Líder de la industria" en su presentación oficial, y este modelo ha aparecido con frecuencia en muchas listas de revisión autorizadas.
Por otro lado, vivo ha fijado el 1 de noviembre para celebrar su conferencia anual de desarrolladores. En esta reunión, vivo revelará su investigación y desarrollo exclusivo de IA modelo grande y nuevo sistema operativo; Y también se revelará el tan esperado OriginOS 4.
Lo que es particularmente interesante es que la matriz de modelos grandes de IA creada por vivo es extremadamente rica, cubriendo tres niveles de parámetros de mil millones, decenas de miles de millones y cientos de miles de millones, un total de cinco modelos, con el objetivo de cumplir con escenarios de aplicaciones centrales diversificados.
Del mismo modo, este lote de productos, que todavía están detrás del velo, ha surgido en muchas revisiones autorizadas. Los últimos datos muestran que el modelo grande de IA de desarrollo propio de vivo ocupa el primer lugar en las dos plataformas principales de C y CMMLU.
Recientemente, la industria de la telefonía móvil ha sido testigo de cómo las principales marcas se sumergen en el profundo mar de modelos de IA uno por uno. ** La feroz competencia en el mercado de valores hace que los principales fabricantes esperen utilizar las nuevas tecnologías para crear una imagen más competitiva para sí mismos en el mercado de alta gama. **
Varias personas con profundos conocimientos en la industria creen que enfatizar las ventajas de las funciones de IA es obviamente una parte importante de la estrategia de los principales fabricantes. No solo puede estimular el deseo de los usuarios por productos de alta gama, sino también aumentar los precios de los productos, creando así ganancias más lucrativas para la marca.
Con el paso del tiempo, la primera ola de "teléfonos móviles con IA" reales está a punto de aparecer, y los próximos dos años serán el momento de la innovación en IA en teléfonos móviles.
02 Los modelos grandes compiten por el móvil, y el camino se unifica poco a poco
Aunque los fabricantes de teléfonos móviles muestran en la publicidad que el uso de modelos grandes en teléfonos móviles es tan fácil como beber agua y comer** en el funcionamiento real, los desafíos ocultos superan con creces las expectativas. **
Según Luan Jian, jefe del equipo de modelos grandes del Laboratorio de IA del Comité Técnico de Xiaomi, para ejecutar realmente un modelo grande en un teléfono móvil, los requisitos para el hardware del teléfono móvil nunca serán bajos, especialmente el procesador y la memoria.
Una vez que ocupa demasiado de la memoria de trabajo del teléfono, hará que otras aplicaciones se limiten e incluso puede hacer que el teléfono no responda, el rendimiento general se reduzca drásticamente o, en el peor de los casos, se bloquee directamente.
Además, la potencia de cálculo también es un punto clave en el juicio. Se tarda varios segundos en generar un personaje, lo que es desastroso para la experiencia del usuario. Teniendo en cuenta que la velocidad de lectura promedio de las personas es de aproximadamente una docena de caracteres chinos por segundo, la "velocidad de generación" del modelo debe ser mucho mayor que eso.
No se puede ignorar el problema del consumo de energía. Muchas demostraciones de modelos en línea a menudo pasan por alto este enlace crítico. El chip informático bajo alta carga hará que el teléfono móvil se caliente rápidamente y, si se opera durante tanto tiempo, inevitablemente causará daños graves a la vida útil de la batería.
En resumen, el verdadero desafío del modelo de teléfono grande es cómo encontrar un delicado equilibrio entre la velocidad de procesamiento, la disipación de calor y la duración de la batería. Por lo tanto, el enfoque de la industria también está en la colaboración dispositivo-nube. **
No hace mucho, MediaTek y OPPO llegaron a un acuerdo para desarrollar conjuntamente una solución de implementación ligera para modelos grandes en el lado final, con el objetivo de acercar la tecnología de modelos grandes al uso real de los consumidores.
El 18 de octubre, MediaTek también anunció una cooperación en profundidad y una depuración conjunta con vivo en el campo de la IA, realizando el aterrizaje de 1.000 millones y 7.000 millones de modelos de lenguaje grandes de IA y 1.000 millones de modelos visuales de IA en el lado de los teléfonos móviles, brindando conjuntamente a los consumidores una experiencia innovadora de aplicaciones de IA generativa del lado final.
La ventaja del modelo grande del lado final es que los usuarios pueden disfrutar de una velocidad de respuesta más rápida y, al mismo tiempo, no es necesario cargar datos en la nube, lo que es más seguro. En la actualidad, muchos fabricantes convencionales están desarrollando soluciones para implementar modelos grandes de IA en terminales móviles para lograr el objetivo de ejecutar modelos grandes en el lado final.
**Sin embargo, no se puede asumir que los dispositivos móviles por sí solos resolverán todos los problemas. **Como reveló Xiaomi, seguirán siguiendo la estrategia de combinar dispositivos y nubes. Algunas funciones o capacidades, si se pueden implementar a través del modelo del lado final, no necesitan transferirse a la nube.
En cuanto a la situación de Vivo, aunque faltan datos exactos, es razonable especular que también adoptará una estrategia de modelo grande que combine la nube y las instalaciones.
A partir de la magnitud de los parámetros de su modelo grande, los modelos grandes de nube de 66 mil millones, 130 mil millones y 175 mil millones están diseñados para garantizar la potencia de procesamiento para hacer frente a problemas más complejos. Los modelos locales del orden de 1.000 millones y 7.000 millones están diseñados para garantizar la privacidad del usuario, la eficiencia energética y la rapidez de respuesta.
Esto significa que es probable que Vivo adopte un enfoque dispositivo-nube para trabajar juntos, es decir, evaluar la complejidad del problema para decidir si procesarlo localmente o pasar a la nube.
La combinación de grandes modelos locales y en la nube no solo puede ahorrar costos de manera efectiva, sino que también satisface las necesidades de los usuarios en potencia de cómputo, rendimiento, consumo de energía y protección de la privacidad, que es sin duda una de las estrategias preferidas para integrar teléfonos móviles y modelos grandes de IA.
03 Los fabricantes siguen su ejemplo, algunos desafíos potenciales
Parte de la industria considera que los intentos actuales de ejecutar modelos grandes en teléfonos móviles son una espada afilada. Sin embargo, si se profundiza entre bastidores, es inevitable revelar una sensación de miopía que responde a la situación en lugar de buscar realmente el cambio. **
En primer lugar, la definición de "gran modelo" sigue siendo vaga. Tomemos como ejemplo el modelo final de Xiaomi, su número de parámetros alcanza los 1.300 millones, que no es muy diferente del parámetro 1.5B de GPT2, pero ¿es esto realmente suficiente para darle el título de "gran modelo"?
Hay muchas personas en la industria que han arrojado dudas: la práctica de los grandes modelos en el lado de los teléfonos móviles es más para satisfacer el auge a corto plazo del mercado, que el verdadero salto adelante de la tecnología. Si los teléfonos móviles realmente pueden conducir modelos grandes sin esfuerzo, ¿cuál es la importancia de la existencia del gigante gráfico NVIDIA?
Además, para adaptar los modelos grandes a los teléfonos móviles, los fabricantes tienen que comprimirlos drásticamente a través de estrategias como la poda, la destilación y la cuantificación. En el caso de vivo, que puede reducir los parámetros de 175.000 millones a sólo 1.000 millones a través del recorte y la destilación continuos del modelo, vale la pena considerar si esta operación es demasiado descabellada.
Reconozca que un modelo grande no es solo una simple superposición del número de parámetros, su valor real radica en la "profundidad" del aprendizaje profundo. Un gran número de parámetros significa más información, conocimiento y contexto capturado.
Por lo tanto, cuando un modelo con cientos de miles de millones de parámetros se reduce a miles de millones de parámetros, está destinado a perder parte de la profundidad de aprendizaje original. Para las aplicaciones cotidianas de la IA, el impacto puede no ser significativo, pero para aquellos usuarios de alto nivel que esperan una visión profunda y una comprensión de la IA, esta pérdida es inaceptable.
**Incluso si Xiaomi afirma que su modelo final se puede comparar con el modelo en la nube, los detalles no se pueden ignorar. ** El modelo del lado final con 1.300 millones de parámetros es naturalmente difícil de comparar con el modelo de la nube con cientos de miles de millones de parámetros. Para compensar esta brecha, Xiaomi puede optar por hacer que su modelo final sea comparable al modelo de la nube en escenarios específicos, pero no se puede comparar por completo.
Desde estos niveles, la implementación actual de modelos grandes en teléfonos móviles parece ser un poco "exagerada". Para el usuario medio, realmente no le importa el número de parámetros del modelo, sino más bien el valor que puede aportarle. Si bien estos intentos de vivo y Xiaomi son alentadores, también deberían reflexionar sobre su verdadero propósito e importancia.
Además, aunque muchos fabricantes de teléfonos móviles están explorando activamente la aplicación de modelos grandes de IA, el camino futuro aún está lleno de incógnitas. ** En el mercado de la telefonía móvil, cuál es la próxima aplicación "asesina" se revelará con el tiempo. **
En la actualidad, la aplicación específica de los fabricantes de teléfonos móviles a los modelos grandes de IA parece estar demasiado centrada en los "asistentes de voz". ¿Esta búsqueda unidireccional solo atiende a la tendencia candente de la ciencia y la tecnología, en lugar de considerar realmente las necesidades reales de los usuarios?
Tomando como ejemplo el reciente intercambio del nuevo modelo de IA de vivo por parte de conocidos blogueros, aunque se dio a conocer en OriginOS 4 con un nuevo aspecto, el núcleo no es muy subversivo en comparación con el asistente de voz actual.
En resumen, la verdadera adopción de modelos de IA en los teléfonos móviles aún se tambalea. Los esfuerzos de hoy son solo el primer viaje del iceberg.
Recursos:
Tencent Technology-La gran "ambición" de modelos de Xiaomi comienza desde el lado final
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
No introduzcas modelos grandes en tu teléfono
Fuente original: Noticias de Ciencia y Tecnología
Autor: Zhangdao
En la niebla de los negocios, esas "oportunidades" aparentemente doradas son a menudo un grillete que atrapa a las personas.
Las últimas noticias de CNBC dijeron que el gigante mundial de chips Qualcomm tiene la intención de recortar alrededor de 1.258 empleados en dos bases principales en California. De hecho, Qualcomm ha enviado durante mucho tiempo esta "lista de la muerte" al departamento de empleo de California: 1.064 en San Diego y 194 en Santa Clara. Se espera que el terremoto entre en erupción el 13 de diciembre.
El informe de Qualcomm del último trimestre ha insinuado este "baño de sangre". Desde el punto de vista de la estructura financiera, los chips para teléfonos móviles son la principal fuente de ingresos de Qualcomm, representando más de la mitad, pero los ingresos cayeron un 21,6% interanual en el tercer trimestre. La saturación del mercado de teléfonos inteligentes, como una mano invisible, está sofocando silenciosamente a los gigantes de la cadena de suministro ascendente.
El crecimiento del mercado de la telefonía móvil ahora depende principalmente del ciclo de actualización del dispositivo. Desde 2019, el auge del reemplazo de teléfonos con tecnología 5G ha estado ocurriendo durante casi cuatro años. Pero Peter Richardson, analista senior de Counterpoint, reveló una cruda verdad: para 2022, el ciclo global de reemplazo de teléfonos móviles ha alcanzado los 43 meses más largos de la historia.
En los últimos cinco años, la industria de la telefonía móvil ha luchado por cambiar el impasse siguiendo el camino de la innovación. Pero mientras que incluso los líderes del mercado como Apple luchan por crear nuevas características impresionantes, otros proveedores luchan por mantener su posición en el mercado. Cada vez son más los consumidores que empiezan a preguntarse, ¿cuál es el valor de cambiar a un nuevo teléfono móvil?
Algunos expertos de la industria señalaron que el verdadero punto de quiebre puede ser el poder detrás del software, especialmente los modelos grandes como LLM y Transformer en el campo de la IA.
Aunque no está claro cómo maximizar estos potenciales, esto no impide que los gigantes de la telefonía móvil nacional intenten abrirse paso. Huami OV y otros han puesto su mirada en los grandes modelos de IA y están ansiosos por abrir un nuevo campo de batalla.
01 Teléfono móvil Batalla gigante Gran Modelo Arena
** Durante un tiempo, los fabricantes nacionales de teléfonos móviles parecen haberse puesto al día con el protagonismo de los modelos grandes. **
El 14 de agosto, en la conferencia de prensa anual de Xiaomi, se presentó el modelo grande Xiaomi AI y se convirtió en el centro de atención en un instante. En las dos principales plataformas de prueba de C- y CMMLU, ganó el décimo y el primer lugar en China, respectivamente.
Lei Jun anunció con confianza que el modelo grande de 1.300 millones de parámetros de Xiaomi ha estado funcionando perfectamente en el teléfono móvil, y su fuerza puede incluso igualar el modelo de nube de 6.000 millones de parámetros en algunos escenarios. El conocido compañero de clase de Xiaoai también fortalecerá la capacidad de los modelos grandes de IA, y la prueba de invitación ha comenzado el día de la conferencia.
El humo del lobo dirigido al gran modelo de IA no solo está aumentando en Xiaomi.
Ya en la Conferencia de Desarrolladores de Huawei 2023 el 4 de agosto, Yu Chengdong agitó la mano y anunció que HarmonyOS 4 se beneficiaría de la bendición del "modelo Pangu". Lo que es diferente es que Huawei decidió integrar profundamente el modelo grande en el sistema de telefonía móvil para lograr un mayor nivel de integración.
**Después de Huami, vivo y OPPO siguen mostrando sus ambiciones en el campo de los modelos grandes. **
Recientemente, OPPO anunció la primera ronda de pruebas públicas de su nuevo "Xiaobu Assistant", que atrajo la atención de la industria. Este producto se basa en la tecnología de modelos grandes AndesGPT.
El modelo AndesGPT es un modelo de lenguaje grande generativo de alto nivel basado en una arquitectura de nube híbrida basada en el equipo Andean Intelligent Cloud de OPPO. Los usuarios pueden participar en el registro de la versión beta pública de Xiaobu 1.0 activando el asistente de voz de Xiaobu y diciendo "Xiaobu Big Model". Se anunciará más información en el lanzamiento de ColorOS 14 el 16 de noviembre.
Al igual que la publicidad de sus pares, AndesGPT también ha ganado el título de "Líder de la industria" en su presentación oficial, y este modelo ha aparecido con frecuencia en muchas listas de revisión autorizadas.
Por otro lado, vivo ha fijado el 1 de noviembre para celebrar su conferencia anual de desarrolladores. En esta reunión, vivo revelará su investigación y desarrollo exclusivo de IA modelo grande y nuevo sistema operativo; Y también se revelará el tan esperado OriginOS 4.
Lo que es particularmente interesante es que la matriz de modelos grandes de IA creada por vivo es extremadamente rica, cubriendo tres niveles de parámetros de mil millones, decenas de miles de millones y cientos de miles de millones, un total de cinco modelos, con el objetivo de cumplir con escenarios de aplicaciones centrales diversificados.
Del mismo modo, este lote de productos, que todavía están detrás del velo, ha surgido en muchas revisiones autorizadas. Los últimos datos muestran que el modelo grande de IA de desarrollo propio de vivo ocupa el primer lugar en las dos plataformas principales de C y CMMLU.
Varias personas con profundos conocimientos en la industria creen que enfatizar las ventajas de las funciones de IA es obviamente una parte importante de la estrategia de los principales fabricantes. No solo puede estimular el deseo de los usuarios por productos de alta gama, sino también aumentar los precios de los productos, creando así ganancias más lucrativas para la marca.
Con el paso del tiempo, la primera ola de "teléfonos móviles con IA" reales está a punto de aparecer, y los próximos dos años serán el momento de la innovación en IA en teléfonos móviles.
02 Los modelos grandes compiten por el móvil, y el camino se unifica poco a poco
Aunque los fabricantes de teléfonos móviles muestran en la publicidad que el uso de modelos grandes en teléfonos móviles es tan fácil como beber agua y comer** en el funcionamiento real, los desafíos ocultos superan con creces las expectativas. **
Según Luan Jian, jefe del equipo de modelos grandes del Laboratorio de IA del Comité Técnico de Xiaomi, para ejecutar realmente un modelo grande en un teléfono móvil, los requisitos para el hardware del teléfono móvil nunca serán bajos, especialmente el procesador y la memoria.
Una vez que ocupa demasiado de la memoria de trabajo del teléfono, hará que otras aplicaciones se limiten e incluso puede hacer que el teléfono no responda, el rendimiento general se reduzca drásticamente o, en el peor de los casos, se bloquee directamente.
Además, la potencia de cálculo también es un punto clave en el juicio. Se tarda varios segundos en generar un personaje, lo que es desastroso para la experiencia del usuario. Teniendo en cuenta que la velocidad de lectura promedio de las personas es de aproximadamente una docena de caracteres chinos por segundo, la "velocidad de generación" del modelo debe ser mucho mayor que eso.
No se puede ignorar el problema del consumo de energía. Muchas demostraciones de modelos en línea a menudo pasan por alto este enlace crítico. El chip informático bajo alta carga hará que el teléfono móvil se caliente rápidamente y, si se opera durante tanto tiempo, inevitablemente causará daños graves a la vida útil de la batería.
En resumen, el verdadero desafío del modelo de teléfono grande es cómo encontrar un delicado equilibrio entre la velocidad de procesamiento, la disipación de calor y la duración de la batería. Por lo tanto, el enfoque de la industria también está en la colaboración dispositivo-nube. **
El 18 de octubre, MediaTek también anunció una cooperación en profundidad y una depuración conjunta con vivo en el campo de la IA, realizando el aterrizaje de 1.000 millones y 7.000 millones de modelos de lenguaje grandes de IA y 1.000 millones de modelos visuales de IA en el lado de los teléfonos móviles, brindando conjuntamente a los consumidores una experiencia innovadora de aplicaciones de IA generativa del lado final.
La ventaja del modelo grande del lado final es que los usuarios pueden disfrutar de una velocidad de respuesta más rápida y, al mismo tiempo, no es necesario cargar datos en la nube, lo que es más seguro. En la actualidad, muchos fabricantes convencionales están desarrollando soluciones para implementar modelos grandes de IA en terminales móviles para lograr el objetivo de ejecutar modelos grandes en el lado final.
**Sin embargo, no se puede asumir que los dispositivos móviles por sí solos resolverán todos los problemas. **Como reveló Xiaomi, seguirán siguiendo la estrategia de combinar dispositivos y nubes. Algunas funciones o capacidades, si se pueden implementar a través del modelo del lado final, no necesitan transferirse a la nube.
En cuanto a la situación de Vivo, aunque faltan datos exactos, es razonable especular que también adoptará una estrategia de modelo grande que combine la nube y las instalaciones.
A partir de la magnitud de los parámetros de su modelo grande, los modelos grandes de nube de 66 mil millones, 130 mil millones y 175 mil millones están diseñados para garantizar la potencia de procesamiento para hacer frente a problemas más complejos. Los modelos locales del orden de 1.000 millones y 7.000 millones están diseñados para garantizar la privacidad del usuario, la eficiencia energética y la rapidez de respuesta.
Esto significa que es probable que Vivo adopte un enfoque dispositivo-nube para trabajar juntos, es decir, evaluar la complejidad del problema para decidir si procesarlo localmente o pasar a la nube.
La combinación de grandes modelos locales y en la nube no solo puede ahorrar costos de manera efectiva, sino que también satisface las necesidades de los usuarios en potencia de cómputo, rendimiento, consumo de energía y protección de la privacidad, que es sin duda una de las estrategias preferidas para integrar teléfonos móviles y modelos grandes de IA.
03 Los fabricantes siguen su ejemplo, algunos desafíos potenciales
Parte de la industria considera que los intentos actuales de ejecutar modelos grandes en teléfonos móviles son una espada afilada. Sin embargo, si se profundiza entre bastidores, es inevitable revelar una sensación de miopía que responde a la situación en lugar de buscar realmente el cambio. **
En primer lugar, la definición de "gran modelo" sigue siendo vaga. Tomemos como ejemplo el modelo final de Xiaomi, su número de parámetros alcanza los 1.300 millones, que no es muy diferente del parámetro 1.5B de GPT2, pero ¿es esto realmente suficiente para darle el título de "gran modelo"?
Hay muchas personas en la industria que han arrojado dudas: la práctica de los grandes modelos en el lado de los teléfonos móviles es más para satisfacer el auge a corto plazo del mercado, que el verdadero salto adelante de la tecnología. Si los teléfonos móviles realmente pueden conducir modelos grandes sin esfuerzo, ¿cuál es la importancia de la existencia del gigante gráfico NVIDIA?
Además, para adaptar los modelos grandes a los teléfonos móviles, los fabricantes tienen que comprimirlos drásticamente a través de estrategias como la poda, la destilación y la cuantificación. En el caso de vivo, que puede reducir los parámetros de 175.000 millones a sólo 1.000 millones a través del recorte y la destilación continuos del modelo, vale la pena considerar si esta operación es demasiado descabellada.
Reconozca que un modelo grande no es solo una simple superposición del número de parámetros, su valor real radica en la "profundidad" del aprendizaje profundo. Un gran número de parámetros significa más información, conocimiento y contexto capturado.
Por lo tanto, cuando un modelo con cientos de miles de millones de parámetros se reduce a miles de millones de parámetros, está destinado a perder parte de la profundidad de aprendizaje original. Para las aplicaciones cotidianas de la IA, el impacto puede no ser significativo, pero para aquellos usuarios de alto nivel que esperan una visión profunda y una comprensión de la IA, esta pérdida es inaceptable.
Desde estos niveles, la implementación actual de modelos grandes en teléfonos móviles parece ser un poco "exagerada". Para el usuario medio, realmente no le importa el número de parámetros del modelo, sino más bien el valor que puede aportarle. Si bien estos intentos de vivo y Xiaomi son alentadores, también deberían reflexionar sobre su verdadero propósito e importancia.
Además, aunque muchos fabricantes de teléfonos móviles están explorando activamente la aplicación de modelos grandes de IA, el camino futuro aún está lleno de incógnitas. ** En el mercado de la telefonía móvil, cuál es la próxima aplicación "asesina" se revelará con el tiempo. **
En la actualidad, la aplicación específica de los fabricantes de teléfonos móviles a los modelos grandes de IA parece estar demasiado centrada en los "asistentes de voz". ¿Esta búsqueda unidireccional solo atiende a la tendencia candente de la ciencia y la tecnología, en lugar de considerar realmente las necesidades reales de los usuarios?
Tomando como ejemplo el reciente intercambio del nuevo modelo de IA de vivo por parte de conocidos blogueros, aunque se dio a conocer en OriginOS 4 con un nuevo aspecto, el núcleo no es muy subversivo en comparación con el asistente de voz actual.
En resumen, la verdadera adopción de modelos de IA en los teléfonos móviles aún se tambalea. Los esfuerzos de hoy son solo el primer viaje del iceberg.
Recursos:
Tencent Technology-La gran "ambición" de modelos de Xiaomi comienza desde el lado final