El 21 de marzo de 2023, en la conferencia anual de tecnología de gran éxito de NVIDIA GTC, el CEO de NVIDIA, Jensen Huang, anunció a toda la industria tecnológica: Con la popularidad del modelo de lenguaje grande ChatGPT en todo el mundo, se ha inventado una nueva plataforma informática y ha comenzado el momento de la IA en el iPhone.
Como resultado, si bien el "momento iPhone de la IA" se ha convertido en una palabra candente en la industria, también indica inadvertidamente que esta ronda de revolución de la IA provocada por grandes modelos de lenguaje (más tarde conocidos como "grandes modelos") está estrechamente relacionada con la industria de los teléfonos inteligentes representada por el iPhone.
De hecho, la adopción y aplicación de modelos grandes por parte de la industria de los teléfonos inteligentes es vertiginosamente rápida.
En el último año, los participantes de la industria china de teléfonos inteligentes, incluidos Huawei, Xiaomi, OPPO, vivo y Honor, han ingresado sucesivamente al modelo grande con alto perfil, aunque Apple no ha anunciado oficialmente su entrada, también hay muchas noticias en la industria sobre el diseño de Apple de "Apple GPT" y modelos grandes.
Así que la pregunta es: los fabricantes de teléfonos móviles diseñan modelos grandes, ¿es un truco?
**Huawei está un paso por delante, ¿por qué? **
La primera asociación a nivel de aplicación entre los modelos grandes y los teléfonos inteligentes fue en realidad en el lanzamiento del nuevo producto insignia de primavera de Huawei en marzo de 2023.
En esta conferencia, Yu Chengdong, Director Ejecutivo y CEO de Consumer Business de Huawei, lanzó una nueva función de "Búsqueda inteligente" para los usuarios, que se basa en la tecnología multimodal de modelos grandes, se entrena en la nube y luego miniaturiza el modelo en el teléfono móvil, realizando la primera y precisa experiencia de búsqueda de bibliotecas de teléfonos móviles en lenguaje natural de la industria.
En pocas palabras, los usuarios pueden despertar a Xiaoyi por voz como una persona y usar lenguaje natural para buscar fotos en la galería del teléfono móvil que coincidan con descripciones como "viendo el amanecer desde la cima de la montaña", "haciendo té alrededor del hogar", "pez payaso en coral azul", etc.
En comparación con la galería de fotos tradicional que utiliza etiquetas para la búsqueda de fotos, existen problemas como la baja precisión y la velocidad de respuesta lenta, y la búsqueda inteligente es más "inteligente". Combinado con el modelo multimodal grande, la búsqueda inteligente preentrena cientos de millones de datos gráficos, aumenta la comprensión de la semántica general generalizada, admite la búsqueda en lenguaje natural que incluye múltiples combinaciones de información como color, forma, objeto, comportamiento, tiempo y lugar, y realiza aplicaciones livianas del lado final.
Vale la pena mencionar que en el proceso de los usuarios que utilizan la "búsqueda inteligente", los datos relevantes se procesan en el lado final, lo que protege aún más la privacidad y la seguridad del consumidor.
Entonces, ¿por qué Huawei es capaz de tomar la delantera en el uso de la tecnología multimodal de grandes modelos para potenciar los teléfonos inteligentes?
La respuesta es simple: el diseño es temprano.
De hecho, ya a finales de abril de 2021, en la Conferencia de Desarrolladores de Huawei de HDC.Cloud de 2021, Yu Chengdong, entonces CEO de HUAWEI CLOUD, lanzó un producto de gran éxito, el modelo HUAWEI CLOUD Pangu, que se basa en la formación previa y en un pequeño número de modelos de desarrollo de adaptación y ajuste de la industria, lo que permite a la IA líder en el mundo entrar realmente en miles de industrias**.
Específicamente, el modelo grande de Pangu lanzado esta vez incluye el modelo grande de Pangu NLP, el modelo grande de CV, el modelo grande multimodal y el modelo grande de computación científica. Entre ellos, el modelo grande de Pangu NLP es el primer modelo grande de NLP chino de generación y comprensión de nivel 100 mil millones de la industria, y el modelo grande de Pangu CV es también el modelo grande de visión por computadora más grande de la industria, que admite 3 mil millones de parámetros; El modelo multimodal grande incluye la búsqueda intermodal, la generación de modo extendido y la conversación de gráficos.
Por lo tanto, desde 2020, Huawei ha estado diseñando el campo de los modelos grandes durante varios años y está en constante evolución; En 2023, con la irrupción de ChatGPT, los teléfonos inteligentes también se han convertido en un escenario de aplicación para que las capacidades de los modelos grandes de Huawei se desplieguen en el lado final.
En la Conferencia de Desarrolladores de Huawei HDC 2023 a principios de agosto de 2023, Yu Chengdong dijo que en la era de los grandes modelos de IA, los modelos grandes de Pangu ayudarán al ecosistema de Hongmeng.
Específicamente, con la ayuda de Pangu Natural Language Big Model, Pangu Vision Big Model y Pangu Multimodal Big Model, el sistema Harmony 4.0 marcará el comienzo de un nuevo "pequeño arte", que incluye la adquisición de conocimientos, el razonamiento lógico, la planificación de tareas, la expansión de la memoria, la llamada a herramientas y la asistencia a la producción, etc., para promover la transformación interactiva, el cambio de la eficiencia de la productividad y la transformación del servicio personalizado de los terminales inteligentes.
Cabe señalar que HarmonyOS 4.0 todavía se ha enviado a los usuarios poco después de su lanzamiento oficial, no solo eso, en la conferencia de nuevos productos de otoño de Huawei celebrada el 25 de septiembre, según el anuncio de Yu Chengdong en el acto, Hongmeng 4.0 con la bendición de los modelos grandes tiene más de 60 millones de usuarios actualizados más de un mes después de su lanzamiento.
Es decir, en la actualidad, Huawei es un auténtico referente en el proceso de despliegue de grandes modelos para terminales smartphone.
**Xiaomi OV Honor también está en el juego, ¿es confiable? **
Además de Huawei, los fabricantes nacionales de teléfonos móviles como Xiaomi, OPPO, vivo y Honor también están apuntando a modelos grandes.
A finales de junio de este año, en la Conferencia de Comunicaciones Móviles MWC Shanghai 2023, el CEO de Honor, Zhao Ming, dijo que tomará la iniciativa en la introducción de modelos grandes de IA en el lado del dispositivo para crear una IA personal que solo pertenezca a los usuarios. También enfatizó que "el gran modelo rompe muchos de nuestros límites de pensamiento y es la mejor interpretación de la IA que hemos visto hasta ahora".
En ese momento, el teléfono móvil insignia de Honor, Magic V2, estaba a punto de ser lanzado, por lo que algunas voces externas dijeron que sería "el primer teléfono móvil doméstico de modelo grande con IA del mundo", lo que atrajo la atención del mundo exterior, pero por la situación posterior, Honor Magic V2 aún no se ha asociado con el modelo grande, pero ha solicitado la marca registrada "MagicGPT" a fines de agosto.
En comparación con Honor, el despliegue de Xiaomi en el campo de los modelos grandes no está lejos de los usuarios comunes.
En agosto de este año, en el discurso anual de 2023 de Lei Jun, Lei Jun dijo que Xiaomi adopta por completo los modelos grandes y formó un equipo de modelos grandes de IA de Xiaomi en abril de este año: se entiende que el líder del equipo es Luan Jian, el jefe del equipo de modelos grandes del Laboratorio de IA del Comité Técnico de Xiaomi.
En el discurso, Lei Jun dijo que la principal dirección de avance de la tecnología de modelos grandes de Xiaomi es "liviana" y "implementación local", y en la actualidad, el modelo final de 1.300 millones de parámetros de desarrollo propio de Xiaomi se ha ejecutado a través de la demostración en el teléfono móvil, y algunos efectos de escena pueden ser comparables al efecto informático de 6 mil millones de modelos en la nube.
Curiosamente, Lei Jun enfatizó que en el proceso de diseño de grandes modelos, a nivel de datos, los propios datos de entrenamiento de Xiaomi representaron el 80%, de los cuales los propios productos y datos comerciales de Xiaomi alcanzaron los 3 TB.
Además, para proteger la privacidad del usuario, Xiaomi también despliega el modelo en el lado final, no es necesario cargar la información en la nube y todos los cálculos se realizan localmente, lo que puede garantizar fundamentalmente que la privacidad del usuario no se filtre. Incluso en el marco de servicio de integración de dispositivos y nubes, la información de privacidad se almacenará en el lado del dispositivo y los cálculos que los involucran se completarán en el lado final tanto como sea posible. Incluso si ocasionalmente se requieren las capacidades de la nube, la información se procesa y encripta.
Desde el punto de vista del resultado, el portador de aterrizaje del modelo grande de Xiaomi es "Xiaoai classmate". Después de la potenciación de los modelos grandes, la forma de interacción humano-computadora de Xiaoai se actualizará para agregar una serie de capacidades de conocimiento general, incluida la comprensión profunda del contexto, la capacidad de traducción, la súper pregunta y respuesta, los resultados generativos y la realización de tareas complejas.
Desde agosto, Xiaomi ha abierto la prueba interna del "Little Love Classmate Big Model", y su aterrizaje está a la vuelta de la esquina.
Fuera de Honor y Xiaomi, las acciones de OPPO y Vivo en términos de grandes modelos no se han quedado atrás.
Específicamente, el 11 de octubre, OPPO anunció que cooperará con MediaTek para construir una solución liviana de implementación del lado final de modelo grande, y mediante el uso de tecnología de cuantificación de 4 bits, logrará un mejor rendimiento lado a lado sin perder precisión, y promoverá conjuntamente el aterrizaje gradual de su modelo de lenguaje grande AndesGPT de desarrollo propio y el modelo grande multimodal en el lado final.
En la actualidad, se ha inaugurado oficialmente la nueva experiencia Xiaobu Assistant 1.0 Beta basada en su modelo andino grande autoentrenado (AndesGPT), y el Xiaobu Assistant actualizado tendrá capacidades de modelo grande de IA.
Además, el 16 de octubre, vivo también anunció que lanzará un nuevo sistema operativo móvil OriginOS 4 en la conferencia de desarrolladores vivo 2023 celebrada el 1 de noviembre, y el primero en estar equipado con el modelo grande de IA de desarrollo propio de vivo: vivo también dijo que el modelo grande de IA de desarrollo propio lanzará capacidades de servicio con una imagen de asistente más inteligente, lo que permitirá a su pequeño asistente V obtener capacidades de servicio inteligente más amplias, brindando así innovación disruptiva en el aprendizaje, la vida, el trabajo y otros escenarios.
En general, casi todos los jugadores de teléfonos móviles convencionales ya están agarrando el campo de batalla principal del gran modelo, y el siguiente paso es luchar con espadas brillantes.
** Modelo grande, ¿cómo aterrizar? **
En el caso de los fabricantes de teléfonos móviles que adoptan modelos grandes, una pregunta real en la que pensar es: ¿cómo deberían aterrizar los modelos grandes?
Al fin y al cabo, desde el principio de su nacimiento, los grandes modelos son inseparables de la gran potencia de cómputo, el big data y los grandes parámetros en la nube; De hecho, el gran modelo nace en la nube, que también es el elemento central en el que los proveedores de nivel gigante, como Huawei, que también han establecido la computación en la nube, pueden tomar la delantera en el diseño de negocios de gran modelo.
Por lo tanto, los fabricantes de teléfonos móviles adoptan modelos grandes y se enfrentan a una paradoja técnica desde el principio: ¿cómo aterrizar?
En la actualidad, Xiaomi y OV han elegido un camino común: el peso ligero.
Por ejemplo, Xiaomi enfatizó que, en comparación con el esquema de modelos grandes en el teléfono móvil lanzado al mercado anteriormente, Xiaomi ajustará la estructura del modelo y el tamaño de los parámetros, se adaptará a las características de varios chips en memoria y potencia de cómputo, y se esforzará por lograr el mejor equilibrio entre consumo de energía, velocidad de inferencia y efecto de generación.
Al mismo tiempo, OPPO y vivo han enfatizado que lanzarán modelos grandes de diferentes magnitudes de parámetros, desde mil millones hasta cientos de miles de millones de especificaciones de modelos con diferentes escalas de parámetros, obviamente, esto también se considera completamente por el costo, el rendimiento, el consumo de energía y otros problemas que traen los diferentes fines de implementación.
Además de la ligereza, los fabricantes de teléfonos móviles que ingresan a modelos grandes también deben considerar cómo materializar el despliegue real de modelos grandes, que es un tema clave que involucra la experiencia del usuario y la privacidad del usuario.
En la actualidad, la "integración dispositivo-nube" debería ser una tendencia relativamente obvia**.
Por ejemplo, aunque Xiaomi enfatiza la implementación local en términos de modelos grandes, y su modelo final de 1.3 mil millones de parámetros de desarrollo propio se ha ejecutado a través del lado del teléfono móvil, pero según Luan Jian, jefe del equipo de modelos grandes del Laboratorio de IA del Comité Técnico de Xiaomi, en el proceso de implementación específico, el teléfono móvil no puede resolver todos los problemas, Xiaomi aún se adherirá al camino de la integración; Sin embargo, si forma parte de las capacidades o de algunas funciones que se pueden resolver en el modelo del lado final, no hay necesidad de subir a la nube.
Enfatizó que si los usuarios necesitan usar información actualizada en tiempo real en el proceso de llamar a modelos grandes, deben combinar algunas capacidades en la nube.
Además de Xiaomi, OPPO también enfatiza la "colaboración dispositivo-nube" en términos de modelos grandes, lo que dice que AndesGPT se basa esencialmente en la "colaboración dispositivo-nube" como idea de diseño de infraestructura para lograr el efecto de operación colaborativa local y en la nube: obviamente, la implementación local y la colaboración en la nube, es difícil de separar por completo.
Por supuesto, en base a la tendencia de "integración dispositivo-nube", en realidad es necesario considerar los problemas de privacidad bajo el modelo grande: en la actualidad, Huawei y Xiaomi otorgan gran importancia a los problemas de privacidad, y las ideas de cada empresa se enfatizan básicamente: el cálculo relacionado con el modelo grande se completa localmente tanto como sea posible, reduciendo la dependencia de la transmisión de información y la nube.
Entonces, la pregunta a la que siempre ha merecido la pena prestar atención viene a ser esta: ¿qué significa un modelo grande para el usuario medio?
A este respecto, un profesional senior de la industria dijo que, de hecho, desde el punto de vista del usuario, puede que no sea tan fuerte en la percepción de la función del modelo grande al principio, pero en el futuro, se puede encontrar que su privacidad está protegida en muchos escenarios, lo cual es un proceso a largo plazo desde el cambio cuantitativo hasta el cambio cualitativo, pero desde la perspectiva de los fabricantes de teléfonos móviles, nadie renunciará a la exploración de modelos grandes, de lo contrario, es probable que se quede atrás en este campo.
Entonces, ¿qué pasa con las manzanas, que siempre están frías?
En la actualidad, la actitud de Tim Cook hacia los grandes modelos en entrevistas públicas es "cautelosa", cree que la tecnología de IA generativa estrechamente relacionada con los grandes modelos tiene un gran potencial en el desarrollo futuro, pero al mismo tiempo debe usarse con cuidado para garantizar que no tenga un impacto negativo en la sociedad humana. Pero, por otro lado, cuando se le preguntó si estaba usando ChatGPT, Cook respondió que lo estaba usando y que estaba "emocionado por él", y que Apple le estaba prestando mucha atención.
Sin embargo, según el conocido sitio web de noticias The Information, Apple ha reunido un sólido equipo de desarrollo de modelos de IA, incluido su vicepresidente senior de aprendizaje automático y estrategia de IA, John Giannandre, y otros. No solo eso, sino que el presupuesto de Apple para grandes modelos de IA ha aumentado a millones de dólares al día. También se informa que Apple casi ha integrado su modelo grande en Siri y ha explorado la posibilidad de ejecutar un modelo de lenguaje grande en el lado del iPhone.
Por lo tanto, todavía vendrá, después de todo, la tendencia general del desarrollo tecnológico es imparable.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
Los fabricantes de teléfonos móviles se están apilando para diseñar modelos grandes, ¿es un truco?
Fuente original: AI Business Review
El 21 de marzo de 2023, en la conferencia anual de tecnología de gran éxito de NVIDIA GTC, el CEO de NVIDIA, Jensen Huang, anunció a toda la industria tecnológica: Con la popularidad del modelo de lenguaje grande ChatGPT en todo el mundo, se ha inventado una nueva plataforma informática y ha comenzado el momento de la IA en el iPhone.
Como resultado, si bien el "momento iPhone de la IA" se ha convertido en una palabra candente en la industria, también indica inadvertidamente que esta ronda de revolución de la IA provocada por grandes modelos de lenguaje (más tarde conocidos como "grandes modelos") está estrechamente relacionada con la industria de los teléfonos inteligentes representada por el iPhone.
En el último año, los participantes de la industria china de teléfonos inteligentes, incluidos Huawei, Xiaomi, OPPO, vivo y Honor, han ingresado sucesivamente al modelo grande con alto perfil, aunque Apple no ha anunciado oficialmente su entrada, también hay muchas noticias en la industria sobre el diseño de Apple de "Apple GPT" y modelos grandes.
Así que la pregunta es: los fabricantes de teléfonos móviles diseñan modelos grandes, ¿es un truco?
**Huawei está un paso por delante, ¿por qué? **
La primera asociación a nivel de aplicación entre los modelos grandes y los teléfonos inteligentes fue en realidad en el lanzamiento del nuevo producto insignia de primavera de Huawei en marzo de 2023.
En esta conferencia, Yu Chengdong, Director Ejecutivo y CEO de Consumer Business de Huawei, lanzó una nueva función de "Búsqueda inteligente" para los usuarios, que se basa en la tecnología multimodal de modelos grandes, se entrena en la nube y luego miniaturiza el modelo en el teléfono móvil, realizando la primera y precisa experiencia de búsqueda de bibliotecas de teléfonos móviles en lenguaje natural de la industria.
En comparación con la galería de fotos tradicional que utiliza etiquetas para la búsqueda de fotos, existen problemas como la baja precisión y la velocidad de respuesta lenta, y la búsqueda inteligente es más "inteligente". Combinado con el modelo multimodal grande, la búsqueda inteligente preentrena cientos de millones de datos gráficos, aumenta la comprensión de la semántica general generalizada, admite la búsqueda en lenguaje natural que incluye múltiples combinaciones de información como color, forma, objeto, comportamiento, tiempo y lugar, y realiza aplicaciones livianas del lado final.
Vale la pena mencionar que en el proceso de los usuarios que utilizan la "búsqueda inteligente", los datos relevantes se procesan en el lado final, lo que protege aún más la privacidad y la seguridad del consumidor.
Entonces, ¿por qué Huawei es capaz de tomar la delantera en el uso de la tecnología multimodal de grandes modelos para potenciar los teléfonos inteligentes?
La respuesta es simple: el diseño es temprano.
De hecho, ya a finales de abril de 2021, en la Conferencia de Desarrolladores de Huawei de HDC.Cloud de 2021, Yu Chengdong, entonces CEO de HUAWEI CLOUD, lanzó un producto de gran éxito, el modelo HUAWEI CLOUD Pangu, que se basa en la formación previa y en un pequeño número de modelos de desarrollo de adaptación y ajuste de la industria, lo que permite a la IA líder en el mundo entrar realmente en miles de industrias**.
Específicamente, el modelo grande de Pangu lanzado esta vez incluye el modelo grande de Pangu NLP, el modelo grande de CV, el modelo grande multimodal y el modelo grande de computación científica. Entre ellos, el modelo grande de Pangu NLP es el primer modelo grande de NLP chino de generación y comprensión de nivel 100 mil millones de la industria, y el modelo grande de Pangu CV es también el modelo grande de visión por computadora más grande de la industria, que admite 3 mil millones de parámetros; El modelo multimodal grande incluye la búsqueda intermodal, la generación de modo extendido y la conversación de gráficos.
En la Conferencia de Desarrolladores de Huawei HDC 2023 a principios de agosto de 2023, Yu Chengdong dijo que en la era de los grandes modelos de IA, los modelos grandes de Pangu ayudarán al ecosistema de Hongmeng.
Específicamente, con la ayuda de Pangu Natural Language Big Model, Pangu Vision Big Model y Pangu Multimodal Big Model, el sistema Harmony 4.0 marcará el comienzo de un nuevo "pequeño arte", que incluye la adquisición de conocimientos, el razonamiento lógico, la planificación de tareas, la expansión de la memoria, la llamada a herramientas y la asistencia a la producción, etc., para promover la transformación interactiva, el cambio de la eficiencia de la productividad y la transformación del servicio personalizado de los terminales inteligentes.
Es decir, en la actualidad, Huawei es un auténtico referente en el proceso de despliegue de grandes modelos para terminales smartphone.
**Xiaomi OV Honor también está en el juego, ¿es confiable? **
Además de Huawei, los fabricantes nacionales de teléfonos móviles como Xiaomi, OPPO, vivo y Honor también están apuntando a modelos grandes.
A finales de junio de este año, en la Conferencia de Comunicaciones Móviles MWC Shanghai 2023, el CEO de Honor, Zhao Ming, dijo que tomará la iniciativa en la introducción de modelos grandes de IA en el lado del dispositivo para crear una IA personal que solo pertenezca a los usuarios. También enfatizó que "el gran modelo rompe muchos de nuestros límites de pensamiento y es la mejor interpretación de la IA que hemos visto hasta ahora".
En comparación con Honor, el despliegue de Xiaomi en el campo de los modelos grandes no está lejos de los usuarios comunes.
En agosto de este año, en el discurso anual de 2023 de Lei Jun, Lei Jun dijo que Xiaomi adopta por completo los modelos grandes y formó un equipo de modelos grandes de IA de Xiaomi en abril de este año: se entiende que el líder del equipo es Luan Jian, el jefe del equipo de modelos grandes del Laboratorio de IA del Comité Técnico de Xiaomi.
En el discurso, Lei Jun dijo que la principal dirección de avance de la tecnología de modelos grandes de Xiaomi es "liviana" y "implementación local", y en la actualidad, el modelo final de 1.300 millones de parámetros de desarrollo propio de Xiaomi se ha ejecutado a través de la demostración en el teléfono móvil, y algunos efectos de escena pueden ser comparables al efecto informático de 6 mil millones de modelos en la nube.
Además, para proteger la privacidad del usuario, Xiaomi también despliega el modelo en el lado final, no es necesario cargar la información en la nube y todos los cálculos se realizan localmente, lo que puede garantizar fundamentalmente que la privacidad del usuario no se filtre. Incluso en el marco de servicio de integración de dispositivos y nubes, la información de privacidad se almacenará en el lado del dispositivo y los cálculos que los involucran se completarán en el lado final tanto como sea posible. Incluso si ocasionalmente se requieren las capacidades de la nube, la información se procesa y encripta.
Desde el punto de vista del resultado, el portador de aterrizaje del modelo grande de Xiaomi es "Xiaoai classmate". Después de la potenciación de los modelos grandes, la forma de interacción humano-computadora de Xiaoai se actualizará para agregar una serie de capacidades de conocimiento general, incluida la comprensión profunda del contexto, la capacidad de traducción, la súper pregunta y respuesta, los resultados generativos y la realización de tareas complejas.
Desde agosto, Xiaomi ha abierto la prueba interna del "Little Love Classmate Big Model", y su aterrizaje está a la vuelta de la esquina.
Fuera de Honor y Xiaomi, las acciones de OPPO y Vivo en términos de grandes modelos no se han quedado atrás.
Específicamente, el 11 de octubre, OPPO anunció que cooperará con MediaTek para construir una solución liviana de implementación del lado final de modelo grande, y mediante el uso de tecnología de cuantificación de 4 bits, logrará un mejor rendimiento lado a lado sin perder precisión, y promoverá conjuntamente el aterrizaje gradual de su modelo de lenguaje grande AndesGPT de desarrollo propio y el modelo grande multimodal en el lado final.
En la actualidad, se ha inaugurado oficialmente la nueva experiencia Xiaobu Assistant 1.0 Beta basada en su modelo andino grande autoentrenado (AndesGPT), y el Xiaobu Assistant actualizado tendrá capacidades de modelo grande de IA.
En general, casi todos los jugadores de teléfonos móviles convencionales ya están agarrando el campo de batalla principal del gran modelo, y el siguiente paso es luchar con espadas brillantes.
** Modelo grande, ¿cómo aterrizar? **
En el caso de los fabricantes de teléfonos móviles que adoptan modelos grandes, una pregunta real en la que pensar es: ¿cómo deberían aterrizar los modelos grandes?
Al fin y al cabo, desde el principio de su nacimiento, los grandes modelos son inseparables de la gran potencia de cómputo, el big data y los grandes parámetros en la nube; De hecho, el gran modelo nace en la nube, que también es el elemento central en el que los proveedores de nivel gigante, como Huawei, que también han establecido la computación en la nube, pueden tomar la delantera en el diseño de negocios de gran modelo.
Por lo tanto, los fabricantes de teléfonos móviles adoptan modelos grandes y se enfrentan a una paradoja técnica desde el principio: ¿cómo aterrizar?
En la actualidad, Xiaomi y OV han elegido un camino común: el peso ligero.
Por ejemplo, Xiaomi enfatizó que, en comparación con el esquema de modelos grandes en el teléfono móvil lanzado al mercado anteriormente, Xiaomi ajustará la estructura del modelo y el tamaño de los parámetros, se adaptará a las características de varios chips en memoria y potencia de cómputo, y se esforzará por lograr el mejor equilibrio entre consumo de energía, velocidad de inferencia y efecto de generación.
Al mismo tiempo, OPPO y vivo han enfatizado que lanzarán modelos grandes de diferentes magnitudes de parámetros, desde mil millones hasta cientos de miles de millones de especificaciones de modelos con diferentes escalas de parámetros, obviamente, esto también se considera completamente por el costo, el rendimiento, el consumo de energía y otros problemas que traen los diferentes fines de implementación.
En la actualidad, la "integración dispositivo-nube" debería ser una tendencia relativamente obvia**.
Por ejemplo, aunque Xiaomi enfatiza la implementación local en términos de modelos grandes, y su modelo final de 1.3 mil millones de parámetros de desarrollo propio se ha ejecutado a través del lado del teléfono móvil, pero según Luan Jian, jefe del equipo de modelos grandes del Laboratorio de IA del Comité Técnico de Xiaomi, en el proceso de implementación específico, el teléfono móvil no puede resolver todos los problemas, Xiaomi aún se adherirá al camino de la integración; Sin embargo, si forma parte de las capacidades o de algunas funciones que se pueden resolver en el modelo del lado final, no hay necesidad de subir a la nube.
Enfatizó que si los usuarios necesitan usar información actualizada en tiempo real en el proceso de llamar a modelos grandes, deben combinar algunas capacidades en la nube.
Además de Xiaomi, OPPO también enfatiza la "colaboración dispositivo-nube" en términos de modelos grandes, lo que dice que AndesGPT se basa esencialmente en la "colaboración dispositivo-nube" como idea de diseño de infraestructura para lograr el efecto de operación colaborativa local y en la nube: obviamente, la implementación local y la colaboración en la nube, es difícil de separar por completo.
Por supuesto, en base a la tendencia de "integración dispositivo-nube", en realidad es necesario considerar los problemas de privacidad bajo el modelo grande: en la actualidad, Huawei y Xiaomi otorgan gran importancia a los problemas de privacidad, y las ideas de cada empresa se enfatizan básicamente: el cálculo relacionado con el modelo grande se completa localmente tanto como sea posible, reduciendo la dependencia de la transmisión de información y la nube.
Entonces, la pregunta a la que siempre ha merecido la pena prestar atención viene a ser esta: ¿qué significa un modelo grande para el usuario medio?
A este respecto, un profesional senior de la industria dijo que, de hecho, desde el punto de vista del usuario, puede que no sea tan fuerte en la percepción de la función del modelo grande al principio, pero en el futuro, se puede encontrar que su privacidad está protegida en muchos escenarios, lo cual es un proceso a largo plazo desde el cambio cuantitativo hasta el cambio cualitativo, pero desde la perspectiva de los fabricantes de teléfonos móviles, nadie renunciará a la exploración de modelos grandes, de lo contrario, es probable que se quede atrás en este campo.
Entonces, ¿qué pasa con las manzanas, que siempre están frías?
En la actualidad, la actitud de Tim Cook hacia los grandes modelos en entrevistas públicas es "cautelosa", cree que la tecnología de IA generativa estrechamente relacionada con los grandes modelos tiene un gran potencial en el desarrollo futuro, pero al mismo tiempo debe usarse con cuidado para garantizar que no tenga un impacto negativo en la sociedad humana. Pero, por otro lado, cuando se le preguntó si estaba usando ChatGPT, Cook respondió que lo estaba usando y que estaba "emocionado por él", y que Apple le estaba prestando mucha atención.
Por lo tanto, todavía vendrá, después de todo, la tendencia general del desarrollo tecnológico es imparable.