El modelo grande se pone en el teléfono móvil, abriendo el telón a la IA para cambiar el mundo

2023-11-03 05:37:59

Fuente original: Geek Park

Autor: Jing Yu

Fuente de la imagen: Generado por Unbounded AI

Al abrir la interfaz de la cámara, el presentador toma una foto del paisaje frente a él. En el álbum, busque esta imagen y seleccione la función "Expandir", pero la parte periférica que no se capturó en la foto se ha "expandido" mágicamente a la periferia.

Por otro lado, parece que se usa un teléfono móvil para tomar selfies para los visitantes, y cuando ingresa al área de la cámara frontal, encontrará que el fondo de la imagen de la persona en la imagen se reemplaza en tiempo real, incluso si la persona selfie sigue moviéndose, el fondo virtual no se desgasta y el retraso casi no se siente.

Modificar el fondo del selfie en tiempo real |

Y si miras un poco más de cerca, encontrarás que todos los teléfonos utilizados para la demostración están en modo avión, es decir, todas las complicaciones anteriores se ejecutan en el chip local del teléfono.

Esta es la sala de experiencia de demostración de la Cumbre Qualcomm Snapdragon 2023, y las funciones de IA demostradas por los teléfonos móviles anteriores se basan en la potencia informática del chip procesador Snapdragon 8 Gen 3 (Snapdragon 8 de tercera generación) que acaba de exponerse en la conferencia.

En el momento en que los modelos grandes de IA son populares, Qualcomm lanzó dos nuevos productos en la conferencia de prensa de este año, los chips Snapdragon X Elite y Snapdragon 8 Gen 3, respectivamente, en dispositivos móviles representados por PC y teléfonos inteligentes, realizando el funcionamiento local de decenas de miles de millones de modelos grandes de parámetros, lo que convierte a la capacidad mágica de la IA generativa en una "función integrada" de los dispositivos móviles.

Además de la "IA en la nube", con el rápido desarrollo de los chips, se ha realizado la "IA terminal", y puede haber llegado la era de la "IA híbrida" en la que las dos trabajan juntas.

01 IA, desde el centro de datos hasta los teléfonos móviles y PC

"Acabamos de ver el comienzo de la próxima transformación, y es de gran alcance. **」

El presidente y CEO de Qualcomm, Cristiano Amon, hizo esta predicción de la "IA híbrida" que combina dispositivos y la nube al describir el teléfono móvil desde los teléfonos básicos hasta los teléfonos inteligentes y luego hacia el futuro.

En el Qualcomm Snapdragon Summit, Ammon explicó que ha llegado la era de la "IA terminal" |Geek Park

La IA en la nube, como muchas aplicaciones de conversación de IA generativa en la actualidad, puede que no sea ajena, pero la implementación de la IA terminal tiene altos requisitos de hardware, por lo que los dos nuevos chips en la conferencia de prensa de Qualcomm, Snapdragon X Elite y Snapdragon 8 Gen 3, son particularmente llamativos.

Quizás lo más emocionante del día fue que la CPU Ryon del Snapdragon X Elite no solo superó al orgulloso chip M2 MAX** de Apple y al i9-13980HX de Intel en términos de rendimiento en un solo hilo, sino que también consumió un 70% menos de energía que este último con el mismo rendimiento.

Además, la potente CPU Oryon, la NPU Hexagon y la GPU Adreno, con el apoyo del motor de IA heterogéneo de X Elite, pueden alcanzar una potencia de cálculo total de 75 TOP en tres unidades de procesador.

La súper potencia de cómputo permite que la experiencia de conversación de IA generativa, que anteriormente solo estaba disponible en la nube, se implemente con éxito en el entorno local de la computadora equipada con el chip Snapdragon X Elite, que puede ejecutar grandes modelos de lenguaje con hasta 13 mil millones de parámetros en el lado de la PC, y la velocidad de generación de tokens alcanza los 30 tokens por segundo, que es más rápida que la velocidad de lectura del usuario; Al mismo tiempo, las imágenes generadas con Stable Diffusion son sorprendentemente rápidas en menos de 1 segundo.

La velocidad de la CPU y el consumo de energía de Oryon recientemente lanzados se encuentran entre los mejores del mundo

En el campo, cuando haces clic en el botón de generar con el dedo y la imagen se puede completar en un instante, la experiencia es increíble, porque la gente está acostumbrada desde hace mucho tiempo a esperar a que el diálogo generativo produzca una imagen, de borrosa a clara.

Como chip insignia para teléfonos inteligentes, el Snapdragon 8 Gen 3 no está muy lejos del X Elite, y en términos de IA, no solo puede ejecutar un modelo grande con decenas de miles de millones de parámetros localmente, sino también generar imágenes en tan solo 0,6 segundos.

Solo en el primer trimestre de este año, la demostración de Qualcomm solo pudo ejecutar un modelo grande con 1.000 millones de parámetros localmente, y la velocidad de generación de imágenes se controló a 15 segundos. ¿Qué tipo de "magia" utiliza Qualcomm para hacer que la "IA terminal" dé grandes pasos agigantados?

En el caso del Snapdragon 8 Gen 3, Qualcomm** primero cuantifica un modelo grande como Llama 2, lo comprime utilizando una pila de software de IA y carga el modelo cuantificado en una memoria DDR de ultra alta velocidad**, que puede ingresar el modelo en la NPU Hexagon con un rendimiento ultrarrápido para que funcione.

El motor de IA de Qualcomm está optimizado específicamente para la IA |

Qualcomm ha realizado mejoras significativas en la microarquitectura. Además de actualizar el hardware de inferencia de microcortes, el equipo también agregó pistas de entrega de energía separadas al acelerador tensorial para un rendimiento y una eficiencia energética óptimos. Al mismo tiempo, Qualcomm ha aumentado la velocidad de reloj de los aceleradores escalares y vectoriales y ha duplicado el ancho de banda de la memoria compartida de gran tamaño. Estas mejoras en la NPU de Hexagon la convierten en un acelerador líder para la inferencia de modelos grandes.

Qualcomm también utiliza una técnica de "decodificación especulativa" en conversaciones basadas en voz, que también se utiliza por primera vez en un terminal. Esta tecnología utiliza un algoritmo de "borrador de modelo" que es casi la mitad del tamaño del modelo original, y genera rápidamente 3 tokens especulativos después de realizar una gran cantidad de inferencias en la CPU.

El modelo maestro procesa las 3 etiquetas a la vez y decide cuál aceptar. Un buen modelo de borrador predice el próximo token con una alta tasa de aceptación, duplicando la tasa de generación de tokens mientras se mantiene la precisión. Por último, la voz generada por el asistente de IA es generada por un modelo de IA de texto a voz que se ejecuta en la CPU.

Este es el proceso del motor de IA de Qualcomm, o NPU, combinado con la CPU, la GPU, el Qualcomm Sensor Hub y la memoria ultrarrápida, que trabajan juntos para completar un caso de uso de IA del lado del dispositivo.

Sin embargo, detrás de los complejos pero eficientes casos de aplicación de IA generativa se encuentra la larga acumulación y exploración de Qualcomm en la dirección de la IA del lado del dispositivo.

02 Evolución de la IA terminal

Si hablamos de la evolución del hardware de IA en la nube en el escenario del centro de datos, el símbolo es la tarjeta gráfica de NVIDIA; Luego, el desarrollo de la IA en el lado del dispositivo está marcado por el motor de IA de Qualcomm, por supuesto, la parte más crítica del nivel de hardware es el procesador Snapdragon Hexagon NPU en constante evolución.

En 2007, Qualcomm presentó el primer procesador Hexagon en la plataforma Snapdragon.

En 2015, Qualcomm integró la tecnología de IA en sus procesadores, utilizando la IA para mejorar la computación de imágenes, audio y sensores.

En 2017, Qualcomm presentó el DSP Hexagon 685 en el chip Snapdragon 845, que permite a los teléfonos inteligentes realizar tareas complejas de IA como el reconocimiento de imágenes y el procesamiento de voz con mayor rapidez.

Al año siguiente, en 2018, el Snapdragon 855 actualizó su motor de IA de cuarta generación, agregando aceleradores tensoriales al procesador Hexagon, lo que resultó en un aumento de rendimiento 3 veces en el procesamiento de IA.

En el Snapdragon 865, se introdujo el DSP Hexagon 698, que proporciona más rendimiento y eficiencia de IA. Esta versión hace hincapié en la aceleración de la IA y optimiza la ejecución de modelos de IA para ejecutar aplicaciones de IA más rápido en los teléfonos inteligentes. El DSP Hexagon 780 en el Snapdragon 888 a finales de 2020 ofrece hasta 26TOPS de rendimiento de IA.

Después de más de una década de evolución, las capacidades de IA de la plataforma informática Snapdragon se han multiplicado por 100

Hasta ahora, los chips Snapdragon X Elite y 8 Gen 3 han sido capaces de proporcionar 75 TOPs de potencia de cálculo: si se hace un gráfico de la potencia de procesamiento de IA de los chips de Qualcomm en los últimos siete años, se puede ver que la "curva de IA" ha mostrado una fuerte tendencia alcista, y todavía no se ha detenido.

Además del hardware, los esfuerzos de Qualcomm a nivel de software de IA también son indispensables para mejorar las capacidades de la IA de terminales. La pila de software de IA de Qualcomm integra todos sus productos de software de IA en una solución unificada. Los OEM y los desarrolladores pueden crear, optimizar e implementar aplicaciones de IA basadas en productos de Qualcomm, aprovechando al máximo el rendimiento de Qualcomm AI Engine, lo que permite a los desarrolladores de IA crear modelos de IA una vez e implementarlos en diferentes productos.

En la Cumbre Snapdragon, Qualcomm también presentó modelos de pila de software de IA, un conjunto de modelos que satisfacen las necesidades de los desarrolladores que han sido totalmente optimizados, probados y validados por Qualcomm para admitir las plataformas Snapdragon 8 y Snapdragon X Elite de tercera generación.

El SDK de procesamiento de redes neuronales de Qualcomm y Qualcomm AI Engine Direct están en el corazón de la pila de software de IA de Qualcomm, conectando el chip a todos los principales marcos de IA. Con los modelos administrados TF Lite y ONNX RT, los usuarios también pueden usar Tensorflow y ONNX directamente, lo que brinda a los desarrolladores la libertad de elegir su entorno de trabajo preferido.

Qualcomm está construyendo un ecosistema de IA terminal con muchos gigantes y grandes empresas modelo

Qualcomm se ha asociado con varios gigantes y grandes empresas de modelos, y en el momento del lanzamiento del modelo de pila de software de IA de Qualcomm, ya hay más de 30 modelos grandes compatibles, y el número sigue creciendo, y el modelo de pila de software también aparecerá en la popular plataforma de alojamiento de modelos Hugging Face.

Ahora en su octava generación, el motor de IA de Qualcomm, que consta de múltiples componentes de hardware y software, permite la aceleración de IA del lado del dispositivo en las plataformas Snapdragon y Qualcomm.

Se puede ver queBasándose en el hardware subyacente del chip, Qualcomm está uniendo a un gran número de socios para establecer un ecosistema de "IA terminal".

¿Por qué es tan importante la "IA terminal" y Qualcomm y sus socios no deberían escatimar esfuerzos para invertir en ella?

03 El futuro de la "IA híbrida"

En los navegadores, en las aplicaciones móviles, muchas personas están utilizando aplicaciones de IA generativa, y parece que este tipo de "IA en la nube" ha satisfecho las necesidades de las personas. ¿Cuáles son las ventajas de la IA en el dispositivo sobre la IA en la nube?

La primera es responder de inmediato. En el pasado, los desarrolladores han intentado comprimir el modelo de difusión estable para generar imágenes en una computadora portátil Mac, y los resultados se miden en horas. Sin embargo, si la operación local se realiza en el terminal, en la demo mostrada por Qualcomm, la velocidad de Fast Stable Diffusion para generar imágenes se ha reducido a menos de 1 segundo.

Especialmente en escenarios con requisitos de alta latencia, como humanos virtuales y fondos virtuales en tiempo real, se destaca la inmediatez de la computación local de la IA terminal.

Además, en el caso de redes deficientes, las capacidades de IA del dispositivo local se convierten en la única opción para los usuarios.

El chip Snapdragon 8 de tercera generación puede lograr capacidades de expansión de fotos localmente en el teléfono|Qualcomm

Al mismo tiempo, cuando los datos se ejecutan localmente en el terminal, la seguridad también es más segura que en la nube. Por ejemplo, el Snapdragon X Elite es compatible con la última seguridad de extremo a extremo, protegiendo todos los endpoints de la empresa, desde el chip hasta la nube. La unidad de procesamiento seguro dedicada de Qualcomm es compatible con la arquitectura de seguridad Microsoft Pluton y está diseñada para almacenar datos confidenciales.

Por último, la mejora de las capacidades terminales de IA puede dar a los asistentes de IA la oportunidad de deshacerse del estigma de la "discapacidad intelectual artificial" y convertirse realmente en un asistente inteligente personal cualificado y altamente personalizado. Al igual que la demostración en vivo, con la ayuda de información personal, hábitos de uso y otros datos registrados y almacenados en el lado del terminal, el asistente inteligente puede reservar directamente hoteles y boletos aéreos después de recibir comandos de voz, en lugar de saltar en varias aplicaciones en el teléfono móvil. Todo esto no tiene comparación con la IA en la nube.

Hace unos diez años, Mark Anderson, el fundador de a16z, hizo una vez una predicción de que "el software se tragará el mundo", pero desafortunadamente la realidad fue falsificada; Bajo la ola de IA causada por los grandes modelos, las "aplicaciones devoradoras de IA" se están convirtiendo gradualmente en una realidad.

La IA terminal + la IA en la nube cambiará el paradigma centrado en las aplicaciones de los smartphones|Geek Park

"El poder predictivo de la IA, junto con el hecho de que el terminal está diseñado para usted, hace que el terminal y el sistema operativo, así como la aplicación y la nube, sean inteligentes".

Ammon describe cómo la "IA híbrida" compuesta por IA terminal + IA en la nube cambiará los hábitos de uso de los dispositivos de las personas.

Hasta ahora, el número de terminales que utilizan la plataforma Snapdragon ha alcanzado los 3.000 millones.

Al igual que la CPU Oryon entrará en las diversas líneas de productos de Qualcomm en el futuro, las capacidades de la IA de terminal pronto se transferirán de los PC y los teléfonos móviles a los dispositivos XR y de los coches inteligentes, un futuro en el que la "IA híbrida" es omnipresente.

La IA encontrará su camino en todo tipo de dispositivos

La apertura de la Cumbre de la Boca de Dragón, una ceremonia especial para la gente local de Maui, extraños del extranjero, a través de los instrumentos y llamadas únicas de caracola, muestran su inocencia; La gente local de la isla respondió con un "hechizo" único para confirmar que la otra parte no tenía intenciones maliciosas y era confiable.

Esta conmovedora ceremonia se parece mucho a la convergencia de la "IA terminal" y la "IA en la nube" para llevar el futuro de la "IA híbrida" al mundo.

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

Recompensa
Me gusta
Comentar
Compartir

Comentar

0/400

Sin comentarios

Tema
#Gate & WLFI USD1 Points Program
9k Popularidad
#Show My Alpha Points
69k Popularidad
#ETH Whales Accumulate
16k Popularidad
#SOL Futures Reach New High
23k Popularidad
#ETH ETF Sees 12 Weeks of Inflows
7k Popularidad

Anclado