Après quelques mois de vent de « toutes les applications valent la peine d'être refaites avec un grand modèle », tous les terminaux veulent aussi utiliser le grand modèle pour remodeler leur compétitivité.
Huawei est devenu le premier fabricant de l'industrie de la téléphonie mobile à donner un calendrier précis pour la mise en œuvre de grands modèles. Récemment, avec HarmonyOS 4.0 accédant à la capacité de modèle à grande échelle de Pangu, Xiaoyi, un assistant vocal intégré dans les téléphones mobiles Huawei, est devenu le premier assistant intelligent avec des capacités de modèle à grande échelle d'IA, et sera ouvert pour des tests fin août .
Selon les progrès ci-dessus, la série Huawei Mate 60, qui sortira au second semestre, sera également équipée de capacités de modèle à grande échelle et devrait devenir un argument de vente majeur par rapport à la série iPhone 15 d'Apple. **
** Avant le grand modèle, la puce 5G était autrefois considérée par le monde extérieur comme l'arme secrète de Huawei contre le nouvel iPhone 15. ** Selon des rapports en ligne, le téléphone mobile 5G de Huawei devrait revenir en octobre de cette année. Cependant, par rapport aux capacités attendues des modèles à grande échelle, le moment du lancement des téléphones mobiles 5G de Huawei est toujours confronté à de nombreuses incertitudes.
A l'heure actuelle, Qualcomm et MediaTek ont successivement déclaré qu'ils n'avaient pas encore obtenu l'approbation du gouvernement américain pour vendre des chipsets à Huawei. Même si la nouvelle du retour du téléphone mobile 5G de Huawei se réalise, sa compétitivité n'est pas optimiste, car sa plus grande probabilité sera de coopérer avec le SMIC pour réaliser une alternative de localisation complète, et le prix est que le processus de fabrication de puces ne peut que réaliser un niveau maximum de 7 nm. Comparé aux 3 nm de l'iPhone 15, il a deux époques de retard en termes d'itération technologique.
Par rapport au statu quo des puces 5G rétrogrades, Huawei est en fait en avance sur Apple en termes de grands modèles.
Bien que le PDG d'Apple, Cook, considère également l'iPhone et d'autres matériels comme un support permettant à l'entreprise d'afficher la technologie de l'IA, et reconnaisse l'énorme vague de changements provoquée par l'intelligence artificielle, Apple est assez prudent dans le développement de grands modèles. "Nous allons continuer à intégrer cela dans nos produits de manière très délibérée."
Selon le journaliste technologique de Bloomberg, Mark Gurman, Apple développe discrètement des produits d'IA en interne et a établi son propre cadre de modèle à grande échelle "Ajax", et a essayé de l'appliquer à des fonctions de produits telles que les cartes et Siri. libérer "Apple GPT" pour les consommateurs encore.
**Au cours des dix dernières années, les fabricants nationaux de téléphones mobiles ont mené deux changements de produits majeurs : la vague du plein écran lancée en 2016 a une fois poussé l'iPhone hors du top cinq du marché chinois ; la vague de l'écran pliable lancée en 2019 n'a pas encore ébranlé les bases de l'iPhone. **
**En tant qu'autre nouvelle opportunité de changement de produit, le grand modèle sera-t-il un "moment plein écran" qui favorise la popularisation des fabricants nationaux de téléphones mobiles, ou un "dilemme de l'écran pliant" limité par la niche ? **
** Par rapport aux applications tierces telles que ChatGPT et Wenxin Yiyan qui ont été connectées au téléphone mobile, l'avantage le plus direct des produits modèles à grande échelle intégrés directement dans le système de téléphonie mobile réside dans une protection renforcée de la confidentialité et de la sécurité. **
Comparé à des applications telles que ChatGPT qui traitent les données dans le cloud, le déploiement localisé de terminaux intelligents peut éliminer au maximum les préoccupations des utilisateurs concernant les fuites de confidentialité.
En mars de cette année, ChatGPT a eu un problème de cache en raison d'un bogue dans une bibliothèque open source, ce qui a finalement provoqué la fuite des informations de paiement de centaines de millions d'utilisateurs payants de ChatGPT - les utilisateurs de ChatGPT Plus, y compris les noms, les adresses e-mail et numéros de carte de crédit Quatre chiffres et date d'expiration de la carte de crédit, etc.
Affectée par cela, la Federal Trade Commission des États-Unis a également commencé à enquêter pour savoir si OpenAI avait violé les lois sur la protection des consommateurs en juillet et a demandé à OpenAI de fournir des informations sur son traitement des données personnelles, la possibilité de fournir des informations inexactes aux utilisateurs et "causé un préjudice aux consommateurs". (y compris le risque d'atteinte à la réputation) est bien documenté.
**Avec l'aide du déploiement localisé du terminal de téléphonie mobile pour dissiper les craintes de fuite d'informations, les utilisateurs peuvent se sentir plus à l'aise et fournir audacieusement plus de données personnelles au grand modèle. Cela présente également le deuxième avantage du produit grand modèle intégré au téléphone mobile, à savoir créer un assistant personnel vraiment personnalisé. **
**De plus, les produits grand modèle fournis avec le téléphone mobile ont un environnement d'exploitation plus stable que ChatGPT. **
En avril de cette année, ChatGPT Plus a été suspendu pour paiement, la raison invoquée par OpenAI étant que "la demande est trop importante", entraînant un manque de ressources de puissance de calcul. Avec l'aide d'un déploiement localisé, le grand modèle fourni avec le téléphone mobile réduira considérablement la dépendance aux ressources de cloud computing, afin d'éviter l'apparition d'événements de "temps d'arrêt", et même de fonctionner hors ligne lorsque le réseau est déconnecté.
L'assistant vocal est devenu l'entrée prioritaire pour de nombreux fabricants de téléphones mobiles pour mettre en œuvre des modèles à grande échelle. Grâce à la prise en charge de grandes capacités de modèle, l'assistant vocal peut aider les utilisateurs à générer automatiquement la rédaction, à rédiger automatiquement des e-mails de réponse, à générer automatiquement des résumés d'articles et à traduire automatiquement...
Même avec l'aide de fonctions de plug-in, l'assistant vocal pris en charge par le grand modèle peut également effectuer des appels de fonctions inter-applications, telles que la mobilisation d'applications cartographiques, d'applications de voyage et d'applications météo, etc., pour aider les utilisateurs à faire un plan de voyage ou réserver un restaurant.
Comparé à un lot d'assistants vocaux nés il y a plus de dix ans, le plus grand modèle est comme un catalyseur, menant directement Siri à la version 2.0, et devrait résoudre le problème que les assistants vocaux humains ont été critiqué à plusieurs reprises comme "retard mental artificiel". ". **
Après la sortie de ChatGPT, le PDG de Microsoft, Satya Nadella, s'est un jour plaint : "Que ce soit Cortana, Alexa, Google Assistant ou Siri, ces assistants vocaux sont aussi stupides qu'un rocher."
Selon les médias, les ingénieurs d'Apple espèrent combiner le grand modèle avec Siri, et espèrent également lancer un Siri plus intelligent.
Selon le Dr Ding Lei, un expert en intelligence artificielle, l'une des raisons pour lesquelles la génération précédente d'assistants vocaux n'est pas intelligente est que les systèmes techniques qui les sous-tendent sont différents.
** La version 1.0 de Siri peut être considérée comme une IA décisionnelle. Le travail principal consiste à "étiqueter" les données existantes. ** Pour distinguer les différents types de données, les tâches principales consistent à "juger si c'est le cas" et "distinguer que ce soit ceci ou non. "Ce" travail. Une fois que la demande externe dépasse la bibliothèque de balises existante, l'assistant vocal répondra avec des réponses ascendantes telles que "Je ne peux pas répondre" et "J'apprends encore" pour continuer la conversation.
**La version 2.0 de Siri est une IA générative, qui va "créer" un nouveau contenu après avoir résumé et analysé les données existantes, **réaliser l'effet de "tirer des inférences à partir d'une instance" et prendre en compte les intérêts de l'utilisateur tout en poursuivant le dialogue expérience.
Huawei et Apple ne sont pas les seuls fabricants à enregistrer de grands modèles sur les téléphones portables.
En termes de fabricants nationaux de téléphones mobiles, Xiaomi est celui qui attache le plus d'importance aux grands modèles en plus de Huawei. En avril de cette année, Xiaomi a officiellement créé une équipe de modèles à grande échelle avec une échelle de plus de 30 personnes et a déclaré qu'elle devrait lancer le produit au troisième trimestre de cette année.
Il a été révélé qu'OPPO construit des produits modèles à grande échelle pour les téléphones mobiles basés sur le grand modèle d'Ali. Zhao Ming, PDG de Honor, a également fréquemment déclaré au monde extérieur : « À l'avenir, nous serons les premiers à introduire de grands modèles dans les téléphones mobiles.
Afin d'être le premier à proposer des produits à grande échelle sur les téléphones mobiles, il a été révélé que Samsung envisageait de changer le moteur de recherche par défaut de ses téléphones mobiles de Google à Microsoft Bing.
Afin de restaurer autant que possible l'évasion de Samsung, d'une part, Google a essayé de mettre à niveau le moteur de recherche existant et d'ajouter des capacités de modèle à grande échelle ; d'autre part, il a commencé à intégrer des produits de modèle à grande échelle à partir du bas de le système.
** En mai de cette année, la nouvelle génération de modèle à grande échelle PaLM 2 publiée par Google incluait une solution Gecko au niveau des paramètres minimum. Selon Pichai, PDG de Google, "Gecko" pourra fonctionner sur les téléphones mobiles et la vitesse est assez rapide. **
Au second semestre de cette année, les nouveaux modèles Pixel de Google intégreront la dernière version gecko à grande échelle PaLM2. Le Pixel a toujours été à l'avant-garde des expériences de Google avec de nouvelles fonctionnalités Android. À ce moment-là, que les fabricants nationaux de téléphones mobiles aient ou non la capacité de développer eux-mêmes de grands modèles, ils pourront obtenir directement la puissance magique des grands modèles à partir du système Android de Google. **
Outre les efforts des développeurs de systèmes, les principaux fabricants de puces s'inquiètent également de l'utilisation de grands modèles pour les téléphones mobiles. **
** MediaTek s'attend à ce que le Dimensity 9300 sorti en octobre de cette année prenne en charge le fonctionnement des modèles à grande échelle ; Qualcomm a déclaré qu'il sera en mesure de prendre en charge des modèles d'IA génératifs avec 10 milliards de paramètres à exécuter sur les téléphones mobiles au cours de cette année. **
Selon les dirigeants de Qualcomm, "Un modèle avec un niveau de paramètres de 10 milliards à 15 milliards peut couvrir la plupart des cas d'utilisation de l'IA générative. Si le terminal peut déjà prendre en charge ce niveau de paramètres, alors tous les calculs peuvent être effectués sur le terminal sans cloud .Le téléphone portable deviendra alors un véritable assistant personnel."
En outre, après que Meta a lancé le grand modèle open source Llama 2, Qualcomm a en outre déclaré qu'il coopérerait avec Meta pour lancer une "version mobile de Llama 2" en 2024 pour aider les clients à créer des assistants virtuels intelligents, des applications de productivité, des outils de création de contenu et Utilisez des cas tels que le divertissement.
Comparé à la puissance de calcul des milliers de cartes basées sur le cloud et des serveurs en cluster parallèles, l'avantage du déploiement localisé des smartphones est devenu à son tour un inconvénient qui limite l'expansion de la puissance de calcul.
La plus petite version du modèle Llama open source de Meta a également 7 milliards de paramètres. Avec la configuration actuelle des smartphones, il ne peut pas du tout fonctionner correctement dans la mémoire existante. Il ne peut être exécuté que partiellement dans la mémoire flash du téléphone mobile, mais cela conduit également à une vitesse de réponse lente du grand modèle. .
Auparavant, dans la communauté open source, certains développeurs portaient le grand modèle Llama sur le téléphone mobile, mais le processus d'attente d'un retour prenait jusqu'à dix minutes ou plus.
** Afin d'améliorer l'efficacité de la rétroaction, en plus de renforcer les configurations matérielles telles que les puces et la mémoire, le développeur a commencé à réaliser un plan d'amincissement pour le grand modèle sur le téléphone mobile, comprenant, mais sans s'y limiter, l'élagage, la quantification, distillation, etc. Sous le principe de réduire fortement la précision, réduire les ressources et la consommation d'énergie requises par le grand modèle sur le téléphone mobile : **L'élagage, c'est-à-dire la suppression des paramètres du modèle qui ont peu d'impact sur la précision ; la quantification, en utilisant des types de données de moindre précision pour le raisonnement ; la distillation consiste à extraire un modèle similaire mais plus simple à partir d'un modèle complexe.
Cependant, dans le cas du GPT-4 avec des billions de paramètres toujours incapables de résoudre le non-sens du grand modèle, comment réduire la génération de faux contenus pour le grand modèle sur le téléphone mobile qui réduit activement la précision après la réduction des effectifs, et le nombre de paramètres est seulement 1% de GPT-4.Pour mettre un point d'interrogation.
Le Dr Ding Lei a déclaré que pour les produits modèles à grande échelle tels que ChatGPT, il existe encore de nombreuses erreurs et une logique peu claire dans le contenu généré, et certains scénarios ne peuvent pas être directement appliqués au niveau de l'exécution. **
Si le grand modèle côté téléphone mobile aide les utilisateurs à planifier leurs déplacements ou à réserver des informations sur les restaurants, les erreurs fréquentes affecteront inévitablement directement la fréquence d'utilisation de l'utilisateur. À cet égard, ChatGPT est déjà une leçon pour le passé.
Après six mois de croissance continue, les données de surveillance du site Web tiers SimilarWeb montrent qu'en juin de cette année, le trafic mondial du site Web et des clients mobiles de ChatGPT a diminué de 9,7 % d'un mois sur l'autre. C'est la première fois que ChatGPT a a connu une croissance négative du trafic depuis sa sortie le 30 novembre 2022.
De l'avis de l'ancien scientifique d'OpenAI Kenneth Stanley, les produits modèles à grande échelle actuels n'ont pas encore évolué au moment de l'iPhone. "L'IA générative a définitivement pris d'assaut le monde, et il est vrai que certaines personnes l'utilisent tous les jours, mais je pense que nous sommes encore dans la phase exploratoire pour déterminer comment nous pouvons l'utiliser individuellement. Si nous trouvons tous une solution vraiment forte raison de l'utiliser à tout moment, et cela devrait être le moment de l'iPhone."
Les références:
"Le grand modèle va au terminal, quid de la puce ?" 》Observation de l'industrie des semi-conducteurs
"Le grand plan d'IA de Google : réduire la taille du grand modèle et intégrer chaque produit" LatePost
"Entretien avec le responsable de Qualcomm AI : il devrait prendre en charge des modèles à grande échelle avec des dizaines de milliards de paramètres pour fonctionner sur les téléphones mobiles d'ici cette année" The Paper
"Gros modèle "downsizing" dans le téléphone portable, le prochain iPhone arrive ?" 》L'explosion du métaverse
"Dialogue avec les scientifiques d'OpenAI : l'heure de l'iPhone n'est pas encore venue" Observateur Economique
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Dans la bataille des grands modèles, Huawei devance provisoirement Apple
Source originale : Box Rice Finance
Auteur : Zhao Jinjie
Après quelques mois de vent de « toutes les applications valent la peine d'être refaites avec un grand modèle », tous les terminaux veulent aussi utiliser le grand modèle pour remodeler leur compétitivité.
Huawei est devenu le premier fabricant de l'industrie de la téléphonie mobile à donner un calendrier précis pour la mise en œuvre de grands modèles. Récemment, avec HarmonyOS 4.0 accédant à la capacité de modèle à grande échelle de Pangu, Xiaoyi, un assistant vocal intégré dans les téléphones mobiles Huawei, est devenu le premier assistant intelligent avec des capacités de modèle à grande échelle d'IA, et sera ouvert pour des tests fin août .
Selon les progrès ci-dessus, la série Huawei Mate 60, qui sortira au second semestre, sera également équipée de capacités de modèle à grande échelle et devrait devenir un argument de vente majeur par rapport à la série iPhone 15 d'Apple. **
** Avant le grand modèle, la puce 5G était autrefois considérée par le monde extérieur comme l'arme secrète de Huawei contre le nouvel iPhone 15. ** Selon des rapports en ligne, le téléphone mobile 5G de Huawei devrait revenir en octobre de cette année. Cependant, par rapport aux capacités attendues des modèles à grande échelle, le moment du lancement des téléphones mobiles 5G de Huawei est toujours confronté à de nombreuses incertitudes.
A l'heure actuelle, Qualcomm et MediaTek ont successivement déclaré qu'ils n'avaient pas encore obtenu l'approbation du gouvernement américain pour vendre des chipsets à Huawei. Même si la nouvelle du retour du téléphone mobile 5G de Huawei se réalise, sa compétitivité n'est pas optimiste, car sa plus grande probabilité sera de coopérer avec le SMIC pour réaliser une alternative de localisation complète, et le prix est que le processus de fabrication de puces ne peut que réaliser un niveau maximum de 7 nm. Comparé aux 3 nm de l'iPhone 15, il a deux époques de retard en termes d'itération technologique.
Par rapport au statu quo des puces 5G rétrogrades, Huawei est en fait en avance sur Apple en termes de grands modèles.
Bien que le PDG d'Apple, Cook, considère également l'iPhone et d'autres matériels comme un support permettant à l'entreprise d'afficher la technologie de l'IA, et reconnaisse l'énorme vague de changements provoquée par l'intelligence artificielle, Apple est assez prudent dans le développement de grands modèles. "Nous allons continuer à intégrer cela dans nos produits de manière très délibérée."
Selon le journaliste technologique de Bloomberg, Mark Gurman, Apple développe discrètement des produits d'IA en interne et a établi son propre cadre de modèle à grande échelle "Ajax", et a essayé de l'appliquer à des fonctions de produits telles que les cartes et Siri. libérer "Apple GPT" pour les consommateurs encore.
**Au cours des dix dernières années, les fabricants nationaux de téléphones mobiles ont mené deux changements de produits majeurs : la vague du plein écran lancée en 2016 a une fois poussé l'iPhone hors du top cinq du marché chinois ; la vague de l'écran pliable lancée en 2019 n'a pas encore ébranlé les bases de l'iPhone. **
**En tant qu'autre nouvelle opportunité de changement de produit, le grand modèle sera-t-il un "moment plein écran" qui favorise la popularisation des fabricants nationaux de téléphones mobiles, ou un "dilemme de l'écran pliant" limité par la niche ? **
** Par rapport aux applications tierces telles que ChatGPT et Wenxin Yiyan qui ont été connectées au téléphone mobile, l'avantage le plus direct des produits modèles à grande échelle intégrés directement dans le système de téléphonie mobile réside dans une protection renforcée de la confidentialité et de la sécurité. **
Comparé à des applications telles que ChatGPT qui traitent les données dans le cloud, le déploiement localisé de terminaux intelligents peut éliminer au maximum les préoccupations des utilisateurs concernant les fuites de confidentialité.
En mars de cette année, ChatGPT a eu un problème de cache en raison d'un bogue dans une bibliothèque open source, ce qui a finalement provoqué la fuite des informations de paiement de centaines de millions d'utilisateurs payants de ChatGPT - les utilisateurs de ChatGPT Plus, y compris les noms, les adresses e-mail et numéros de carte de crédit Quatre chiffres et date d'expiration de la carte de crédit, etc.
Affectée par cela, la Federal Trade Commission des États-Unis a également commencé à enquêter pour savoir si OpenAI avait violé les lois sur la protection des consommateurs en juillet et a demandé à OpenAI de fournir des informations sur son traitement des données personnelles, la possibilité de fournir des informations inexactes aux utilisateurs et "causé un préjudice aux consommateurs". (y compris le risque d'atteinte à la réputation) est bien documenté.
**Avec l'aide du déploiement localisé du terminal de téléphonie mobile pour dissiper les craintes de fuite d'informations, les utilisateurs peuvent se sentir plus à l'aise et fournir audacieusement plus de données personnelles au grand modèle. Cela présente également le deuxième avantage du produit grand modèle intégré au téléphone mobile, à savoir créer un assistant personnel vraiment personnalisé. **
**De plus, les produits grand modèle fournis avec le téléphone mobile ont un environnement d'exploitation plus stable que ChatGPT. **
En avril de cette année, ChatGPT Plus a été suspendu pour paiement, la raison invoquée par OpenAI étant que "la demande est trop importante", entraînant un manque de ressources de puissance de calcul. Avec l'aide d'un déploiement localisé, le grand modèle fourni avec le téléphone mobile réduira considérablement la dépendance aux ressources de cloud computing, afin d'éviter l'apparition d'événements de "temps d'arrêt", et même de fonctionner hors ligne lorsque le réseau est déconnecté.
L'assistant vocal est devenu l'entrée prioritaire pour de nombreux fabricants de téléphones mobiles pour mettre en œuvre des modèles à grande échelle. Grâce à la prise en charge de grandes capacités de modèle, l'assistant vocal peut aider les utilisateurs à générer automatiquement la rédaction, à rédiger automatiquement des e-mails de réponse, à générer automatiquement des résumés d'articles et à traduire automatiquement...
Même avec l'aide de fonctions de plug-in, l'assistant vocal pris en charge par le grand modèle peut également effectuer des appels de fonctions inter-applications, telles que la mobilisation d'applications cartographiques, d'applications de voyage et d'applications météo, etc., pour aider les utilisateurs à faire un plan de voyage ou réserver un restaurant.
Comparé à un lot d'assistants vocaux nés il y a plus de dix ans, le plus grand modèle est comme un catalyseur, menant directement Siri à la version 2.0, et devrait résoudre le problème que les assistants vocaux humains ont été critiqué à plusieurs reprises comme "retard mental artificiel". ". **
Après la sortie de ChatGPT, le PDG de Microsoft, Satya Nadella, s'est un jour plaint : "Que ce soit Cortana, Alexa, Google Assistant ou Siri, ces assistants vocaux sont aussi stupides qu'un rocher."
Selon les médias, les ingénieurs d'Apple espèrent combiner le grand modèle avec Siri, et espèrent également lancer un Siri plus intelligent.
Selon le Dr Ding Lei, un expert en intelligence artificielle, l'une des raisons pour lesquelles la génération précédente d'assistants vocaux n'est pas intelligente est que les systèmes techniques qui les sous-tendent sont différents.
** La version 1.0 de Siri peut être considérée comme une IA décisionnelle. Le travail principal consiste à "étiqueter" les données existantes. ** Pour distinguer les différents types de données, les tâches principales consistent à "juger si c'est le cas" et "distinguer que ce soit ceci ou non. "Ce" travail. Une fois que la demande externe dépasse la bibliothèque de balises existante, l'assistant vocal répondra avec des réponses ascendantes telles que "Je ne peux pas répondre" et "J'apprends encore" pour continuer la conversation.
**La version 2.0 de Siri est une IA générative, qui va "créer" un nouveau contenu après avoir résumé et analysé les données existantes, **réaliser l'effet de "tirer des inférences à partir d'une instance" et prendre en compte les intérêts de l'utilisateur tout en poursuivant le dialogue expérience.
Huawei et Apple ne sont pas les seuls fabricants à enregistrer de grands modèles sur les téléphones portables.
En termes de fabricants nationaux de téléphones mobiles, Xiaomi est celui qui attache le plus d'importance aux grands modèles en plus de Huawei. En avril de cette année, Xiaomi a officiellement créé une équipe de modèles à grande échelle avec une échelle de plus de 30 personnes et a déclaré qu'elle devrait lancer le produit au troisième trimestre de cette année.
Il a été révélé qu'OPPO construit des produits modèles à grande échelle pour les téléphones mobiles basés sur le grand modèle d'Ali. Zhao Ming, PDG de Honor, a également fréquemment déclaré au monde extérieur : « À l'avenir, nous serons les premiers à introduire de grands modèles dans les téléphones mobiles.
Afin d'être le premier à proposer des produits à grande échelle sur les téléphones mobiles, il a été révélé que Samsung envisageait de changer le moteur de recherche par défaut de ses téléphones mobiles de Google à Microsoft Bing.
Afin de restaurer autant que possible l'évasion de Samsung, d'une part, Google a essayé de mettre à niveau le moteur de recherche existant et d'ajouter des capacités de modèle à grande échelle ; d'autre part, il a commencé à intégrer des produits de modèle à grande échelle à partir du bas de le système.
** En mai de cette année, la nouvelle génération de modèle à grande échelle PaLM 2 publiée par Google incluait une solution Gecko au niveau des paramètres minimum. Selon Pichai, PDG de Google, "Gecko" pourra fonctionner sur les téléphones mobiles et la vitesse est assez rapide. **
Au second semestre de cette année, les nouveaux modèles Pixel de Google intégreront la dernière version gecko à grande échelle PaLM2. Le Pixel a toujours été à l'avant-garde des expériences de Google avec de nouvelles fonctionnalités Android. À ce moment-là, que les fabricants nationaux de téléphones mobiles aient ou non la capacité de développer eux-mêmes de grands modèles, ils pourront obtenir directement la puissance magique des grands modèles à partir du système Android de Google. **
Outre les efforts des développeurs de systèmes, les principaux fabricants de puces s'inquiètent également de l'utilisation de grands modèles pour les téléphones mobiles. **
** MediaTek s'attend à ce que le Dimensity 9300 sorti en octobre de cette année prenne en charge le fonctionnement des modèles à grande échelle ; Qualcomm a déclaré qu'il sera en mesure de prendre en charge des modèles d'IA génératifs avec 10 milliards de paramètres à exécuter sur les téléphones mobiles au cours de cette année. **
Selon les dirigeants de Qualcomm, "Un modèle avec un niveau de paramètres de 10 milliards à 15 milliards peut couvrir la plupart des cas d'utilisation de l'IA générative. Si le terminal peut déjà prendre en charge ce niveau de paramètres, alors tous les calculs peuvent être effectués sur le terminal sans cloud .Le téléphone portable deviendra alors un véritable assistant personnel."
En outre, après que Meta a lancé le grand modèle open source Llama 2, Qualcomm a en outre déclaré qu'il coopérerait avec Meta pour lancer une "version mobile de Llama 2" en 2024 pour aider les clients à créer des assistants virtuels intelligents, des applications de productivité, des outils de création de contenu et Utilisez des cas tels que le divertissement.
Comparé à la puissance de calcul des milliers de cartes basées sur le cloud et des serveurs en cluster parallèles, l'avantage du déploiement localisé des smartphones est devenu à son tour un inconvénient qui limite l'expansion de la puissance de calcul.
La plus petite version du modèle Llama open source de Meta a également 7 milliards de paramètres. Avec la configuration actuelle des smartphones, il ne peut pas du tout fonctionner correctement dans la mémoire existante. Il ne peut être exécuté que partiellement dans la mémoire flash du téléphone mobile, mais cela conduit également à une vitesse de réponse lente du grand modèle. .
** Afin d'améliorer l'efficacité de la rétroaction, en plus de renforcer les configurations matérielles telles que les puces et la mémoire, le développeur a commencé à réaliser un plan d'amincissement pour le grand modèle sur le téléphone mobile, comprenant, mais sans s'y limiter, l'élagage, la quantification, distillation, etc. Sous le principe de réduire fortement la précision, réduire les ressources et la consommation d'énergie requises par le grand modèle sur le téléphone mobile : **L'élagage, c'est-à-dire la suppression des paramètres du modèle qui ont peu d'impact sur la précision ; la quantification, en utilisant des types de données de moindre précision pour le raisonnement ; la distillation consiste à extraire un modèle similaire mais plus simple à partir d'un modèle complexe.
Cependant, dans le cas du GPT-4 avec des billions de paramètres toujours incapables de résoudre le non-sens du grand modèle, comment réduire la génération de faux contenus pour le grand modèle sur le téléphone mobile qui réduit activement la précision après la réduction des effectifs, et le nombre de paramètres est seulement 1% de GPT-4.Pour mettre un point d'interrogation.
Le Dr Ding Lei a déclaré que pour les produits modèles à grande échelle tels que ChatGPT, il existe encore de nombreuses erreurs et une logique peu claire dans le contenu généré, et certains scénarios ne peuvent pas être directement appliqués au niveau de l'exécution. **
Si le grand modèle côté téléphone mobile aide les utilisateurs à planifier leurs déplacements ou à réserver des informations sur les restaurants, les erreurs fréquentes affecteront inévitablement directement la fréquence d'utilisation de l'utilisateur. À cet égard, ChatGPT est déjà une leçon pour le passé.
Après six mois de croissance continue, les données de surveillance du site Web tiers SimilarWeb montrent qu'en juin de cette année, le trafic mondial du site Web et des clients mobiles de ChatGPT a diminué de 9,7 % d'un mois sur l'autre. C'est la première fois que ChatGPT a a connu une croissance négative du trafic depuis sa sortie le 30 novembre 2022.
De l'avis de l'ancien scientifique d'OpenAI Kenneth Stanley, les produits modèles à grande échelle actuels n'ont pas encore évolué au moment de l'iPhone. "L'IA générative a définitivement pris d'assaut le monde, et il est vrai que certaines personnes l'utilisent tous les jours, mais je pense que nous sommes encore dans la phase exploratoire pour déterminer comment nous pouvons l'utiliser individuellement. Si nous trouvons tous une solution vraiment forte raison de l'utiliser à tout moment, et cela devrait être le moment de l'iPhone."
Les références:
"Le grand modèle va au terminal, quid de la puce ?" 》Observation de l'industrie des semi-conducteurs
"Le grand plan d'IA de Google : réduire la taille du grand modèle et intégrer chaque produit" LatePost
"Entretien avec le responsable de Qualcomm AI : il devrait prendre en charge des modèles à grande échelle avec des dizaines de milliards de paramètres pour fonctionner sur les téléphones mobiles d'ici cette année" The Paper
"Gros modèle "downsizing" dans le téléphone portable, le prochain iPhone arrive ?" 》L'explosion du métaverse
"Dialogue avec les scientifiques d'OpenAI : l'heure de l'iPhone n'est pas encore venue" Observateur Economique