La commercialisation de grands modèles à usage général est encore précoce et l'IA générative vient de commencer

Source : Titanium Media

Auteur : Qin Conghui

Source de l'image : générée par l'IA illimitée

De la poursuite fanatique au retour au calme, les opinions des gens sur les grands modèles changent tranquillement. D'une part, pour des raisons de conformité, de réglementation et autres, la commercialisation de modèles à grande échelle à usage général prendra du temps ; d'autre part, l'industrie a seulement commencé à investir dans des domaines pilotes tels que la finance et soins médicaux, et l'effet ne peut pas être vu immédiatement.

Ainsi, lorsque la spirale folle s'est peu à peu ralentie, différentes voix ont peu à peu dépeint une véritable image de "grand modèle".

Parmi eux, qu'il s'agisse d'utiliser le "grand modèle général" ou le "grand modèle industriel", chaque entreprise a fait son choix après réflexion ; et avec le concours de modèles à grande échelle, "l'IA générative" est entrée dans le projecteur. Il faut dire que ChatGPT n'est rien de moins qu'un coup de pouce pour que le développement de l'industrie de l'intelligence artificielle entre dans une nouvelle étape, et il remettra l'IA au centre de l'époque.

La bataille entre le modèle général et le modèle industriel

ChatGPT a fait prendre conscience à l'industrie de l'énorme puissance des grands modèles à usage général, ce qui a conduit au spectacle commercial de la "guerre des cent modèles" à l'avenir. D'innombrables investisseurs et entrepreneurs ne pouvaient pas dormir à cause de cela, et les ressources GPU sont devenues "Papier Luoyang cher" pendant un certain temps.

Parmi eux, il y a de nombreuses entreprises technologiques au sommet de l'industrie qui sont obligées d'aller à "Liangshan". Un initié de l'industrie du modèle à grande échelle a un jour révélé à Titanium Media App la situation actuelle de son entreprise : "S'il n'y a pas de modèle à grande échelle, c'est trop gênant de sortir et d'en parler. Faisons-le maintenant, et c'est difficile à expliquer s'il n'y a pas de modèle à grande échelle." Donc, ils ne peuvent que Il peut divulguer au monde extérieur la nouvelle qu'il travaille sur un modèle à grande échelle à usage général, et en même temps accélérer la recherche et le développement progresser en interne.

Cependant, le grand modèle général est après tout une corvée qui prend du temps et demande beaucoup de main-d'œuvre. Il a fallu 6 ans à OpenAI pour itérer GPT1. La formation a commencé il y a des années. Par conséquent, s'il n'y a pas d'accumulation de base dans la technologie et les données d'IA, il est très difficile de réaliser la commercialisation de grands modèles généraux à court terme.

De plus, le grand modèle à usage général a naturellement besoin de données publiques pour la formation, et mettre ses propres données dans le grand modèle à usage général signifie également que les données seront partagées par défaut. Par conséquent, certaines industries ayant des exigences élevées en matière de confidentialité des données sont peu susceptibles d'accéder à de grands modèles à usage général sans préparation.

Dans de telles circonstances, le grand modèle de l'industrie est devenu la "deuxième meilleure solution" de l'industrie en plus du grand modèle général, et peut profiter plus tôt du dividende du grand modèle. Zhou Hongyi, le fondateur de 360 Group, a également déclaré sans ambages : « Les futures opportunités pour les modèles à grande échelle d'intelligence artificielle résident dans le marché incrémental au niveau de l'entreprise, et la « verticalisation » des modèles à grande échelle est la direction du développement. directeur technique d'une grande usine a également déclaré Titanium Media App. "Du point de vue de notre planification de modèles à grande échelle, nous continuerons à itérer le modèle à grande échelle à usage général et continuerons à nous superposer sur cette base pour la formation de modèles à grande échelle verticale de l'industrie."

Il n'y a pas si longtemps, lors de la Conférence mondiale sur l'intelligence artificielle de 2023, Tang Daosheng, vice-président exécutif principal du groupe Tencent et PDG du groupe d'affaires Cloud et Smart Industry, a également déclaré que l'application de modèles à grande échelle des entreprises doit tenir compte de manière globale du professionnalisme de l'industrie. , la sécurité des données, l'itération continue et le coût global.Et d'autres facteurs. Sur la base du modèle de grande industrie, la création de votre propre modèle exclusif peut être une meilleure option pour les entreprises. La raison en est que les grands modèles industriels nécessitent moins de paramètres que les grands modèles à usage général, le coût de la formation et du raisonnement est inférieur et l'optimisation du modèle est plus facile.

Cependant, Titanium Media App a également appris des personnes de l'industrie que, dans certains cas, un grand modèle à usage général n'est pas une condition nécessaire pour un modèle vertical à grande échelle, ce qui signifie qu'une plate-forme de formation de modèles à l'échelle industrielle n'a pas d'utiliser un modèle à grande échelle à usage général comme base. "Si le modèle général à grande échelle défini est celui avec des centaines de milliards de paramètres, alors le modèle général à grande échelle n'est pas une condition nécessaire pour le modèle industriel à grande échelle." modèle de l'industrie à l'échelle dit Titanium Media App. Cependant, il a également déclaré que bien que les grands modèles à usage général ne soient pas une condition nécessaire pour les modèles industriels à grande échelle, diverses technologies sous-jacentes pour la formation de grands modèles à usage général, tels que Transformer, sont également des éléments essentiels pour la formation de modèles industriels à grande échelle. .

Constamment "100 milliards" de paramètres, "sans tenir compte" de la relation avec le grand modèle général, le seuil du grand modèle vertical a encore été abaissé, ce qui offre plus de possibilités pour le développement ultérieur de l'IA générative.

En plus des grands modèles, l'IA générative mérite également l'attention

Chaque fois qu'il s'agit de grands modèles, l'IA générative (Generative Al) ira de pair. Comprenez simplement la relation entre les deux - le grand modèle peut être compris comme le moteur qui réalise l'IA générative, c'est-à-dire que la capacité de l'IA générative est fournie par le modèle d'apprentissage automatique ou le grand modèle, et l'IA générative est plus élevée que le grand modèle, et l'IA générative peut Selon le scénario requis, vous pouvez décider quel grand modèle appeler.ChatGPT est l'une des applications typiques de l'IA générative.

Dès 2020, l'IA générative a été sélectionnée dans le Gartner Emerging Technology Hype Cycle, et en 2022, l'IA générative a été répertoriée comme l'une des principales tendances technologiques stratégiques, et la technologie est entrée dans le pic des attentes gonflées depuis l'étape de déclenchement de l'innovation. Gartner pense que l'IA générative deviendra une technologie polyvalente, avec un impact similaire à celui de la machine à vapeur, de l'électricité et d'Internet. Au fur et à mesure de la mise en œuvre de l'IA générative, le battage médiatique autour du concept s'estompera progressivement et l'impact sur les personnes et les entreprises dans leur travail et leur vie quotidienne augmentera.

Crédit photo @Gartner

Le géant mondial du cloud computing Amazon Cloud Technology met également plus de plume et d'encre sur l'IA générative. Adam Selipsky, PDG d'Amazon Cloud Technology, a déclaré dans une interview exclusive avec Bloomberg, CNBC et d'autres médias : "L'IA générative est très importante dans les chatbots et la recherche . Les avantages de l'application de l'IA générative sont évidents pour tous, mais ce n'est que la pointe de l'iceberg de nombreuses possibilités. À l'avenir, l'IA générative entraînera des changements dans tous les domaines de la vie. " Il considère l'IA générative comme une " percée " changer, et c'est peut-être le sien Le plus grand changement depuis la naissance d'Internet.

"Imaginez, à l'ère où les ordinateurs utilisent des cartes perforées comme interface, seuls quelques scientifiques ont la capacité d'utiliser des ordinateurs ; lorsque les interfaces graphiques et les souris deviennent des interfaces d'interaction homme-ordinateur, tout le monde peut utiliser des ordinateurs", a déclaré Adam Selipsky.

Alors, de quelles manières les changements apportés par l'IA générative se refléteront-ils ?

On peut voir que dans le domaine automobile, certaines entreprises ont utilisé l'IA générative pour synthétiser des données pour la formation à la conduite autonome afin d'accélérer le processus de formation ; dans le domaine de la fabrication, l'IA générative peut aider à analyser une grande quantité de données de télémétrie IoT, effectuer des analyses prédictives maintenance, et réduire les lignes de production. S'appuyant sur l'IA générative, Autodesk a travaillé avec des avionneurs pour terminer avec succès une partie de la conception de la cloison et a introduit une nouvelle conception 45 % plus légère. Si ce mur de vol est appliqué à la flotte mondiale, il permettra d'économiser du carburant équivalent à la consommation de carburant de 93 000 voitures.

Cependant, il convient de souligner que l'IA générative sur laquelle Autodesk s'appuie n'est pas un certain grand modèle, mais un outil de conception basé sur l'IA construit avec un modèle d'apprentissage automatique.

Par conséquent, pour la réalisation de l'IA générative, le grand modèle n'est qu'une option, et l'avenir ne sera pas dominé par un grand modèle. Titanium Media App craint que lorsque la plupart des entreprises envisagent d'accéder à des modèles à grande échelle, elles ne se contentent pas d'entrer directement dans un modèle à grande échelle, mais choisissent d'accéder à plusieurs modèles. Ainsi, parmi ces grands modèles, la coopération entre grands modèles verticaux et grands modèles généraux n'est peut-être pas exclue à l'avenir.

Prenons UFIDA et WPS, deux logiciels nationaux, à titre d'exemple. UFIDA a récemment publié YonGPT, un modèle de service pour grande entreprise. Selon Titanium Media App, la grande base de modèles générale à laquelle YonGPT prévoit d'accéder comprend Zhipu ChatGLM, Wenxinyiyan et Zhiyuan Wudao Tianying, etc. WPS a déjà lancé WPS AI. Selon les dernières nouvelles, la base de modèles générale à grande échelle de WPS AI en Chine continentale est MiniMax, et sa version à l'étranger qui vient d'être lancée est prise en charge par OpenAI et PaLM2.

Dans le monde de l'IA générative, on ne s'appuie pas sur un grand modèle, et ce n'est pas seulement le grand modèle qui détermine le succès de l'IA générative.

Il est indéniable que la mise en place de l'IA générative est aussi le résultat de nombreux aspects, et les défis "secondaires" entourant la mise en place de l'IA générative sont exposés.

** Défi "secondaire" sous IA générative **

"Dites au téléphone portable "Si le chat court sur le canapé, rappelle-moi", puis lorsque le chat court sur le canapé, le téléphone portable recevra un message d'alarme." Fournisseur principal de solutions vidéo Shandong Zhongwei Century Technology Co., Ltd Le vice-président Wang Zhengbin a mentionné le scénario d'application de la détection vidéo intelligente dans la maison intelligente dans un discours.

Mais c'est une scène tellement simple qu'en plus du grand modèle multimodal qui la sous-tend, le réseau et l'informatique en périphérie sont également très importants. "Dans une application d'IA générative comme ChatGPT, si le taux de perte de paquets réseau atteint 1 %, les performances de la grande plate-forme de formation de modèles chuteront à 5 % de ses performances maximales, ce qui signifie que 95 % sont perdus. toute la plate-forme de modèles à grande échelle est un facteur très important », a déclaré Zhang Yu, directeur de la technologie de la division réseau et périphérie d'Intel en Chine et ingénieur principal en IA d'Intel.

Il est prévu qu'avec l'explosion de la demande d'IA, le déploiement de l'intelligence artificielle à la périphérie sera trois fois plus élevé que celui dans la base de données.Cela signifie également que la mise en œuvre de l'IA de pointe est un défi majeur pour la prochaine étape du développement. de l'intelligence artificielle.

"Le coût en temps et en main-d'œuvre du déploiement de l'intelligence artificielle à la périphérie, comme la chaîne de production de l'usine, est encore élevé, et plus de la moitié du déploiement de l'intelligence artificielle de périphérie échoue." Sachin Katti, vice-président senior d'Intel et directeur général d'Intel la division réseau et périphérie, récemment Quand on parlait de l'informatique de pointe à l'ère des grands modèles, a-t-il déclaré. D'une part, la raison en est que l'équipement est obsolète et les ressources informatiques de pointe sont insuffisantes ; d'autre part, comment utiliser leurs propres données uniques pour déployer l'IA est également très critique. De nombreux déploiements d'intelligence artificielle en périphérie seront freinés par ces défis.

Dans le même temps, les meilleures performances de l'IA générative doivent à terme être soutenues par les données.À l'heure actuelle, l'industrie espère assurer la sécurité des données dans l'IA générative d'une part, et d'autre part, elle espère également rendre les données sources abondantes et disponibles.

La résolution de ces problèmes est également en cours. "Le grand système de modèles et le système d'IA d'aujourd'hui dépendent fortement des données et sont des systèmes intelligents basés sur les données. Ce système a des exigences très élevées en matière d'étendue et d'impartialité des données. En supposant que les données sont très biaisées, il est difficile de les soutenir efficacement. . Développement de systèmes d'intelligence artificielle." Wei Tao, vice-président et directeur technique de la sécurité d'Ant Group, a dit un jour, on peut donc voir qu'il existe déjà des outils pour la vérification inverse de la sécurité des données de l'IA.

En termes de développement de sources de données, il n'y a pas si longtemps, le Shenzhen Digital Exchange a rejoint près de 50 unités pour établir l'"Open Computing Alliance", et les co-sponsors incluent Tencent Cloud, Huada Genomics, Yuntian Lifei, Obi Zhongguang et UBTECH, Chine Unicom Guangdong Branch, Huaao Data et d'autres entreprises, Shenzhen Artificial Intelligence Society et d'autres associations, National Supercomputing Shenzhen Center et d'autres groupes de réflexion et instituts de recherche. L'un des principaux objectifs de la création de l'Alliance informatique est de coordonner la formulation de normes pertinentes telles que les éléments de données, la gouvernance des données, les données de formation, l'étiquetage des données et les données synthétiques autour de données de formation chinoises de haute qualité et de données de formation multimodales. , et faciliter les échanges de données pour augmenter leurs nouvelles catégories et nouveaux domaines liés au modèle.

Les défis rencontrés dans le développement de l'IA générative ne peuvent être résumés en mots, et la tempête mondiale d'IA déclenchée par ChatGPT ne s'arrête pas avec ChatGPT. Après l'ouverture du nouveau monde de l'intelligence artificielle, le grand modèle et l'IA générative à ses débuts ont également exposé de nombreux problèmes et soulevé une série de défis, mais en même temps, ils ont offert des opportunités d'exploration et d'innovation à tous les horizons.

L'industrie se précipite vers l'IA générative, ce qui n'est en aucun cas une mauvaise chose pour le développement de l'intelligence artificielle ou même des êtres humains.

Voir l'original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Récompense
  • Commentaire
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)