De quels types de grands modèles l’industrie a-t-elle besoin ?

Source originale : corps polaire du cerveau

Source de l'image : générée par Unbounded AI

La raison pour laquelle j’ai écrit cet article s’est produite il n’y a pas si longtemps.

Nous avons participé à un forum thématique mêlant grands modèles et industrie. Après l'événement, un représentant de l'organisateur de l'industrie a communiqué avec nous et nous a dit : « Vous avez parlé de grands modèles. Qu'est-ce qu'un grand modèle exactement ? Quelle est la taille d'un grand modèle ? Pourquoi ne pouvons-nous pas utiliser de petits modèles ?

Cette série de questions nous fait une fois de plus prendre conscience que l’offre et la demande intelligentes se situent souvent dans deux systèmes de discours. Vous parlez de Transfomer et d'Agent depuis longtemps, mais vous vous demandez peut-être encore d'où viennent les mots « grand modèle ».

Cet écart est particulièrement grave à l’ère de l’IA. Parce que la technologie de l'IA implique une chaîne plus longue, ceux qui créent des algorithmes, ceux qui créent des nuages, ceux qui fabriquent du matériel, ceux qui créent des solutions informatiques et ceux qui finissent par payer la facture, chacun peut parler de ses propres opinions, et personne n'a l'intention de le faire. pour vraiment comprendre qui que ce soit.

Aujourd’hui, tout le monde parle de grands modèles industriels et de grands modèles industriels. En effet, d'un point de vue technique, il est facile de constater que les grands modèles peuvent apporter d'énormes gains de productivité dans de nombreux secteurs. D'un point de vue technique, les entreprises chinoises sont plus réceptives et ont une plus forte demande d'intelligence. Déplacer les grands modèles vers l'industrie pour parvenir à l'intégration des données et de la réalité est la ligne la plus distinctive de l'IA chinoise et revêt une forte importance macro-stratégique dans le contexte de la Chine numérique.

Mais dans la pratique, cette voie est semée d’embûches et d’incompréhensions.

Après tout, neuf sociétés d’algorithmes d’IA sur dix ne peuvent pas le faire. Avant la nouvelle fenêtre d’opportunité du grand modèle vers B, nous devons d’abord déterminer de quel type de grand modèle l’industrie a besoin ?

Un grand modèle industriel n'est pas un modèle

Le plus grand malentendu lorsque les entreprises d’IA développent des modèles à grande échelle et combinent des industries est qu’elles ne peuvent pas comprendre la relation entre l’offre et la demande.

Il est vrai que la reconnaissance et l'acceptation actuelle des grands modèles par l'industrie sont relativement bonnes, mais les projets intelligents restent un marché d'acheteurs absolus. Les fournisseurs de technologies doivent s’adapter aux besoins, aux capacités, aux antécédents, voire aux compétences en communication et aux habitudes commerciales des utilisateurs finaux.

Cependant, grâce aux entreprises qui créent des modèles d’IA à grande échelle, une grande quantité de talents et de fonds ont afflué dans le domaine d’Internet. La logique de l'offre et de la demande d'Internet est qu'un seul point d'approvisionnement répond à une grande quantité de demande. J'ai une astuce pour apporter de nouvelles idées du monde entier. L’adaptation de grands modèles dans de nombreux secteurs est facile à imaginer. Par exemple, une usine a besoin d’une analyse des ingrédients et une banque a besoin d’une analyse des investissements. Mon grand modèle ne peut-il pas également l’analyser ?

Par conséquent, dans le cadre d'une telle « pensée extérieure », de nombreuses entreprises d'IA sont tombées dans un énorme malentendu : elles pensent que puisque j'ai un grand modèle, des clients de tous les secteurs devraient venir vers moi. Je présente des cas provenant de deux ou trois secteurs, qui devraient être reconnus par d'autres secteurs. Mon grand modèle peut être utilisé partout, c’est pourquoi on l’appelle un grand modèle industriel.

Que ces praticiens de l'IA croient vraiment que les grands modèles sont égaux à la panacée de l'industrie, ou qu'ils se vantent simplement délibérément de cette façon. Du point de vue des clients industriels, cette scène équivaut à un non-sens. Ils penseront que la technologie utilisée dans le secteur financier n'a rien à voir avec nos mines de charbon ? S’il existait une nourriture que les chats, les vaches, les humains ou même les chats pouvaient manger, oseriez-vous la manger ?

**La première chose que l'industrie doit faire avec les grands modèles n'est pas de résumer les industries très différentes dans le mot « industrie » et d'y mettre un terme. Même au sein d'une certaine industrie, les grands modèles ne peuvent résoudre qu'un ou quelques problèmes de l'industrie, et il est impossible pour un seul modèle de « réparer toutes les industries ». **

Quiconque travaille dans l’informatique sait que pour avoir des produits, il faut des services, et que pour comprendre la technologie, il faut comprendre le secteur. Cependant, les entreprises d’IA, en particulier celles qui investissent beaucoup d’argent dans le domaine des grands modèles, manquent généralement de compréhension et de respect pour les différences entre les besoins de l’industrie.

Bien entendu, différentes industries ont également des besoins communs en matière de grands modèles. Par exemple, le dialogue de base, le CV et les capacités multimodales. Mais le plus souvent, chaque secteur a des exigences différentes, des capacités numériques de base et même des exigences de sécurité, des exigences de latence et des exigences d'exploitation et de maintenance. Au stade actuel, il est très difficile de reproduire et de promouvoir un modèle à grande échelle dans un secteur spécifique, et encore moins de couvrir plusieurs, voire des dizaines de secteurs, en une seule fois.

En matière d’intelligence industrielle, la priorité est toujours donnée à l’industrie plutôt qu’à l’intelligence.

Ne pas mentionner la réduction du matériel et de l'ingénierie est une perte de temps

De nombreuses entreprises engagées dans la numérisation et l'intelligence seront surprises par cette chose après avoir examiné l'environnement client : ce que le client a dépensé beaucoup d'argent pour acheter est en fait un logiciel très simple enfermé dans une boîte, puis fabriqué conformément aux normes de l'industrie. exigences. Boutons, interface utilisateur et des trucs comme ça. Beaucoup de ces logiciels sont même reconditionnés à partir de très anciens logiciels open source étrangers et sont techniquement à la traîne depuis longtemps. À l’heure actuelle, ils déploreront qu’il soit si facile de priver les clients de l’industrie de leur argent.

Mais voici la question : si l’on considère ce problème sous un autre angle, comment une entreprise l’utiliserait-elle sans cette couche d’encapsulation ? Est-il nécessaire pour une usine, une mine ou une ferme forestière de recruter et former un grand nombre de talents en cloud computing et en algorithmes d’IA ? Et laisser ces talents numériques guider la production, les opérations et les ventes de l’ensemble de l’entreprise ? Ce n’est évidemment pas fiable.

Par conséquent, un fait quelque peu contre-intuitif est que les utilisateurs industriels ont tendance à se soucier davantage de la « coque » que de la technologie de pointe éblouissante. Cette couche de coque fait référence au matériel et à l'ingénierie, qui encapsule, gère et maintient les capacités techniques conformément aux exigences de l'utilisation finale. Même si l'objet final assemblé peut être difficile à utiliser et ne pas être avancé, pour les utilisateurs industriels, la condition la plus importante de l'intelligence est qu'elle puisse être utilisée et que les employés puissent l'apprendre.

Lorsqu’on parle de grands modèles industriels, nous tombons souvent aujourd’hui dans ce malentendu. Les praticiens ont tendance à accorder trop d’attention au leadership et à l’internationalité de la couche algorithmique, à rivaliser avec l’échelle des paramètres et les enregistrements de tests, et à se concentrer sur le logiciel. Mais ce dont l’industrie a besoin, c’est de grands modèles pour rivaliser avec les systèmes numériques précédents, en termes de coûts d’utilisation et de seuils opérationnels. Cela nécessite un modèle étendu pour prendre en compte l'environnement matériel, l'environnement réseau, les ressources de stockage et de calcul, le système d'exploitation et même l'alimentation électrique, l'humidité et la température de l'environnement de déploiement.

**La deuxième chose que les grands modèles industriels doivent faire est de prendre en compte les problèmes d'adaptation matérielle et d'ingénierie. **

La mise en œuvre du grand modèle dépend de la recherche de la bonne scène. Mais qu'est-ce qu'une scène ? Le dernier endroit qui fonctionne s'appelle la scène.

La grande majorité des entreprises ne sont pas orientées informatique. Même la plupart des entreprises ne peuvent pas envoyer de personnel dédié pour comprendre soigneusement ce qu'est un grand modèle. Cette chose ne peut pas être changée avant longtemps.

La montagne ne viendra pas vous voir, alors vous devez voir la montagne.

Beaucoup de gens comparent un grand modèle à une mine d'or, donc former un grand modèle consiste simplement à creuser la mine d'or. Grâce à des méthodes d'ingénierie et à l'intégration du grand modèle dans l'infrastructure numérique existante de l'industrie, la mine d'or peut être transportée hors de la montagne.

Les experts devront éventuellement se rendre à l'usine

Qu’ils racontent des histoires à leurs clients ou qu’ils communiquent avec le public, de nombreux fabricants d’IA le mentionneront toujours : ne vous inquiétez pas, nous avons des experts et des postdoctorants qui prennent racine dans l’industrie. Je suis allé dans des usines et des terres agricoles et j'y suis resté plusieurs mois.

Si vous êtes un utilisateur potentiel de grands modèles dans l’industrie, écoutez simplement cette histoire. Il est vrai que des experts sont postés dans l’usine, mais cette usine n’est probablement pas la vôtre.

En fait, avoir des experts en IA en première ligne de l’industrie est un moyen efficace de réduire l’écart entre la demande de l’industrie et l’offre des grands modèles. C’est aussi un processus de développement nécessaire à l’intelligence industrielle.

Mais ce processus ne doit être que temporaire et ne peut pas durer longtemps. Imaginez, les grands modèles sont désormais au premier plan, que valent les experts ? Une équipe d’experts est stationnée sur place, quelle entité peut supporter ce coût salarial ?

Les experts que les sociétés d’IA affirment être postés dans l’usine effectuent en réalité des études de cas et des tests. Généralement, ils coopèrent avec les principaux clients du secteur et les fabricants sont prêts à parcourir les modèles à perte pour observer les problèmes spécifiques.

**Les experts peuvent se rendre dans les usines, mais ils ne peuvent certainement pas être postés dans une usine après une autre, année après année. **Il s'agit d'une action standard lorsque les fabricants d'IA entrent dans une industrie, mais elle est souvent comprise comme une action de routine, intentionnellement ou non. Mais si vous devez vraiment compter sur des experts pour se rendre à l'usine pour promouvoir de grands modèles, alors l'IA ne le fera jamais. être mis en œuvre en raison du coût. Personne ne peut se le permettre.

La troisième chose que ** les grands modèles industriels doivent faire est que la technologie ait une réplicabilité à bas seuil au sein de l'industrie et ne puisse pas s'appuyer fortement sur une coopération manuelle personnalisée. **

Il convient de noter en particulier qu'à ce stade, les grandes et moyennes entreprises sont de plus en plus prudentes dans leurs investissements dans l'intelligence et que le coût des essais et des erreurs ne peut pas être trop élevé. Les solutions de mise en œuvre de modèles à grande échelle trop expérimentales et incertaines sont actuellement difficiles à obtenir la reconnaissance des grands clients, sans parler des milliers de petits et moyens clients, et il est impossible de compter sur de lourds investissements manuels pour les promouvoir.

En résumé, la mise en œuvre de modèles industriels à grande échelle présente actuellement trois défis :

  1. Les fabricants d’IA imaginent toujours les grands modèles comme une panacée, mais ce dont l’industrie a besoin, c’est de compréhension et de concentration.

  2. Les fabricants d’IA se concentrent toujours sur l’innovation en matière d’algorithmes, mais ce dont l’industrie a besoin, c’est d’ingénierie et d’opérabilité.

  3. Les fabricants d'IA promeuvent un grand nombre de cas qui s'appuient sur les capacités des talents, mais ce dont l'industrie a besoin, c'est d'un faible coût et d'une réplicabilité.

Le soleil se lève lorsque de grands modèles sont lancés dans l'industrie, mais il faut aussi consciemment déblayer un peu de neige. Lorsque vous revenez à l'interface utilisateur, vous pouvez souvent trouver des réponses à d'autres questions.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Partager
Commentaire
0/400
Aucun commentaire
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)