Désenchantement AI: modèle d'une demi-année, vole toujours dans le ciel

2023-08-04 06:52:59

Source : « Photon Planet » (ID : TMTweb), auteur : Wu Kunyan, éditeur : Wu Xianzhi

Source de l'image : générée par l'IA illimitée

Le feu du grand modèle brûle sur cette terre depuis six mois. Alors que les conférences de presse de Huawei, JD.com et Ctrip rattrapent les épisodes du soir, selon le paradigme cohérent d'Internet, la "nouveauté" des modèles domestiques à grande échelle a également inauguré son propre test semestriel.

C'est juste différent des examens semestriels d'autres entreprises. Les examens semestriels de formes commerciales telles que les véhicules à énergies nouvelles, les téléphones mobiles et les plates-formes de commerce électronique sont étayés par suffisamment d'informations de données publiques pour faciliter l'analyse textuelle. boîte noire ", il n'y a pas de modèle commercial clair, de sorte que les soi-disant informations sur les données et autres arguments sont hors de question.

Il est assez ironique que même du point de vue de la fonction du produit, le grand modèle n'ait pas encore produit une méthode d'évaluation générale. Face à l'objectif ultime de l'AGI, il existe naturellement diverses méthodes d'évaluation, telles que la "méthode classique du poisson mandarin écureuil" sur laquelle les utilisateurs finaux C nationaux s'appuient pour "évaluer" les grands modèles.

Ou à cause de cela, la plupart des fabricants nationaux ne parviennent pas à ouvrir leurs propres grands modèles à utiliser comme OpenAI, mais mettent en œuvre des mécanismes de test internes.

L'exploration de modèles à grande échelle est davantage axée sur les côtés B et G, tels que les modèles à grande échelle de Tencent, leaders de l'industrie, Pangu 3.0 de Huawei, Jingdong Lingxi, etc. En tant que piste actuelle sur laquelle les meilleurs joueurs se concentrent, son grand modèle se concentre sur la présentation autant que possible de formes de produits matures, avec la commercialisation comme objectif fondamental. Par exemple, afin de vulgariser et de promouvoir rapidement la commercialisation de ce type de grand modèle, outre l'orientation business landing, les capacités de déploiement localisé sont également devenues des indicateurs de référence importants.

Même ainsi, aux yeux des initiés de l'industrie, le modèle industriel à grande échelle qui "livre le bol au front" manque encore d'entreprises qui l'achètent. Le vent du modèle industriel souffle depuis un mois depuis juin, et il y a pas de coopération commerciale à grande échelle jusqu'à présent.

Par conséquent, il n'est pas difficile de voir que dans le marché de l'investissement d'aujourd'hui, les investissements liés aux grands modèles sont concentrés sur le marché secondaire plutôt que sur le marché primaire. Même si le niveau de grosse vache de Wang Huiwen entre sur le marché, des sources publiques affirment que son financement de tour A est bien supérieur à 230 millions de dollars américains, et sa capacité de financement n'est pas la même que celle d'OpenAI, qui reçoit des dizaines de milliards de dollars de Microsoft de temps à autre.

Le marché de l'investissement est un baromètre qualifié. De toute évidence, les feuilles de réponses soumises par les modèles nationaux à grande échelle lors du nœud semestriel de la période des examens ne sont pas satisfaisantes, et il faudra une période de dormance et de polissage pour que «l'histoire» devienne réalité.

Grand modèle sans business model ?

Lorsque des modèles nationaux à grande échelle doivent répondre aux doutes du marché, les modèles commerciaux doivent être placés en premier lieu.

ChatGPT, qui occupait déjà la première place dans l'esprit des utilisateurs, a connu une baisse de popularité significative. Baidu et Ali, les premiers grands modèles à usage général sortis sur le marché national, sont également tombés dans le "silence" après qu'un grand nombre de joueurs aient suivi en haut. La raison en est que le modèle commercial du grand modèle général n'a pas fonctionné. Même si elle a gagné l'adhésion des utilisateurs dans le champ de l'opinion publique, la boucle fermée commerciale n'est jamais apparue.

Prenant comme exemple le modèle à grande échelle de Baidu avec une large gamme de tests, le modèle de paiement de son application commerciale Wenxin Qianfan est basé sur le nombre de jetons générés par l'appel, la norme est de 0,012 yuan pour mille jetons et il en coûte 0,12 yuan produire un manuscrit de mille caractères.

Indépendamment de la vitesse de son coût de récupération, les frais de 0,012 yuan/millier de jetons semblent bon marché, mais la génération de texte nécessite souvent de multiples interactions pour obtenir les résultats souhaités. De multiples interactions augmenteront infiniment le coût caché. Après tout, Wenxin Qianfan n'est pas le genre de personnel qui va et vient.

Un scénario similaire est la communauté des questions-réponses. Sun Quan (pseudonyme), un universitaire, a déclaré à Photon Planet que l'expérience de l'utilisation d'applications modèles est similaire à la recherche de réponses de haute qualité dans la communauté des questions-réponses. la réflexion de l'utilisateur est la granularité de la question, et la volonté de payer ne se trouve souvent que dans des réponses de haute qualité. Des RÉPONSES DE QUALITÉ seront produites après. Par conséquent, Baidu a choisi le nombre de textes d'inférence comme norme de paiement, mais il n'est toujours pas en mesure de couvrir les coûts cachés d'une utilisation commerciale.

Si vous adoptez le paiement mensuel que la face B aime voir, cela ne fera que déplacer les dépenses des utilisateurs vers vous-même, ce qui n'est évidemment pas une solution à long terme. La meilleure preuve est que ChatGPT est toujours soupçonné de faire des économies sous le prix de 20 $ par mois pour les utilisateurs finaux C.

À l'heure actuelle, la commercialisation de grands modèles à usage général a du mal à atteindre un équilibre de rentabilité, que ce soit du côté B ou du côté C. Dans le même temps, elle est susceptible de rencontrer des risques de conformité tels que l'éthique de l'IA. et surveillance. Par conséquent, l'industrialisation et la verticalisation des grands modèles sont devenues un changement de paradigme sous la demande d'atterrissage.

Contrairement au modèle industriel à grande échelle, bien que sa forme de produit commence par la demande de débarquement, les problèmes qui se posent lors du débarquement proprement dit doivent encore être résolus.

Un type de cas qui mérite d'être mentionné est le modèle vertical vers C construit sur la base de sa propre écologie de produit, comme Zhihaitu AI, que Zhihu a annoncé plus tôt pour effectuer des tests internes dans le produit, et Ctrip.com, qui a été publié peu de temps il y a.

Les avantages des deux entrant dans la voie du modèle à grande échelle sont les mêmes, qui résident dans leur propre écologie communautaire et le contenu communautaire de haute qualité qui en découle. Le contenu, comme les données de l'industrie, peut devenir le corpus d'entraînement de grands modèles après un simple nettoyage. La différence subtile entre les deux est que Zhihu est une communauté de contenu depuis le début, tandis que Ctrip n'a commencé à se concentrer sur le contenu que ces dernières années.

Mais du point de vue actuel, qu'il s'agisse de Zhihu ou de Ctrip, la forme produit de son grand modèle ne semble pas être en mesure de répondre aux points douloureux des utilisateurs, ni d'améliorer suffisamment les fonctions existantes.

Le produit actuellement annoncé de Zhihaitu AI "Hot List Summary" utilise l'IA pour capturer des questions et réponses de haute qualité et peaufiner et réécrire le résumé à présenter aux utilisateurs, tandis qu'une autre application "Search Aggregation" regroupe les opinions à partir des réponses automatiques pour améliorer les informations d'acquisition des utilisateurs et efficacité dans la prise de décisions.

Les fonctions d'agrégation telles que l'auto-recommandation et la liste chaude sont les "compétences artistiques traditionnelles" de Zhihu, et la performance de l'autonomisation des grands modèles n'a pas provoqué d'éclaboussement au niveau de l'utilisateur. De plus, le processus de réécriture et de polissage de l'IA couvre également les fonctionnalités personnalisées des réponses populaires.Pour les utilisateurs, la fonction de cette application est uniquement de comprendre rapidement les informations, ce qui va à l'encontre de la communication différenciée et personnalisée prônée par la communauté des contenus.

Sur la base d'OTA, Ctrip a demandé, de l'avis de Liang Jianzhang, président du conseil d'administration de Ctrip, qu'il s'agisse d'une "bibliothèque de réponses fiables" pour l'industrie du tourisme. Il lui faudra du temps pour tester l'efficacité de ses produits, mais du point de vue du positionnement, il est aussi soupçonné de "sacrifier l'essentiel et de courir après le dernier".

Aux yeux des jeunes usagers, il n'y a pas de réponse standard au tourisme, l'émergence de formes de tourisme diversifiées telles que les "forces spéciales", le "coup de poing" et l'"immersion" le prouve. Par exemple, en supposant qu'un grand nombre d'utilisateurs utilisent l'IA pour formuler la planification d'itinéraire de voyage, la même planification d'itinéraire affectera en fait la communication et l'atmosphère de la communauté, et entraînera même une diminution du temps de séjour des utilisateurs.

D'une manière générale, la tentative d'atterrissage du modèle vertical à l'extrémité C n'est pas fluide et peut même devenir un "coût irrécupérable". Peut-être affecté par le mythe de "l'amélioration de l'efficacité" du grand modèle lui-même, le positionnement du produit se limite principalement au mot "efficacité", mais l'efficacité n'est qu'une dimension non essentielle de l'expérience utilisateur.

Le même paradigme a également été démontré dans le domaine B, et du côté B qui recherche l'efficacité, le modèle commercial et les problèmes de mise en œuvre du grand modèle de l'industrie ont été plus profondément démontrés.

Boîte noire peu claire

"L'IA n'est pas de la physique. Il y a peu de percées technologiques majeures en théorie, mais un réglage plus fin et une petite optimisation dans les dimensions de la structure du modèle et de la qualité des données. Dans de nombreux cas, la sortie du modèle est encore meilleure, mais l'équipe ne peut pas trouver la raison."

De l'avis d'un initié de l'industrie, il existe un énorme biais cognitif dans les grands modèles en dehors de l'industrie, et la raison en est que la formation des grands modèles et l'industrie de l'IA sont une "boîte noire" pour le monde extérieur, et il est difficile pour examiner de grands modèles Le processus de raisonnement qui produit la sortie est invisible et intangible.

Cela a conduit le monde extérieur à adopter une attitude prudente vis-à-vis de la "boîte noire" du grand modèle une fois apaisé après la période de frénésie apportée par ChatGPT. Cela conduira au dilemme du grand modèle au sol, et ce phénomène est plus évident dans le processus de passage à la route B.

Prenons par exemple les produits fabriqués par les grands fabricants qui ont désormais clairement défini la voie vers B, dont la solution technologique MaaS lancée par Tencent Cloud, et le grand modèle Pangu lancé par Huawei Cloud : déploiement cloud, déploiement rapide localisé, etc. Il y a aussi des réalisations dans l'interaction, le fonctionnement et l'ajout ultérieur de nouvelles optimisations itératives de données de l'industrie. On peut dire que pour le bien de l'atterrissage, le seuil des grands modèles a été réduit à un niveau extrêmement bas.

Cependant, le mur cognitif provoqué par la "prudence" n'a pas été brisé. Même si ChatGPT souffle depuis six mois, de nombreuses entreprises n'ont aucune motivation ou intérêt à étudier comment importer de grands modèles.

Une logique similaire peut être observée dans l'industrie du cloud computing il y a quelques années. Le cloud computing est un service et un dérivé basé sur la reconnaissance de la valeur des données.Quant à la valeur des grands modèles pour les entreprises, c'est relativement que la valeur des données a bondi. Ce sont aussi les capacités techniques qui manquent aux entreprises clientes.Même la vulgarisation du cloud computing dans les entreprises nationales est encore loin d'être terminée, sans parler du grand modèle.

Que le modèle industriel soit utile ou non n'est en fait plus important, après tout, la valeur d'usage du produit doit être découverte par l'utilisateur à la fin. De plus, le monde extérieur mesurera approximativement le niveau du modèle à travers certains tests et performances, comme la "méthode du poisson mandarin écureuil" ou Huawei Pangu, qui a récemment été remis en question en raison d'erreurs de prédiction du lieu d'atterrissage et de l'intensité du super typhon "Dusuri".Modèle météorologique.

C'est peut-être pour cette raison que le modèle à grande échelle Jingdong Lingxi publié récemment a choisi de donner la priorité à l'exécution de ses propres scénarios commerciaux, et il devrait être ouvert aux "scénarios commerciaux sérieux externes" au début de l'année prochaine.

Ce qui vaut plus la peine d'être mentionné, c'est que dans le cadre de la "tendance de l'industrie", le soi-disant modèle industriel orienté par la commercialisation a remplacé le récit "universel" original du grand modèle, et en même temps, il a également fait "perdre du poids" à de nombreuses personnes. ".

La définition du soi-disant modèle industriel est vague. La connotation du grand modèle (Foundation Model) ne réside pas dans le nombre de paramètres mais dans les capacités générales qui émergent de l'apprentissage général des données. Si la même architecture de modèle est adoptée, mais qu'une seule donnée de domaine est utilisée sur les données, non seulement la capacité générale sera perdue, mais même les problèmes de domaine ne pourront pas être résolus en raison des remises émergentes.

Si les données de l'industrie sont utilisées pour la pré-formation secondaire sur la base du grand modèle d'origine, cela équivaut à affiner le modèle d'origine, alors le produit lui-même est toujours dans la couche de modèle, qui peut être appelée le grand modèle de l'industrie ; si la connaissance du domaine est ajoutée via une base de données externe, c'est uniquement pour stimuler les capacités du modèle d'origine, et le produit doit également appartenir à la couche d'application au-dessus du modèle. Il est exagéré de l'appeler un modèle métier.

À l'heure actuelle, la plupart des modèles industriels à grande échelle dans les grandes usines sont les premiers, tels que Tencent, JD.com, Huawei, etc. Ce dernier apparaîtra davantage dans la communauté open source en raison d'investissements plus légers et d'une amélioration rapide des performances du modèle, comme ChatLaw, un grand modèle juridique qui a suscité des discussions animées il y a quelque temps.

"Par rapport au premier, le second est plus mature en termes de forme de produit, ce qui facilite la construction rapide des capacités du modèle, mais le second a souvent une limite supérieure plus élevée après avoir terminé le processus d'instillation des connaissances du domaine", a déclaré un initié de l'industrie.

Menaces open source

Récemment, Meta a fourni gratuitement son dernier grand modèle open source Llama2 sous une licence commerciale ouverte et l'a introduit sur la plate-forme Azure de Microsoft.Cette décision a été saluée comme une étape importante pour le LLM open source et a même commencé à menacer le statut de source fermée. fabricant leader OpenAI.

Par l'intermédiaire de Microsoft, le grand sponsor du modèle, Meta défie OpenAI avec une attitude plus ouverte.

En fait, la "faction open source" s'est discrètement développée en tant que tierce partie bien avant cela. "Nous n'avons pas de fossé, et OpenAI non plus", a déclaré un document interne de Google accidentellement divulgué en mai. L'idée générale est qu'en surface, OpenAI et Google se rattrapent dans le grand modèle, mais le vrai gagnant ne viendra peut-être pas de ces deux-là.La raison de ce jugement réside dans l'écologie open source de plus en plus riche.

L'écologie open source devient de plus en plus active, et même Llama2, qui représente la capabilité du modèle, et LORA, la technologie représentative du paradigme Finetune (réglage fin du modèle), sont apparus. s'efforcent de "s'efforcer de faire des miracles" ressentent un net frisson.

Des facteurs tels que le partage de technologies open source et le transfert de talents rendent également la boîte noire du grand modèle plus "vitrifiée". Le résultat inévitable de l'absence de barrières est que Konw How, qui est investi par de grandes usines avec d'énormes sommes d'argent et temps, est facilement renversé par la communauté open source. .

La plupart des principaux fabricants nationaux répondent à cela en "saisissant à deux mains". La main gauche "ferme la porte pour construire une voiture", peaufine en permanence la forme et les capacités du produit sous la forme de tests internes à petite échelle, et la main droite "brainstorme", construit une communauté open source au sein de l'écologie basée sur le cloud écologie du développeur, mais cela nécessite simplement la couche de puissance de calcul et la couche de modèle du fabricant. Disposition de la pile complète à la couche d'application. Alibaba Cloud a lancé la communauté open source à grande échelle GPT, et Huawei Cloud, Baidu Cloud et Tencent Cloud ont également fait des plans.

D'une manière générale, qu'il s'agisse d'industrie ou de GM, vers C ou vers B, le test semestriel du grand modèle nous donne le sentiment direct qu'il est difficile à mettre en œuvre, et l'espérance de profit recule sans cesse ; le risque devient plus fort, et il est difficile de dire la barrière technique. Alors, où est le moyen de briser la situation actuelle ?

Pour l'instant, il y a deux directions intéressantes. L'une est la base de données vectorielle connue sous le nom de "Mémoire à l'ère de l'IA", et l'autre est le matériel intelligent doté de l'intelligence du modèle.

Le soi-disant vecteur fait référence à des données multidimensionnelles qui peuvent représenter n'importe quoi, y compris du texte, des images, des vidéos et des sons qui sont les plus importants dans la formation LLM aujourd'hui. Ces formes de contenu sont clairement représentées dans la base de données et prennent en charge la récupération sémantique, c'est-à-dire la récupération par similarité, par exemple homme contre garçon. En d'autres termes, pour les grands modèles, la récupération vectorielle est le référencement des grands modèles.

Comme mentionné ci-dessus, la connaissance du domaine peut améliorer la construction et l'utilisation de modèles industriels grâce à des capacités de base de données vectorielles, ou des ajustements ou des plug-ins. Pour les grands fabricants, c'est naturellement l'objectif de l'étape suivante. Depuis mai, le capital afflue dans les pistes liées aux données vectorielles.En tant que produit de couche d'application avec une perspective plus certaine, les données vectorielles ont également fait l'objet d'une attention particulière de la part de nombreux VC.

Quant au modèle intégré de matériel intelligent, il s'agit d'un bond en avant dans les capacités par rapport aux assistants intelligents précédents tels que "siri" et "Xiaoai", et c'est également une extension de véritables appareils intelligents (téléphones portables, ordinateurs). Dans la communauté open source, il y a eu des tentatives pour intégrer des modèles à grands paramètres dans les MAC, tandis que les grands fabricants ont accumulé une certaine capacité de production de matériel au cours de la dernière ère de l'Internet mobile, et relativement parlant, leur avantage de premier arrivé est plus évident. .

Sans le style d'écriture de printemps et d'automne de style relations publiques, les modèles à grande échelle qui sont devenus les exigences de base ne sont plus mystérieux, et les histoires deviennent de moins en moins. travailler dur. L'industrie a besoin du prochain moment "ChatGPT" avant de voir des plongeurs faire surface et les affronter de front.

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

1 J'aime