Auteur: Chen Xiaorui, journaliste du journal Huan Yanhong, stagiaire
Source de l'image : générée par l'outil d'IA illimitée
La technologie de l'IA générative est en train de changer l'industrie de l'intelligence artificielle.Après seulement six mois, le développement de modèles nationaux à grande échelle a achevé le saut de la technologie au produit, puis à l'entreprise, et a pénétré dans les industries verticales. Lors de la Conférence mondiale sur l'intelligence artificielle du 6 juillet, The Paper a invité Wang Danjun, vice-président du Beisen Talent Management Research Institute, Yu Zhonghai, directeur général adjoint du département de recherche du CICC, et Zhang Jie, vice-président de Zhongguancun Kejin Technology, à la salle de discussion Metaverse pour discuter des opportunités d'innovation des entreprises sous "l'émergence" des grands modèles. Le dialogue était animé par Shao Wen, un journaliste de The Paper. Au cours du dialogue d'une heure, les invités ont discuté d'un certain nombre de questions connexes, notamment :
Comment les grands modèles à usage général et les modèles à grande échelle de champs verticaux trouvent-ils leur propre valeur dans les futurs scénarios commerciaux ?
Comment les entreprises peuvent-elles saisir les opportunités commerciales des grands modèles ? Quel est le point clé pour saisir l'opportunité ?
La vie passée et l'avenir du grand modèle
**澎湃科技 : À l'heure actuelle, le marché intérieur a formé une situation de « guerre des cent modèles ». Pensez-vous pourquoi les modèles nationaux à grande échelle se développent si rapidement ? Quel impact cela a-t-il sur votre domaine ? **
**Wang Danjun (vice-président du Beisen Talent Management Research Institute) : **D'un point de vue technique, le développement de grands modèles ne s'est pas produit au cours des deux dernières années. Dans le domaine universitaire, il y a de nombreuses années, tout le monde a commencé à faire de la recherche. C'est juste qu'avec l'augmentation du volume de données et l'amélioration du niveau technologique ces dernières années, en particulier après la sortie d'OpenAI ChatGPT, il a attiré une large attention.
Pour chaque domaine, chacun réfléchit à la manière d'appliquer une telle nouvelle technologie à son propre domaine et à l'amélioration de son business model.
Par exemple, notre institut de recherche sur la gestion des talents Beisen appartient au secteur des ressources humaines, et les clients que nous servons sont tous des groupes d'entreprises RH (ressources humaines). Nous pensons que l'application de grands modèles dans le domaine des ressources humaines peut produire une certaine valeur perturbatrice à l'avenir, par exemple, elle peut en effet mieux améliorer l'efficacité du travail de chacun ; elle aidera nos partenaires dans une certaine mesure, qu'il s'agisse des RH ou Il peut mieux guider le développement des employés et, en même temps, il peut également aider les entreprises à répondre à de nombreuses questions de gestion des ressources humaines, y compris ce que nous posons souvent lors du recrutement d'employés : qui est le plus approprié et qui peut apporter le plus d'avantages. , comment le salaire doit être déterminé, etc. Je pense que le développement et l'application de grands modèles transformeront l'industrie des ressources humaines en très peu de temps.
**Yu Zhonghai (directeur général adjoint du département de recherche du CICC) : **Dean Wang a mentionné un point très important, à savoir que la technologie des modèles à grande échelle n'est pas arrivée aujourd'hui. En 2017, Google a écrit un article célèbre intitulé Attention Is All You Need (l'attention est tout ce dont vous avez besoin) et a proposé l'architecture du transformateur.
En fait, les praticiens de l'industrie chinoise de l'intelligence artificielle ont découvert très tôt le potentiel de la technologie des modèles à grande échelle. Nous avons également rédigé un rapport de recherche connexe en 2021. À cette époque, nous avons été choqués par le développement de modèles d'intelligence artificielle. Maintenant, le produit spécifique de ChatGPT fait connaître le grand modèle aux gens ordinaires.Que vous compreniez la technologie ou non, vous pouvez sentir son charme tant que vous y jouez, donc le grand modèle est populaire.
La capacité de grands modèles à être appliqués si rapidement dans des milliers d'industries dépend également de l'égalité des droits en matière de technologie, qui est un concept très important que nous avons mis en avant. Grâce au développement de la communauté open source et à la diffusion naturelle des connaissances, de nombreuses entreprises ont rapidement réalisé leurs propres grands modèles.
De plus, je voudrais ajouter que cette fois, nous avons vu tout le cercle technologique et même toute la société former une force commune, c'est-à-dire "tout le monde pense que c'est très important", ce qui est rarement vu dans le passé.
**Zhang Jie (vice-président de Zhongguancun Kejin Technology) : **Je pense que la première année du grand modèle remonte au lancement du GPT3 en 2020. Pourquoi s'est-il développé si rapidement au cours des six derniers mois ? Je pense qu'il y a trois raisons :
Le premier aspect est que certaines entreprises et universités ont beaucoup d'accumulation auparavant, telles que Baidu, Huawei, l'Université Tsinghua, etc., elles ont déjà des modèles de langage pré-formés ou de grands modèles, et les six derniers mois ont été une mise à jour de version itération pour eux;
Le deuxième aspect est que diverses entreprises, y compris certaines institutions d'investissement, ont augmenté leur investissement ;
Le troisième aspect est de s'appuyer sur l'open source.La communauté open source a poussé les entreprises à lancer divers modèles de grands domaines.
Concernant l'impact des grands modèles sur le terrain, c'est un bénéfice à double sens pour les clients et pour nous. Zhongguancun Kejin est l'un des principaux fournisseurs de solutions technologiques d'IA conversationnelle.Le grand modèle réduit nos coûts de personnalisation et de développement de divers modèles de scène, ce qui est une bonne nouvelle pour nous. Pour nos clients, la réduction des coûts des projets intelligents a conduit de nombreuses petites et moyennes entreprises à envisager d'établir des projets, et l'ensemble du marché a pris de l'ampleur.
**澎湃科技 : Récemment, Tencent Cloud et OpenAI ont successivement proposé un magasin de modèles à grande échelle pour les logiciels de modèles personnalisés, qui s'apparente un peu à la forme d'un magasin d'applications. Comment comprenez-vous cette tendance ? **
Wang Danjun : Que vous soyez un investisseur ou un praticien dans ce domaine, je pense que tout le monde s'attend à voir cette tendance, car elle encourage davantage de personnes à participer à la co-création de ce domaine. Nous pensons que pour les fournisseurs de services de base, ils tendront certainement vers le modèle de magasin à l'avenir, ce qui facilitera la proximité avec les clients. Le modèle du grand magasin de modèles permet également aux utilisateurs recevant des services de mieux utiliser le grand modèle pour créer de nouveaux scénarios d'application et une valeur de service.
Yu Zhonghai : Il s'agit en fait d'un problème qui inquiète beaucoup le marché des capitaux. Je pense que le développement de grands modèles ressemblera davantage au cloud public et au cloud privé chinois à l'avenir.
Le cloud public s'appelait en fait IaaS (Infrastructure-as-a-Service, infrastructure as a service) à l'époque, quand il s'agit de grands modèles, on l'appelle MaaS (Model as a Service). Il existe une société étrangère bien connue appelée Hugging Face, qui met de nombreux modèles sur Internet, et vous pouvez utiliser différents modèles d'IA simplement en appelant son API (Application Program Interface, interface de programmation d'application).
Cependant, de nombreuses entreprises doivent également déployer leur propre modèle à grande échelle et utiliser leurs propres connaissances pour l'améliorer afin d'effectuer leur propre réglage fin en raison d'exigences telles que la conformité en matière de sécurité et la mise en œuvre de scènes subdivisées. marché en Chine. .
D'une manière générale, les grands modèles ne conviennent pas à tout le monde pour une utilisation directe, y compris ChatGPT, qui est en fait intégré à un produit basé sur le grand modèle, afin que chaque personne ordinaire puisse en faire l'expérience. Par conséquent, la réalisation d'applications basées sur de grands modèles est en réalité un marché très large, qui peut générer de nombreux modèles commerciaux, tels que les employés numériques, et le concept d'App Store que vient d'évoquer l'hébergeur.
En fait, ChatGPT est également considéré par de nombreuses personnes comme un portail de trafic. Pour autant que je sache, certains fabricants de téléphones mobiles à grande échelle peuvent également finir par effectuer des recherches. Alors cette question est complètement différente. Son marché accessible sera celui de l'entreprise Les dépenses informatiques deviennent des dépenses marketing. Les entreprises chinoises peuvent consacrer en moyenne 1 à 3 % de leurs revenus à l'informatique, mais peuvent consacrer 30 % de leurs revenus au marketing. Donc quand on a du trafic, le business model peut beaucoup changer, ce qui est très intéressant.
Zhang Jie : Je pense qu'OpenAI et Tencent Cloud ont des accents différents. OpenAI peut encore se concentrer sur le grand modèle de base, mais utilise des partenaires écologiques pour l'aider à compenser le manque de précision ou de professionnalisme du grand modèle de base dans certains scénarios fragmentés. Cependant, Tencent Cloud ne met pas trop l'accent sur son propre modèle de base, mais souligne la nécessité d'être un grand modèle pour les industries verticales.
Leurs différents accents montrent un problème commun, c'est-à-dire que le grand modèle de base ne peut pas être utilisé directement dans certaines industries ou scénarios spécifiques avec un professionnalisme élevé, et il a également besoin d'une couche d'adaptation. Je pense qu'il peut y avoir un nouveau modèle d'entreprise ici, c'est-à-dire que de plus en plus de connaissances peuvent être capitalisées à l'avenir. Il s'avère que lorsque tout le monde utilise l'IA, le paradigme technique est différent. Par conséquent, les actifs que tout le monde peut partager sont des données brutes. Après avoir obtenu les données brutes, différents moyens techniques sont utilisés pour les traiter. Au cours de ce processus, la forme intermédiaire des données ne peut pas être échangée.
Cependant, le grand modèle unifie fondamentalement de nombreuses tâches d'IA, et l'ensemble du paradigme de recherche et du flux de traitement convergent, ce qui rend de nombreux produits intermédiaires commercialisables, tels que les données étiquetées, les données pour l'alignement des instructions, les mots rapides et la chaîne d'invites composée de phrases rapides. , etc., et même des robots ou des assistants formés à des scénarios spécifiques, peuvent effectuer certaines transactions et être capitalisés, ce qui pourrait constituer un nouveau modèle économique à l'avenir.
Grand modèle général VS champ vertical grand modèle
**Technologie du papier : En fait, vous venez tout juste d'évoquer tous les trois deux business paths différents, le domaine big model et le general big model. Pouvez-vous nous parler en détail des opportunités et des défis de ces deux business models différents ? **
Wang Danjun : À l'avenir, les affaires autour de grands modèles deviendront définitivement une écologie commerciale, et la caractéristique essentielle de l'écologie commerciale est qu'elle sera en couches. Tout d'abord, certains fabricants fourniront des services de base, car les gros modèles nécessitent une base de données et une puissance de calcul. Le grand modèle sert de moteur sous-jacent. Bien qu'il ait de fortes capacités, il ne comprend pas la connaissance des domaines spécifiques, des modèles de service et des besoins des clients.
Parallèlement à cela vient de grandes maquettes de verticales. Certains des grands modèles de ces domaines verticaux sont les propres grands modèles des fabricants de domaines, et certains sont formés sur la base des grands modèles de base. En termes simples, il s'agit de faire de ces modèles un expert. Par exemple, dans le domaine financier, certains services peuvent être dédiés à aider les investisseurs à prendre des décisions commerciales, et dans le domaine des ressources humaines, il peut y avoir des services dédiés à aider les entreprises à prendre des décisions en matière de talent.
Il peut y avoir plusieurs champs subdivisés. Ces subdivisions peuvent également nécessiter une accumulation de l'industrie, une formation et une compréhension de la façon de résoudre les problèmes des clients, et même de s'impliquer dans le niveau d'expérience utilisateur de l'interface interactive. Ces accumulations sont en fait certaines des fonctionnalités de l'App Store dont nous avons parlé plus tôt.
Yu Zhonghai : De notre point de vue, ces deux types de marchés sont en fait assez différents.
Tout d'abord, il est également important de construire un bon volant de données pour le grand modèle général.
Par exemple, aujourd'hui, je t'apprends à jouer au tennis de table et je dis que tu devrais jouer comme ça. Ensuite, je sers une balle et tu ne l'attrapes pas, tu sais que ce n'est pas la bonne façon de la frapper. Puis changez d'une autre manière, cette fois vous l'attrapez, vous vous souviendrez de la bonne manière. Ensuite, je continue à vous servir le ballon, et vous continuez à l'attraper, en ajustant votre mémoire musculaire petit à petit pour trouver le meilleur chemin. En fait, la formation du modèle est également un tel processus. Chaque fois que vous communiquez avec ChatGPT, il y aura un j'aime ou je n'aime pas en dessous. Ou il y a des moments où vous ne dites rien et êtes juste très déçu d'en avoir régénéré un. Ou par exemple, à chaque fois que vous utilisez Midjourney pour dessiner, il affichera quatre images, puis vous sélectionnerez la troisième par défaut, l'agrandirez, la téléchargerez, et il saura que celle-ci semble être meilleure, et ça ira à cela à l'avenir La direction est un peu plus biaisée, et le modèle apprendra un peu. Sans retour de données, le modèle reste là et ne peut pas s'améliorer. C'est donc le volant de données que nous soulignons, mettant l'accent sur la position de la carte de la scène. En tant que grand modèle polyvalent, le plus important est qu'il soit utilisé par quelqu'un, ce qui est également un avantage de la Chine. Les Chinois aiment adopter la technologie et acceptent davantage les grands modèles. Nous avons beaucoup de monde pour nous faire part de nos commentaires.
Pour les grands modèles de domaine, je pense que ce qui est plus important, c'est le savoir-faire (le savoir-faire technique et l'expertise nécessaires pour s'engager dans une certaine industrie ou faire un certain travail).
La clé du modèle de grand domaine est de répondre aux besoins des clients et de comprendre le savoir-faire des clients dans un certain domaine profond. Des entreprises comme Zhongguancun Kejin ont ici leurs avantages : elles comprennent le savoir-faire du client et comprennent les points faibles du client dans des scénarios de terrain spécifiques.
**Zhang Jie : **Merci pour votre reconnaissance. Je comprends que le grand modèle général et le grand modèle de domaine sont une relation en amont et en aval, et non une relation concurrentielle. Le modèle général est large et complet, et le modèle de domaine est une petite mais belle entreprise.
Le modèle général à grande échelle se caractérise par "trois sommets", c'est-à-dire un investissement élevé et un rendement élevé, mais aussi une incertitude élevée. Parce que la formation d'un grand modèle de base nécessite des exigences élevées en termes d'algorithmes, de données et de talents. Par exemple, la puissance de calcul doit être d'au moins 10 000 kat niveau de puissance de calcul.
Pourquoi l'incertitude est-elle si élevée ? Parce que les fabricants présélectionnés sont essentiellement de grandes entreprises Internet ou des géants de la technologie, les exigences techniques sont très élevées pour que les grands modèles formés aient des capacités générales et des capacités émergentes.Si vous voulez prendre pied sur le marché, vous devez au moins être en mesure de run Ce n'est qu'en remportant le modèle open source qu'il peut survivre. Dans le futur marché, je pense qu'il y aura beaucoup de grands modèles de base qui coexisteront, mais il n'y en aura peut-être pas trop.
Une maquette de domaine peut être une petite mais belle piste. L'entraînement d'un grand modèle de domaine ne nécessite pas une puissance de calcul très élevée, d'après nos expérimentations, il ne faut qu'une semaine pour itérer le modèle de grand domaine. Deux cartes peuvent faire du raisonnement en temps réel. Ensuite, en termes de données, nous devons encore établir nos propres seuils, c'est-à-dire l'effet volant des données que M. Yu vient de mentionner.
Le point le plus important de la concurrence est le talent. Le grand modèle de domaine a aplati la chaîne technologique de l'ensemble de l'industrie. Vos talents doivent non seulement comprendre les algorithmes, mais aussi savoir comment bien concevoir les algorithmes, comprendre les scénarios, comprendre les affaires et même comprendre la conception de produits. Il est nécessaire de stimuler la capacité composée des talents, puis de stimuler l'initiative et la créativité des talents, qui est un test de capacité organisationnelle.
**Dans quel domaine le grand modèle est-il le plus utile ? **
**Technologie du papier : quelles sont les trois directions d'application verticales les plus prometteuses ? **
Yu Zhonghai : Nous avons examiné de nombreuses directions, et la direction la plus prometteuse est maintenant AI Answer, qui est un mot que nous avons créé nous-mêmes, qui fait référence à une catégorie de produits. Par exemple, vous m'avez testé sur un sujet aujourd'hui, et vous m'avez demandé quelle marque de poussette il vaut mieux acheter. Je crois que tout le monde devrait avoir une situation similaire.Demandez à trois amis, lisez cinq articles sur Xiaohongshu, puis recherchez dix messages sur Internet. Enfin, après l'avoir lu, j'ai résumé trois modèles, puis j'ai regardé le prix et j'ai pris une décision.
En fait, il en va de même pour beaucoup de choses quand on demande à l'intelligence artificielle. Le grand modèle a une certaine mémoire. Il sait que ces choses sont liées, mais il aura des hallucinations. À quoi il ressemble. Ainsi, ce que les entreprises font souvent, c'est de faire certaines requêtes basées sur la base de connaissances interne, puis de faire un résumé basé sur ces éléments. De plus, il y a une question et une réponse, un résumé ou une comparaison basée sur un document, comme une clause d'assurance basée sur des centaines de pages. Ou donner une réponse basée sur une recherche. Nous appelons collectivement ces produits AI Answer. En outre, nous accordons également plus d'attention aux opportunités telles que le travail de bureau et les machines d'apprentissage de l'IA.
Zhang Jie : Je pense que nous pouvons d'abord regarder par industrie, puis par scène. L'industrie idéale pour les modèles de domaine à grande échelle est une industrie avec une forte densité de connaissances, une logique de processus solide et sensible à la sécurité et à la confidentialité. Par exemple, des industries telles que la finance, les soins médicaux, le droit et les affaires gouvernementales peuvent être des industries idéales pour la mise en œuvre de modèles de domaine à grande échelle à l'avenir.
La scène peut être habilitée pour les employés internes au début. Par exemple, faites des quiz de connaissances, suivis d'une formation et d'un sparring. Après avoir responsabilisé les employés internes, regardons comment rendre service à C (aux clients), ou habiliter le personnel de vente et le personnel du service client à devenir des assistants du service client marketing. En bref, lors de l'application, vous pouvez d'abord envisager de partir de la scène avec une tolérance aux pannes relativement élevée.
Wang Danjun : Nous pensons également que dans l'expérience d'application de chacun, les grands modèles nous aident à résoudre la plupart des problèmes dans les industries à forte intensité de connaissances. Dans le domaine To B comme Beisen ou Zhongguancun Kejin, il y aura en effet certaines entreprises qui seront plus susceptibles d'en profiter. Par exemple, dans la gestion des ressources humaines d'une entreprise, tout le monde espère que le grand modèle pourra résoudre certaines choses ennuyeuses et ennuyeuses pour les gens, comme répondre à diverses préoccupations communes des employés. Beisen et Zhongguancun Kejin discutent également d'une coopération dans ce domaine, dans l'espoir d'établir à l'avenir des employés numériques via les installations sous-jacentes du grand modèle, et de répondre à ces questions qui ne semblent pas nécessiter d'expérience et de connaissances humaines.
En outre, nous avons constaté qu'il existe des domaines à forte valeur ajoutée, tels que le coaching en leadership d'entreprise. Une entreprise a plusieurs niveaux de responsables, et chaque responsable rencontrera divers défis chaque jour, mais il n'a pas autant d'occasions de demander conseil aux autres. Nous pensons que l'AIGC peut fournir une très bonne aide dans ce scénario, et cela peut bien répondre à certains exigences personnelles en matière de confidentialité.
**澎湃科技:Microsoft a récemment annoncé une coopération avec OpenAI pour ouvrir l'écologie des applications. Zhongguancun Kejin est un représentant des fabricants d'applications à grande échelle en Chine. Quel est l'état d'avancement actuel de l'atterrissage et de l'application des produits ? Chaque entreprise aura-t-elle son propre modèle exclusif à l'avenir ? **
Zhang Jie : Je pense que toutes les entreprises n'ont pas besoin de leur propre modèle exclusif, car je pense que la technologie des grands modèles peut être divisée en trois couches, de peu profonde à profonde :
Au premier niveau, si l'industrie ou l'entreprise n'a pas autant de connaissances ou de documents, ou si la particularité de l'entreprise elle-même n'est pas forte, il n'est pas nécessaire d'utiliser un modèle dédié, et un grand modèle général peut être utilisé directement. Sur le grand modèle général, selon les exigences spécifiques de la scène, il suffit d'ajuster (invite). Pendant cette période, les entreprises ont besoin d'un outil de gestion rapide des mots avec une bonne expérience utilisateur et un seuil bas. Il peut être nécessaire pour certains experts métier d'accumuler des invites utiles dans des scénarios spécifiques ; pour les scénarios plus compliqués, il est nécessaire de transformer certaines invites en un petit ensemble d'invites, puis de former des chaînes entre différents ensembles, et les chaînes sont séquencées Logique relation, il suffit de disposer d'un outil de gestion rapide de la chaîne.
La deuxième couche est un peu plus compliquée. Certaines entreprises ont beaucoup de connaissances fragmentées. À l'heure actuelle, les mots ou les chaînes d'invites peuvent ne pas suffire. Il est nécessaire d'ajouter une base de connaissances au-dessus du grand modèle général pour gérer les connaissances à basse fréquence et à longue traîne. Lorsque le grand modèle général rencontre des problèmes spécifiques, accédez à la base de connaissances pour trouver des réponses. C'est la voie technique du grand modèle général + base de connaissances + ingénierie rapide.
La troisième couche, pour les entreprises ayant une grande quantité de connaissances du domaine, il est nécessaire de construire un grand modèle de domaine exclusif à l'entreprise et d'entrer les connaissances générales du domaine dans le cerveau du grand modèle, qui non seulement maintient des sens et raisonnement, mais possède également l'expertise dans le domaine. Les connaissances et les compétences font de grands modèles, des étudiants en arts libéraux aux experts du domaine. Il s'agit d'un itinéraire de grand modèle de domaine + base de connaissances de domaine + ingénierie rapide.
Zhongguancun Kejin a une certaine pratique d'application pour les trois situations ci-dessus. Nous avons essayé de résoudre trois difficultés techniques il y a quelque temps, et après avoir résolu, nous avons formé deux ensembles d'applications d'assistant. Quelles sont les trois difficultés techniques ?
Le premier est de résoudre le problème des hallucinations qui se produisent souvent dans les grands modèles, c'est-à-dire de graves absurdités. Cela nécessite une base de connaissances sur le terrain pour faire savoir au grand modèle que lorsqu'on lui pose une question, il doit trouver des connaissances pertinentes dans la base de connaissances. Lors de la construction d'une base de connaissances, il est souvent nécessaire de traiter des documents au format texte enrichi. Il est nécessaire que le grand modèle comprenne d'abord la mise en page du document, puis comprenne le contenu à l'intérieur.
La seconde est d'éviter le problème d'oubli pendant le processus de formation lors de la formation de grands modèles dans le domaine. Sinon, lorsque vous introduisez de nouvelles connaissances dans son cerveau, il oubliera les anciennes connaissances. Des moyens techniques performants de mise au point seront utilisés ici, afin qu'il puisse non seulement avoir les connaissances générales originales, mais aussi apprendre le bon sens sur le terrain.
Le troisième est de savoir comment faire en sorte que les utilisateurs l'utilisent plus facilement et à moindre coût. Qu'il s'agisse d'un grand modèle de domaine, d'une base de connaissances de domaine ou de mots rapides, cela ne peut pas être accompli du jour au lendemain et nécessite des commentaires et des itérations continus.Cela nécessite que les clients aient des capacités de maintenance, et la conception du produit et l'emballage d'ingénierie doivent être bien faits au niveau du niveau outil.
**澎湃科技 : Je voudrais demander à M. Yu du point de vue de l'investissement, par rapport à la logique d'investissement à l'ère de l'Internet mobile et de la technologie dure, dans ce cycle de montée en puissance de modèles à grande échelle, au cœur de la sélection des projets , y compris les points de décision d'investissement qu'est-ce que c'est **
**Yu Zhonghai :**C'est aussi une question que le capital a explorée. Au cours des six derniers mois, le marché des grands modèles a également connu de nombreuses évolutions. Au début, beaucoup de gens le considéraient comme un investissement thématique.À cette époque, les entreprises liées à l'IA étaient spéculées et les entreprises ayant de réelles capacités sous-jacentes de modèles à grande échelle étaient très appréciées de tous. Plus tard, la "guerre des cent modèles" est apparue. Tout le monde a estimé que le grand modèle semblait un peu trop compliqué. Ils ont constaté que la puissance de calcul semblait être la bénéficiaire de l'achat de pelles aux Nuggets, de sorte que la valorisation des entreprises liées à la puissance de calcul a augmenté d'un parcelle. En mai et juin de cette année, nous avons proposé que "les applications de l'IA aient inauguré une période cambrienne explosive". De nombreuses entreprises ont mis au point leurs propres produits et l'application de l'IA a recommencé à augmenter.
En fait, le rythme d'investissement des grands modèles est également progressif. Dès le début, tant qu'il s'agit d'une entreprise d'IA, il peut augmenter, puis il sortira avec une application, et ensuite tout le monde commencera à explorer si cette application a des clients qui paient pour cela, et s'il y a de vraies commandes. Je pense que peut-être dans un an environ, tout le monde se demandera s'il y a des obstacles à cette application et si l'entreprise est viable à long terme. En fait, ce sur quoi nous sommes le plus optimistes, c'est au niveau de l'application. Nous attachons une grande importance aux entreprises qui peuvent vraiment connecter de grands modèles et des applications d'entreprise, et elles peuvent vraiment créer de la valeur.
**The Paper : La question suivante s'adresse à Dean Wang. Du point de vue des talents, le grand modèle est en train de construire une nouvelle relation de production de collaboration homme-machine. Alors quel impact cela aura-t-il sur la gestion des talents des entreprises ? **
Wang Danjun : C'est une très bonne question. Parce qu'on voit qu'au niveau social, tout le monde peut avoir très envie de discuter "Est-ce que mon travail sera remplacé par un grand modèle dans le futur ?" Concernant cette question, je propose qu'on puisse l'aborder sous deux aspects :
D'une part, ce dont tout le monde a le plus discuté, c'est que la capacité des modèles à grande échelle devient de plus en plus forte et que l'application des champs verticaux devient de plus en plus profonde, ce qui pourrait remplacer le travail de nombreux employés généraux à l'avenir. Ces dernières années, même sans l'arrière-plan du développement de modèles à grande échelle, tout le monde est très préoccupé par la réduction des coûts et l'augmentation de l'efficacité, ce qui implique la proportion des coûts de main-d'œuvre dans les entreprises. Si certaines nouvelles technologies peuvent être utilisées pour réduire les coûts de main-d'œuvre, cela sera très précieux pour l'entreprise, ce qui est une raison importante pour son développement durable.
En revanche, l'émergence de grands modèles et l'émergence d'outils de terrain plus verticaux à l'avenir seront une bénédiction pour les salariés. Du côté positif, si les employés peuvent mieux utiliser la collaboration homme-machine, cela peut créer plus de valeur pour l'entreprise.
Nous prévoyons qu'il y aura des changements dans la forme organisationnelle à l'avenir. La plupart des entreprises ont maintenant une structure fonctionnelle, différentes fonctions servent les mêmes clients, il y a beaucoup de problèmes de collaboration et de communication entre les fonctions, ce qui est une grande consommation pour l'entreprise. Mais à l'avenir, lorsque des employés individuels ou des groupes auront des capacités complètes à l'aide d'outils, l'unité organisationnelle sera inévitablement plus petite et elle sera plus agile, flexible et réactive.
**Technologie du papier : je voudrais vous demander à tous les trois de quel type de capacités les entreprises ont le plus besoin dans le contexte de la guerre des cent modèles ? **
**Zhang Jie : **Pour les fabricants de modèles de base à grande échelle, ce dont ils ont le plus besoin, c'est d'avoir des capacités techniques particulièrement solides et uniques. Pour surpasser les modèles à grande échelle open source, puis disposer de technologies uniques en multimodal ou sexe de raisonnement complexe. Pour les fabricants de modèles à grande échelle sur le terrain, les talents composés sont les plus nécessaires et les compétences organisationnelles sont très importantes. Parce qu'il faut faire jouer pleinement l'initiative et la créativité des talents, le mettre en relation avec des opportunités d'affaires pointues, et lui faire savoir ce dont les clients ont besoin. De plus, il doit y avoir des capacités d'ingénierie et des capacités algorithmiques.
Yu Zhonghai : Je pense que les données sont très importantes, en particulier pour les entreprises qui souhaitent utiliser de grands modèles, les données sont vraiment importantes. En fait, les données deviendront bientôt un obstacle pour nous.Des entreprises comme Zhongguancun Kejin qui fournissent des applications de modèles à grande échelle ont leur plus grand avantage dans les données.
**Wang Danjun : ** En fait, pour la grande majorité des entreprises, il est plus probable qu'elles seront à l'avenir des consommateurs de grands modèles plutôt que des créateurs de grands modèles. L'adoption active de grands modèles peut considérablement accélérer leur processus de gestion numérique . Les organisations et les individus peuvent avoir besoin d'adopter le changement. Les dirigeants à tous les niveaux doivent accroître leur sensibilisation à cette nouvelle opportunité, et les employés doivent maintenir des capacités d'apprentissage continues et autonomes.
**Technologie du papier : dans ce processus, les entreprises du secteur vertical bénéficient du savoir-faire de l'industrie. Sont-ils plus faciles à franchir les points de carte des données de modèle volumineux ? **
Zhang Jie : Je pense que le savoir-faire de l'industrie doit être examiné en détail, et il peut y avoir plusieurs formes qui nécessitent une attention particulière.
La forme la plus évidente de savoir-faire industriel consiste en certaines données contenues dans des documents, qui sont des expressions symboliques. Comment extraire (mots d'invite) ou des chaînes d'invite du document est un type de problème qui doit être traité au stade actuel. De nombreuses entreprises disposent d'un grand nombre de documents, et nombre de ces documents sont au format PPT ou PDF. Il est nécessaire de comprendre à la fois son format et son contenu.
Outre le savoir-faire de ce type d'industrie, il y a aussi les connaissances cachées dans l'esprit des experts de l'industrie ou des experts en scénarios. Il faut lui donner un outil, qui peut se résumer en mots. Le modèle, c'est l'industrie. savoir-faire avec une densité plus élevée.
Il existe également un type relativement caché de savoir-faire industriel, qui est la sagesse collective cachée dans les journaux système. Après avoir extrait ces journaux, il est possible de transformer des connaissances dispersées en connaissances structurées en chaîne. Ensuite, à partir des milliers de chaînes, il est résumé et transformé en meilleure pratique dans un scénario spécifique. Par exemple, les vendeurs passent beaucoup d'appels téléphoniques chaque jour, et il y a des millions de journaux de dialogue accumulés chaque jour. En les adaptant en fonction de différents résultats tels que l'achèvement de la commande, l'ordre de flux ou les appels raccrochés, les meilleures compétences vocales pour le marketing de nouveaux produits peuvent être précipités.
Ces trois types de questions sont en fait un très bon savoir-faire de l'industrie. Il existe également des défis techniques ici, tels que la façon d'extraire des mots rapides et des chaînes d'invites à partir de documents et de journaux. doc2 et log2 font l'objet de recherches dans lesquelles il vaut la peine d'investir.
Yu Zhonghai : En fait, Zhang Jie a toujours eu un dicton qui m'a profondément impressionné. Il a dit qu'enregistrer les orbites des huit planètes du système solaire pendant des dizaines de millions d'années n'est pas aussi bon qu'une loi abstraite de la gravité qui peut mieux expliquer les choses La nature.
Je pense que c'est du savoir-faire. Les entreprises dans les domaines verticaux ont beaucoup d'expérience dans des domaines connexes. Laissez-moi vous donner un exemple. Après que l'intelligence artificielle est devenue populaire, tout le monde a dit qu'il y avait une nouvelle profession appelée ingénieur avec un salaire annuel d'un million.
C'est l'ingénieur qui est allé écrire. Alors pourquoi sont-ils si précieux ? J'utilise également moi-même des outils de peinture à intelligence artificielle. Une fois, j'ai voulu dessiner un homme en costume, mais j'ai essayé plusieurs mots-clés et cela n'a pas fonctionné. Plus tard, j'ai tapé "cravate", et la personne a immédiatement enfilé un costume, et vous constaterez que c'est le mot magique.
Le grand modèle est un peu comme un jeu de probabilités, il comporte en fait de nombreuses probabilités a priori. Dans la scène de tout à l'heure, la cravate est le mot très important correspondant au costume. Et l'ingénieur sait quels mots clés peuvent perturber le modèle, et il sait quel genre de choses on veut écrire, c'est sa valeur. Ensuite, si nous plaçons cette matière dans le scénario d'application, il s'agit en fait de la valeur des entreprises dans les domaines verticaux. Il comprend à la fois l'intelligence artificielle et le savoir-faire de l'industrie.
Wang Danjun : À l'heure actuelle, il semble qu'en plus des entreprises modèles de base à grande échelle, les entreprises de terrain verticales constituent le deuxième groupe d'entreprises auxquelles tout le monde prêtera une attention particulière sur le marché. Je pense que ce sera très difficile pour eux dans la prochaine période. L'expérience des entreprises dans les domaines verticaux ne se transforme pas nécessairement directement en nouvelle créativité sous la bénédiction des nouvelles technologies. Besoin de passer plus de temps à apprendre d'abord, à comprendre quelle est la logique sous-jacente de l'opération de gros modèle, à apprendre comment cela peut m'aider, voire m'aider à approfondir nos connaissances, ou nous aider à fournir des services aux clients. Je pense que pendant un certain temps encore, ils seront les premiers à relever ce défi. Sur ces bases, trouver de nouvelles opportunités de création de valeur pour les clients en s'appuyant sur ces modèles.
**Technologie du papier : il y a eu récemment de nouvelles tendances, telles que le ralentissement du nombre de visiteurs de ChatGPT. Il n'existait pas réellement en tant que super entrée. Certains pensent que ChatGPT ne peut pas représenter l'avenir de GPT, mais n'est qu'un produit présenté par OpenAI et Microsoft sur le marché. Que pensez-vous de ce point de vue ? **
Yu Zhonghai : Ce point de vue est en effet assez intéressant. Personnellement, je suis relativement optimiste, car je suis une personne qui utilise souvent des produits à grande échelle. Et je voudrais ajouter que le ChatGPT actuel n'est pas sa forme définitive. Je pense que Google Assistant (Google Assistant) dans le système Android de nouvelle génération de Google sera pris en charge par son propre grand modèle, car il s'agit également d'une entrée de trafic très importante.
Wang Danjun : Pour de nombreuses personnes dans l'industrie, tout le monde est très optimiste. En tant que nouveau produit, à ce stade de développement, il y aura naturellement une certaine différenciation. Pour les utilisateurs finaux, ils seront intéressés par ces outils, prêts à les essayer et à continuer à les utiliser. Même si la fréquence d'utilisation diminue et le degré d'attention diminue, le comportement des utilisateurs est difficile à modifier.
Zhang Jie : Je pense que le ralentissement du taux de croissance de ChatGPT est quelque chose qui arrivera tôt ou tard. Après tout, le trafic a un plafond. Tôt ou tard, le trafic culminera ou l'engouement du public pour les scénarios d'application du chat déclinera.Après tout, le chat n'est pas une demande rigide à haute fréquence, mais il vous apporte une inspiration particulièrement bonne.
D'une part, il existe de nombreuses applications autour de Chat, telles que la génération d'images, de vidéos, de rapports, de PPT, etc. via le chat, telles que ChatDoc, ChatPdf et ChatBI. Un autre scénario est le grand modèle de domaine que nous venons de mentionner, comme le GPT financier, le GPT juridique et le GPT médical, qui pourraient tous constituer de nouvelles entrées commerciales à l'avenir.
Voir l'original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Opportunités commerciales sous "l'émergence" des grands modèles: qui gagnera la "guerre des cent modèles"
Source: Le papier
Auteur: Chen Xiaorui, journaliste du journal Huan Yanhong, stagiaire
La technologie de l'IA générative est en train de changer l'industrie de l'intelligence artificielle.Après seulement six mois, le développement de modèles nationaux à grande échelle a achevé le saut de la technologie au produit, puis à l'entreprise, et a pénétré dans les industries verticales. Lors de la Conférence mondiale sur l'intelligence artificielle du 6 juillet, The Paper a invité Wang Danjun, vice-président du Beisen Talent Management Research Institute, Yu Zhonghai, directeur général adjoint du département de recherche du CICC, et Zhang Jie, vice-président de Zhongguancun Kejin Technology, à la salle de discussion Metaverse pour discuter des opportunités d'innovation des entreprises sous "l'émergence" des grands modèles. Le dialogue était animé par Shao Wen, un journaliste de The Paper. Au cours du dialogue d'une heure, les invités ont discuté d'un certain nombre de questions connexes, notamment :
Comment les grands modèles à usage général et les modèles à grande échelle de champs verticaux trouvent-ils leur propre valeur dans les futurs scénarios commerciaux ?
Comment les entreprises peuvent-elles saisir les opportunités commerciales des grands modèles ? Quel est le point clé pour saisir l'opportunité ?
La vie passée et l'avenir du grand modèle
**澎湃科技 : À l'heure actuelle, le marché intérieur a formé une situation de « guerre des cent modèles ». Pensez-vous pourquoi les modèles nationaux à grande échelle se développent si rapidement ? Quel impact cela a-t-il sur votre domaine ? **
**Wang Danjun (vice-président du Beisen Talent Management Research Institute) : **D'un point de vue technique, le développement de grands modèles ne s'est pas produit au cours des deux dernières années. Dans le domaine universitaire, il y a de nombreuses années, tout le monde a commencé à faire de la recherche. C'est juste qu'avec l'augmentation du volume de données et l'amélioration du niveau technologique ces dernières années, en particulier après la sortie d'OpenAI ChatGPT, il a attiré une large attention.
Pour chaque domaine, chacun réfléchit à la manière d'appliquer une telle nouvelle technologie à son propre domaine et à l'amélioration de son business model.
Par exemple, notre institut de recherche sur la gestion des talents Beisen appartient au secteur des ressources humaines, et les clients que nous servons sont tous des groupes d'entreprises RH (ressources humaines). Nous pensons que l'application de grands modèles dans le domaine des ressources humaines peut produire une certaine valeur perturbatrice à l'avenir, par exemple, elle peut en effet mieux améliorer l'efficacité du travail de chacun ; elle aidera nos partenaires dans une certaine mesure, qu'il s'agisse des RH ou Il peut mieux guider le développement des employés et, en même temps, il peut également aider les entreprises à répondre à de nombreuses questions de gestion des ressources humaines, y compris ce que nous posons souvent lors du recrutement d'employés : qui est le plus approprié et qui peut apporter le plus d'avantages. , comment le salaire doit être déterminé, etc. Je pense que le développement et l'application de grands modèles transformeront l'industrie des ressources humaines en très peu de temps.
**Yu Zhonghai (directeur général adjoint du département de recherche du CICC) : **Dean Wang a mentionné un point très important, à savoir que la technologie des modèles à grande échelle n'est pas arrivée aujourd'hui. En 2017, Google a écrit un article célèbre intitulé Attention Is All You Need (l'attention est tout ce dont vous avez besoin) et a proposé l'architecture du transformateur.
En fait, les praticiens de l'industrie chinoise de l'intelligence artificielle ont découvert très tôt le potentiel de la technologie des modèles à grande échelle. Nous avons également rédigé un rapport de recherche connexe en 2021. À cette époque, nous avons été choqués par le développement de modèles d'intelligence artificielle. Maintenant, le produit spécifique de ChatGPT fait connaître le grand modèle aux gens ordinaires.Que vous compreniez la technologie ou non, vous pouvez sentir son charme tant que vous y jouez, donc le grand modèle est populaire.
La capacité de grands modèles à être appliqués si rapidement dans des milliers d'industries dépend également de l'égalité des droits en matière de technologie, qui est un concept très important que nous avons mis en avant. Grâce au développement de la communauté open source et à la diffusion naturelle des connaissances, de nombreuses entreprises ont rapidement réalisé leurs propres grands modèles.
De plus, je voudrais ajouter que cette fois, nous avons vu tout le cercle technologique et même toute la société former une force commune, c'est-à-dire "tout le monde pense que c'est très important", ce qui est rarement vu dans le passé.
**Zhang Jie (vice-président de Zhongguancun Kejin Technology) : **Je pense que la première année du grand modèle remonte au lancement du GPT3 en 2020. Pourquoi s'est-il développé si rapidement au cours des six derniers mois ? Je pense qu'il y a trois raisons :
Le premier aspect est que certaines entreprises et universités ont beaucoup d'accumulation auparavant, telles que Baidu, Huawei, l'Université Tsinghua, etc., elles ont déjà des modèles de langage pré-formés ou de grands modèles, et les six derniers mois ont été une mise à jour de version itération pour eux;
Le deuxième aspect est que diverses entreprises, y compris certaines institutions d'investissement, ont augmenté leur investissement ;
Le troisième aspect est de s'appuyer sur l'open source.La communauté open source a poussé les entreprises à lancer divers modèles de grands domaines.
Concernant l'impact des grands modèles sur le terrain, c'est un bénéfice à double sens pour les clients et pour nous. Zhongguancun Kejin est l'un des principaux fournisseurs de solutions technologiques d'IA conversationnelle.Le grand modèle réduit nos coûts de personnalisation et de développement de divers modèles de scène, ce qui est une bonne nouvelle pour nous. Pour nos clients, la réduction des coûts des projets intelligents a conduit de nombreuses petites et moyennes entreprises à envisager d'établir des projets, et l'ensemble du marché a pris de l'ampleur.
**澎湃科技 : Récemment, Tencent Cloud et OpenAI ont successivement proposé un magasin de modèles à grande échelle pour les logiciels de modèles personnalisés, qui s'apparente un peu à la forme d'un magasin d'applications. Comment comprenez-vous cette tendance ? **
Wang Danjun : Que vous soyez un investisseur ou un praticien dans ce domaine, je pense que tout le monde s'attend à voir cette tendance, car elle encourage davantage de personnes à participer à la co-création de ce domaine. Nous pensons que pour les fournisseurs de services de base, ils tendront certainement vers le modèle de magasin à l'avenir, ce qui facilitera la proximité avec les clients. Le modèle du grand magasin de modèles permet également aux utilisateurs recevant des services de mieux utiliser le grand modèle pour créer de nouveaux scénarios d'application et une valeur de service.
Yu Zhonghai : Il s'agit en fait d'un problème qui inquiète beaucoup le marché des capitaux. Je pense que le développement de grands modèles ressemblera davantage au cloud public et au cloud privé chinois à l'avenir.
Le cloud public s'appelait en fait IaaS (Infrastructure-as-a-Service, infrastructure as a service) à l'époque, quand il s'agit de grands modèles, on l'appelle MaaS (Model as a Service). Il existe une société étrangère bien connue appelée Hugging Face, qui met de nombreux modèles sur Internet, et vous pouvez utiliser différents modèles d'IA simplement en appelant son API (Application Program Interface, interface de programmation d'application).
Cependant, de nombreuses entreprises doivent également déployer leur propre modèle à grande échelle et utiliser leurs propres connaissances pour l'améliorer afin d'effectuer leur propre réglage fin en raison d'exigences telles que la conformité en matière de sécurité et la mise en œuvre de scènes subdivisées. marché en Chine. .
D'une manière générale, les grands modèles ne conviennent pas à tout le monde pour une utilisation directe, y compris ChatGPT, qui est en fait intégré à un produit basé sur le grand modèle, afin que chaque personne ordinaire puisse en faire l'expérience. Par conséquent, la réalisation d'applications basées sur de grands modèles est en réalité un marché très large, qui peut générer de nombreux modèles commerciaux, tels que les employés numériques, et le concept d'App Store que vient d'évoquer l'hébergeur.
En fait, ChatGPT est également considéré par de nombreuses personnes comme un portail de trafic. Pour autant que je sache, certains fabricants de téléphones mobiles à grande échelle peuvent également finir par effectuer des recherches. Alors cette question est complètement différente. Son marché accessible sera celui de l'entreprise Les dépenses informatiques deviennent des dépenses marketing. Les entreprises chinoises peuvent consacrer en moyenne 1 à 3 % de leurs revenus à l'informatique, mais peuvent consacrer 30 % de leurs revenus au marketing. Donc quand on a du trafic, le business model peut beaucoup changer, ce qui est très intéressant.
Zhang Jie : Je pense qu'OpenAI et Tencent Cloud ont des accents différents. OpenAI peut encore se concentrer sur le grand modèle de base, mais utilise des partenaires écologiques pour l'aider à compenser le manque de précision ou de professionnalisme du grand modèle de base dans certains scénarios fragmentés. Cependant, Tencent Cloud ne met pas trop l'accent sur son propre modèle de base, mais souligne la nécessité d'être un grand modèle pour les industries verticales.
Leurs différents accents montrent un problème commun, c'est-à-dire que le grand modèle de base ne peut pas être utilisé directement dans certaines industries ou scénarios spécifiques avec un professionnalisme élevé, et il a également besoin d'une couche d'adaptation. Je pense qu'il peut y avoir un nouveau modèle d'entreprise ici, c'est-à-dire que de plus en plus de connaissances peuvent être capitalisées à l'avenir. Il s'avère que lorsque tout le monde utilise l'IA, le paradigme technique est différent. Par conséquent, les actifs que tout le monde peut partager sont des données brutes. Après avoir obtenu les données brutes, différents moyens techniques sont utilisés pour les traiter. Au cours de ce processus, la forme intermédiaire des données ne peut pas être échangée.
Cependant, le grand modèle unifie fondamentalement de nombreuses tâches d'IA, et l'ensemble du paradigme de recherche et du flux de traitement convergent, ce qui rend de nombreux produits intermédiaires commercialisables, tels que les données étiquetées, les données pour l'alignement des instructions, les mots rapides et la chaîne d'invites composée de phrases rapides. , etc., et même des robots ou des assistants formés à des scénarios spécifiques, peuvent effectuer certaines transactions et être capitalisés, ce qui pourrait constituer un nouveau modèle économique à l'avenir.
Grand modèle général VS champ vertical grand modèle
**Technologie du papier : En fait, vous venez tout juste d'évoquer tous les trois deux business paths différents, le domaine big model et le general big model. Pouvez-vous nous parler en détail des opportunités et des défis de ces deux business models différents ? **
Wang Danjun : À l'avenir, les affaires autour de grands modèles deviendront définitivement une écologie commerciale, et la caractéristique essentielle de l'écologie commerciale est qu'elle sera en couches. Tout d'abord, certains fabricants fourniront des services de base, car les gros modèles nécessitent une base de données et une puissance de calcul. Le grand modèle sert de moteur sous-jacent. Bien qu'il ait de fortes capacités, il ne comprend pas la connaissance des domaines spécifiques, des modèles de service et des besoins des clients.
Parallèlement à cela vient de grandes maquettes de verticales. Certains des grands modèles de ces domaines verticaux sont les propres grands modèles des fabricants de domaines, et certains sont formés sur la base des grands modèles de base. En termes simples, il s'agit de faire de ces modèles un expert. Par exemple, dans le domaine financier, certains services peuvent être dédiés à aider les investisseurs à prendre des décisions commerciales, et dans le domaine des ressources humaines, il peut y avoir des services dédiés à aider les entreprises à prendre des décisions en matière de talent.
Il peut y avoir plusieurs champs subdivisés. Ces subdivisions peuvent également nécessiter une accumulation de l'industrie, une formation et une compréhension de la façon de résoudre les problèmes des clients, et même de s'impliquer dans le niveau d'expérience utilisateur de l'interface interactive. Ces accumulations sont en fait certaines des fonctionnalités de l'App Store dont nous avons parlé plus tôt.
Yu Zhonghai : De notre point de vue, ces deux types de marchés sont en fait assez différents.
Tout d'abord, il est également important de construire un bon volant de données pour le grand modèle général.
Par exemple, aujourd'hui, je t'apprends à jouer au tennis de table et je dis que tu devrais jouer comme ça. Ensuite, je sers une balle et tu ne l'attrapes pas, tu sais que ce n'est pas la bonne façon de la frapper. Puis changez d'une autre manière, cette fois vous l'attrapez, vous vous souviendrez de la bonne manière. Ensuite, je continue à vous servir le ballon, et vous continuez à l'attraper, en ajustant votre mémoire musculaire petit à petit pour trouver le meilleur chemin. En fait, la formation du modèle est également un tel processus. Chaque fois que vous communiquez avec ChatGPT, il y aura un j'aime ou je n'aime pas en dessous. Ou il y a des moments où vous ne dites rien et êtes juste très déçu d'en avoir régénéré un. Ou par exemple, à chaque fois que vous utilisez Midjourney pour dessiner, il affichera quatre images, puis vous sélectionnerez la troisième par défaut, l'agrandirez, la téléchargerez, et il saura que celle-ci semble être meilleure, et ça ira à cela à l'avenir La direction est un peu plus biaisée, et le modèle apprendra un peu. Sans retour de données, le modèle reste là et ne peut pas s'améliorer. C'est donc le volant de données que nous soulignons, mettant l'accent sur la position de la carte de la scène. En tant que grand modèle polyvalent, le plus important est qu'il soit utilisé par quelqu'un, ce qui est également un avantage de la Chine. Les Chinois aiment adopter la technologie et acceptent davantage les grands modèles. Nous avons beaucoup de monde pour nous faire part de nos commentaires.
Pour les grands modèles de domaine, je pense que ce qui est plus important, c'est le savoir-faire (le savoir-faire technique et l'expertise nécessaires pour s'engager dans une certaine industrie ou faire un certain travail).
La clé du modèle de grand domaine est de répondre aux besoins des clients et de comprendre le savoir-faire des clients dans un certain domaine profond. Des entreprises comme Zhongguancun Kejin ont ici leurs avantages : elles comprennent le savoir-faire du client et comprennent les points faibles du client dans des scénarios de terrain spécifiques.
**Zhang Jie : **Merci pour votre reconnaissance. Je comprends que le grand modèle général et le grand modèle de domaine sont une relation en amont et en aval, et non une relation concurrentielle. Le modèle général est large et complet, et le modèle de domaine est une petite mais belle entreprise.
Le modèle général à grande échelle se caractérise par "trois sommets", c'est-à-dire un investissement élevé et un rendement élevé, mais aussi une incertitude élevée. Parce que la formation d'un grand modèle de base nécessite des exigences élevées en termes d'algorithmes, de données et de talents. Par exemple, la puissance de calcul doit être d'au moins 10 000 kat niveau de puissance de calcul.
Pourquoi l'incertitude est-elle si élevée ? Parce que les fabricants présélectionnés sont essentiellement de grandes entreprises Internet ou des géants de la technologie, les exigences techniques sont très élevées pour que les grands modèles formés aient des capacités générales et des capacités émergentes.Si vous voulez prendre pied sur le marché, vous devez au moins être en mesure de run Ce n'est qu'en remportant le modèle open source qu'il peut survivre. Dans le futur marché, je pense qu'il y aura beaucoup de grands modèles de base qui coexisteront, mais il n'y en aura peut-être pas trop.
Une maquette de domaine peut être une petite mais belle piste. L'entraînement d'un grand modèle de domaine ne nécessite pas une puissance de calcul très élevée, d'après nos expérimentations, il ne faut qu'une semaine pour itérer le modèle de grand domaine. Deux cartes peuvent faire du raisonnement en temps réel. Ensuite, en termes de données, nous devons encore établir nos propres seuils, c'est-à-dire l'effet volant des données que M. Yu vient de mentionner.
Le point le plus important de la concurrence est le talent. Le grand modèle de domaine a aplati la chaîne technologique de l'ensemble de l'industrie. Vos talents doivent non seulement comprendre les algorithmes, mais aussi savoir comment bien concevoir les algorithmes, comprendre les scénarios, comprendre les affaires et même comprendre la conception de produits. Il est nécessaire de stimuler la capacité composée des talents, puis de stimuler l'initiative et la créativité des talents, qui est un test de capacité organisationnelle.
**Dans quel domaine le grand modèle est-il le plus utile ? **
**Technologie du papier : quelles sont les trois directions d'application verticales les plus prometteuses ? **
Yu Zhonghai : Nous avons examiné de nombreuses directions, et la direction la plus prometteuse est maintenant AI Answer, qui est un mot que nous avons créé nous-mêmes, qui fait référence à une catégorie de produits. Par exemple, vous m'avez testé sur un sujet aujourd'hui, et vous m'avez demandé quelle marque de poussette il vaut mieux acheter. Je crois que tout le monde devrait avoir une situation similaire.Demandez à trois amis, lisez cinq articles sur Xiaohongshu, puis recherchez dix messages sur Internet. Enfin, après l'avoir lu, j'ai résumé trois modèles, puis j'ai regardé le prix et j'ai pris une décision.
En fait, il en va de même pour beaucoup de choses quand on demande à l'intelligence artificielle. Le grand modèle a une certaine mémoire. Il sait que ces choses sont liées, mais il aura des hallucinations. À quoi il ressemble. Ainsi, ce que les entreprises font souvent, c'est de faire certaines requêtes basées sur la base de connaissances interne, puis de faire un résumé basé sur ces éléments. De plus, il y a une question et une réponse, un résumé ou une comparaison basée sur un document, comme une clause d'assurance basée sur des centaines de pages. Ou donner une réponse basée sur une recherche. Nous appelons collectivement ces produits AI Answer. En outre, nous accordons également plus d'attention aux opportunités telles que le travail de bureau et les machines d'apprentissage de l'IA.
Zhang Jie : Je pense que nous pouvons d'abord regarder par industrie, puis par scène. L'industrie idéale pour les modèles de domaine à grande échelle est une industrie avec une forte densité de connaissances, une logique de processus solide et sensible à la sécurité et à la confidentialité. Par exemple, des industries telles que la finance, les soins médicaux, le droit et les affaires gouvernementales peuvent être des industries idéales pour la mise en œuvre de modèles de domaine à grande échelle à l'avenir.
La scène peut être habilitée pour les employés internes au début. Par exemple, faites des quiz de connaissances, suivis d'une formation et d'un sparring. Après avoir responsabilisé les employés internes, regardons comment rendre service à C (aux clients), ou habiliter le personnel de vente et le personnel du service client à devenir des assistants du service client marketing. En bref, lors de l'application, vous pouvez d'abord envisager de partir de la scène avec une tolérance aux pannes relativement élevée.
Wang Danjun : Nous pensons également que dans l'expérience d'application de chacun, les grands modèles nous aident à résoudre la plupart des problèmes dans les industries à forte intensité de connaissances. Dans le domaine To B comme Beisen ou Zhongguancun Kejin, il y aura en effet certaines entreprises qui seront plus susceptibles d'en profiter. Par exemple, dans la gestion des ressources humaines d'une entreprise, tout le monde espère que le grand modèle pourra résoudre certaines choses ennuyeuses et ennuyeuses pour les gens, comme répondre à diverses préoccupations communes des employés. Beisen et Zhongguancun Kejin discutent également d'une coopération dans ce domaine, dans l'espoir d'établir à l'avenir des employés numériques via les installations sous-jacentes du grand modèle, et de répondre à ces questions qui ne semblent pas nécessiter d'expérience et de connaissances humaines.
En outre, nous avons constaté qu'il existe des domaines à forte valeur ajoutée, tels que le coaching en leadership d'entreprise. Une entreprise a plusieurs niveaux de responsables, et chaque responsable rencontrera divers défis chaque jour, mais il n'a pas autant d'occasions de demander conseil aux autres. Nous pensons que l'AIGC peut fournir une très bonne aide dans ce scénario, et cela peut bien répondre à certains exigences personnelles en matière de confidentialité.
**澎湃科技:Microsoft a récemment annoncé une coopération avec OpenAI pour ouvrir l'écologie des applications. Zhongguancun Kejin est un représentant des fabricants d'applications à grande échelle en Chine. Quel est l'état d'avancement actuel de l'atterrissage et de l'application des produits ? Chaque entreprise aura-t-elle son propre modèle exclusif à l'avenir ? **
Zhang Jie : Je pense que toutes les entreprises n'ont pas besoin de leur propre modèle exclusif, car je pense que la technologie des grands modèles peut être divisée en trois couches, de peu profonde à profonde :
Au premier niveau, si l'industrie ou l'entreprise n'a pas autant de connaissances ou de documents, ou si la particularité de l'entreprise elle-même n'est pas forte, il n'est pas nécessaire d'utiliser un modèle dédié, et un grand modèle général peut être utilisé directement. Sur le grand modèle général, selon les exigences spécifiques de la scène, il suffit d'ajuster (invite). Pendant cette période, les entreprises ont besoin d'un outil de gestion rapide des mots avec une bonne expérience utilisateur et un seuil bas. Il peut être nécessaire pour certains experts métier d'accumuler des invites utiles dans des scénarios spécifiques ; pour les scénarios plus compliqués, il est nécessaire de transformer certaines invites en un petit ensemble d'invites, puis de former des chaînes entre différents ensembles, et les chaînes sont séquencées Logique relation, il suffit de disposer d'un outil de gestion rapide de la chaîne.
La deuxième couche est un peu plus compliquée. Certaines entreprises ont beaucoup de connaissances fragmentées. À l'heure actuelle, les mots ou les chaînes d'invites peuvent ne pas suffire. Il est nécessaire d'ajouter une base de connaissances au-dessus du grand modèle général pour gérer les connaissances à basse fréquence et à longue traîne. Lorsque le grand modèle général rencontre des problèmes spécifiques, accédez à la base de connaissances pour trouver des réponses. C'est la voie technique du grand modèle général + base de connaissances + ingénierie rapide.
La troisième couche, pour les entreprises ayant une grande quantité de connaissances du domaine, il est nécessaire de construire un grand modèle de domaine exclusif à l'entreprise et d'entrer les connaissances générales du domaine dans le cerveau du grand modèle, qui non seulement maintient des sens et raisonnement, mais possède également l'expertise dans le domaine. Les connaissances et les compétences font de grands modèles, des étudiants en arts libéraux aux experts du domaine. Il s'agit d'un itinéraire de grand modèle de domaine + base de connaissances de domaine + ingénierie rapide.
Zhongguancun Kejin a une certaine pratique d'application pour les trois situations ci-dessus. Nous avons essayé de résoudre trois difficultés techniques il y a quelque temps, et après avoir résolu, nous avons formé deux ensembles d'applications d'assistant. Quelles sont les trois difficultés techniques ?
Le premier est de résoudre le problème des hallucinations qui se produisent souvent dans les grands modèles, c'est-à-dire de graves absurdités. Cela nécessite une base de connaissances sur le terrain pour faire savoir au grand modèle que lorsqu'on lui pose une question, il doit trouver des connaissances pertinentes dans la base de connaissances. Lors de la construction d'une base de connaissances, il est souvent nécessaire de traiter des documents au format texte enrichi. Il est nécessaire que le grand modèle comprenne d'abord la mise en page du document, puis comprenne le contenu à l'intérieur.
La seconde est d'éviter le problème d'oubli pendant le processus de formation lors de la formation de grands modèles dans le domaine. Sinon, lorsque vous introduisez de nouvelles connaissances dans son cerveau, il oubliera les anciennes connaissances. Des moyens techniques performants de mise au point seront utilisés ici, afin qu'il puisse non seulement avoir les connaissances générales originales, mais aussi apprendre le bon sens sur le terrain.
Le troisième est de savoir comment faire en sorte que les utilisateurs l'utilisent plus facilement et à moindre coût. Qu'il s'agisse d'un grand modèle de domaine, d'une base de connaissances de domaine ou de mots rapides, cela ne peut pas être accompli du jour au lendemain et nécessite des commentaires et des itérations continus.Cela nécessite que les clients aient des capacités de maintenance, et la conception du produit et l'emballage d'ingénierie doivent être bien faits au niveau du niveau outil.
**澎湃科技 : Je voudrais demander à M. Yu du point de vue de l'investissement, par rapport à la logique d'investissement à l'ère de l'Internet mobile et de la technologie dure, dans ce cycle de montée en puissance de modèles à grande échelle, au cœur de la sélection des projets , y compris les points de décision d'investissement qu'est-ce que c'est **
**Yu Zhonghai :**C'est aussi une question que le capital a explorée. Au cours des six derniers mois, le marché des grands modèles a également connu de nombreuses évolutions. Au début, beaucoup de gens le considéraient comme un investissement thématique.À cette époque, les entreprises liées à l'IA étaient spéculées et les entreprises ayant de réelles capacités sous-jacentes de modèles à grande échelle étaient très appréciées de tous. Plus tard, la "guerre des cent modèles" est apparue. Tout le monde a estimé que le grand modèle semblait un peu trop compliqué. Ils ont constaté que la puissance de calcul semblait être la bénéficiaire de l'achat de pelles aux Nuggets, de sorte que la valorisation des entreprises liées à la puissance de calcul a augmenté d'un parcelle. En mai et juin de cette année, nous avons proposé que "les applications de l'IA aient inauguré une période cambrienne explosive". De nombreuses entreprises ont mis au point leurs propres produits et l'application de l'IA a recommencé à augmenter.
En fait, le rythme d'investissement des grands modèles est également progressif. Dès le début, tant qu'il s'agit d'une entreprise d'IA, il peut augmenter, puis il sortira avec une application, et ensuite tout le monde commencera à explorer si cette application a des clients qui paient pour cela, et s'il y a de vraies commandes. Je pense que peut-être dans un an environ, tout le monde se demandera s'il y a des obstacles à cette application et si l'entreprise est viable à long terme. En fait, ce sur quoi nous sommes le plus optimistes, c'est au niveau de l'application. Nous attachons une grande importance aux entreprises qui peuvent vraiment connecter de grands modèles et des applications d'entreprise, et elles peuvent vraiment créer de la valeur.
**The Paper : La question suivante s'adresse à Dean Wang. Du point de vue des talents, le grand modèle est en train de construire une nouvelle relation de production de collaboration homme-machine. Alors quel impact cela aura-t-il sur la gestion des talents des entreprises ? **
Wang Danjun : C'est une très bonne question. Parce qu'on voit qu'au niveau social, tout le monde peut avoir très envie de discuter "Est-ce que mon travail sera remplacé par un grand modèle dans le futur ?" Concernant cette question, je propose qu'on puisse l'aborder sous deux aspects :
D'une part, ce dont tout le monde a le plus discuté, c'est que la capacité des modèles à grande échelle devient de plus en plus forte et que l'application des champs verticaux devient de plus en plus profonde, ce qui pourrait remplacer le travail de nombreux employés généraux à l'avenir. Ces dernières années, même sans l'arrière-plan du développement de modèles à grande échelle, tout le monde est très préoccupé par la réduction des coûts et l'augmentation de l'efficacité, ce qui implique la proportion des coûts de main-d'œuvre dans les entreprises. Si certaines nouvelles technologies peuvent être utilisées pour réduire les coûts de main-d'œuvre, cela sera très précieux pour l'entreprise, ce qui est une raison importante pour son développement durable.
En revanche, l'émergence de grands modèles et l'émergence d'outils de terrain plus verticaux à l'avenir seront une bénédiction pour les salariés. Du côté positif, si les employés peuvent mieux utiliser la collaboration homme-machine, cela peut créer plus de valeur pour l'entreprise.
Nous prévoyons qu'il y aura des changements dans la forme organisationnelle à l'avenir. La plupart des entreprises ont maintenant une structure fonctionnelle, différentes fonctions servent les mêmes clients, il y a beaucoup de problèmes de collaboration et de communication entre les fonctions, ce qui est une grande consommation pour l'entreprise. Mais à l'avenir, lorsque des employés individuels ou des groupes auront des capacités complètes à l'aide d'outils, l'unité organisationnelle sera inévitablement plus petite et elle sera plus agile, flexible et réactive.
**Technologie du papier : je voudrais vous demander à tous les trois de quel type de capacités les entreprises ont le plus besoin dans le contexte de la guerre des cent modèles ? **
**Zhang Jie : **Pour les fabricants de modèles de base à grande échelle, ce dont ils ont le plus besoin, c'est d'avoir des capacités techniques particulièrement solides et uniques. Pour surpasser les modèles à grande échelle open source, puis disposer de technologies uniques en multimodal ou sexe de raisonnement complexe. Pour les fabricants de modèles à grande échelle sur le terrain, les talents composés sont les plus nécessaires et les compétences organisationnelles sont très importantes. Parce qu'il faut faire jouer pleinement l'initiative et la créativité des talents, le mettre en relation avec des opportunités d'affaires pointues, et lui faire savoir ce dont les clients ont besoin. De plus, il doit y avoir des capacités d'ingénierie et des capacités algorithmiques.
Yu Zhonghai : Je pense que les données sont très importantes, en particulier pour les entreprises qui souhaitent utiliser de grands modèles, les données sont vraiment importantes. En fait, les données deviendront bientôt un obstacle pour nous.Des entreprises comme Zhongguancun Kejin qui fournissent des applications de modèles à grande échelle ont leur plus grand avantage dans les données.
**Wang Danjun : ** En fait, pour la grande majorité des entreprises, il est plus probable qu'elles seront à l'avenir des consommateurs de grands modèles plutôt que des créateurs de grands modèles. L'adoption active de grands modèles peut considérablement accélérer leur processus de gestion numérique . Les organisations et les individus peuvent avoir besoin d'adopter le changement. Les dirigeants à tous les niveaux doivent accroître leur sensibilisation à cette nouvelle opportunité, et les employés doivent maintenir des capacités d'apprentissage continues et autonomes.
**Technologie du papier : dans ce processus, les entreprises du secteur vertical bénéficient du savoir-faire de l'industrie. Sont-ils plus faciles à franchir les points de carte des données de modèle volumineux ? **
Zhang Jie : Je pense que le savoir-faire de l'industrie doit être examiné en détail, et il peut y avoir plusieurs formes qui nécessitent une attention particulière.
La forme la plus évidente de savoir-faire industriel consiste en certaines données contenues dans des documents, qui sont des expressions symboliques. Comment extraire (mots d'invite) ou des chaînes d'invite du document est un type de problème qui doit être traité au stade actuel. De nombreuses entreprises disposent d'un grand nombre de documents, et nombre de ces documents sont au format PPT ou PDF. Il est nécessaire de comprendre à la fois son format et son contenu.
Outre le savoir-faire de ce type d'industrie, il y a aussi les connaissances cachées dans l'esprit des experts de l'industrie ou des experts en scénarios. Il faut lui donner un outil, qui peut se résumer en mots. Le modèle, c'est l'industrie. savoir-faire avec une densité plus élevée.
Il existe également un type relativement caché de savoir-faire industriel, qui est la sagesse collective cachée dans les journaux système. Après avoir extrait ces journaux, il est possible de transformer des connaissances dispersées en connaissances structurées en chaîne. Ensuite, à partir des milliers de chaînes, il est résumé et transformé en meilleure pratique dans un scénario spécifique. Par exemple, les vendeurs passent beaucoup d'appels téléphoniques chaque jour, et il y a des millions de journaux de dialogue accumulés chaque jour. En les adaptant en fonction de différents résultats tels que l'achèvement de la commande, l'ordre de flux ou les appels raccrochés, les meilleures compétences vocales pour le marketing de nouveaux produits peuvent être précipités.
Ces trois types de questions sont en fait un très bon savoir-faire de l'industrie. Il existe également des défis techniques ici, tels que la façon d'extraire des mots rapides et des chaînes d'invites à partir de documents et de journaux. doc2 et log2 font l'objet de recherches dans lesquelles il vaut la peine d'investir.
Yu Zhonghai : En fait, Zhang Jie a toujours eu un dicton qui m'a profondément impressionné. Il a dit qu'enregistrer les orbites des huit planètes du système solaire pendant des dizaines de millions d'années n'est pas aussi bon qu'une loi abstraite de la gravité qui peut mieux expliquer les choses La nature.
Je pense que c'est du savoir-faire. Les entreprises dans les domaines verticaux ont beaucoup d'expérience dans des domaines connexes. Laissez-moi vous donner un exemple. Après que l'intelligence artificielle est devenue populaire, tout le monde a dit qu'il y avait une nouvelle profession appelée ingénieur avec un salaire annuel d'un million.
C'est l'ingénieur qui est allé écrire. Alors pourquoi sont-ils si précieux ? J'utilise également moi-même des outils de peinture à intelligence artificielle. Une fois, j'ai voulu dessiner un homme en costume, mais j'ai essayé plusieurs mots-clés et cela n'a pas fonctionné. Plus tard, j'ai tapé "cravate", et la personne a immédiatement enfilé un costume, et vous constaterez que c'est le mot magique.
Le grand modèle est un peu comme un jeu de probabilités, il comporte en fait de nombreuses probabilités a priori. Dans la scène de tout à l'heure, la cravate est le mot très important correspondant au costume. Et l'ingénieur sait quels mots clés peuvent perturber le modèle, et il sait quel genre de choses on veut écrire, c'est sa valeur. Ensuite, si nous plaçons cette matière dans le scénario d'application, il s'agit en fait de la valeur des entreprises dans les domaines verticaux. Il comprend à la fois l'intelligence artificielle et le savoir-faire de l'industrie.
Wang Danjun : À l'heure actuelle, il semble qu'en plus des entreprises modèles de base à grande échelle, les entreprises de terrain verticales constituent le deuxième groupe d'entreprises auxquelles tout le monde prêtera une attention particulière sur le marché. Je pense que ce sera très difficile pour eux dans la prochaine période. L'expérience des entreprises dans les domaines verticaux ne se transforme pas nécessairement directement en nouvelle créativité sous la bénédiction des nouvelles technologies. Besoin de passer plus de temps à apprendre d'abord, à comprendre quelle est la logique sous-jacente de l'opération de gros modèle, à apprendre comment cela peut m'aider, voire m'aider à approfondir nos connaissances, ou nous aider à fournir des services aux clients. Je pense que pendant un certain temps encore, ils seront les premiers à relever ce défi. Sur ces bases, trouver de nouvelles opportunités de création de valeur pour les clients en s'appuyant sur ces modèles.
**Technologie du papier : il y a eu récemment de nouvelles tendances, telles que le ralentissement du nombre de visiteurs de ChatGPT. Il n'existait pas réellement en tant que super entrée. Certains pensent que ChatGPT ne peut pas représenter l'avenir de GPT, mais n'est qu'un produit présenté par OpenAI et Microsoft sur le marché. Que pensez-vous de ce point de vue ? **
Yu Zhonghai : Ce point de vue est en effet assez intéressant. Personnellement, je suis relativement optimiste, car je suis une personne qui utilise souvent des produits à grande échelle. Et je voudrais ajouter que le ChatGPT actuel n'est pas sa forme définitive. Je pense que Google Assistant (Google Assistant) dans le système Android de nouvelle génération de Google sera pris en charge par son propre grand modèle, car il s'agit également d'une entrée de trafic très importante.
Wang Danjun : Pour de nombreuses personnes dans l'industrie, tout le monde est très optimiste. En tant que nouveau produit, à ce stade de développement, il y aura naturellement une certaine différenciation. Pour les utilisateurs finaux, ils seront intéressés par ces outils, prêts à les essayer et à continuer à les utiliser. Même si la fréquence d'utilisation diminue et le degré d'attention diminue, le comportement des utilisateurs est difficile à modifier.
Zhang Jie : Je pense que le ralentissement du taux de croissance de ChatGPT est quelque chose qui arrivera tôt ou tard. Après tout, le trafic a un plafond. Tôt ou tard, le trafic culminera ou l'engouement du public pour les scénarios d'application du chat déclinera.Après tout, le chat n'est pas une demande rigide à haute fréquence, mais il vous apporte une inspiration particulièrement bonne.
D'une part, il existe de nombreuses applications autour de Chat, telles que la génération d'images, de vidéos, de rapports, de PPT, etc. via le chat, telles que ChatDoc, ChatPdf et ChatBI. Un autre scénario est le grand modèle de domaine que nous venons de mentionner, comme le GPT financier, le GPT juridique et le GPT médical, qui pourraient tous constituer de nouvelles entrées commerciales à l'avenir.