Tencent Cloud Wu Yunsheng : Le modèle général et le modèle industriel ne sont pas opposés

Source de l'image : générée par l'IA illimitée

"Nous préférons résoudre 100 % des problèmes d'un client plutôt que de résoudre 70 % à 80 % des 100 problèmes de nos clients."

Le 7 juillet, lors du forum Tencent de la Conférence mondiale sur l'intelligence artificielle (WAIC) 2023, lorsqu'on lui a demandé pourquoi le modèle à grande échelle orienté vers l'industrie avait été lancé en premier, Wu Yunsheng, vice-président de Tencent Cloud et responsable de Tencent Cloud Intelligence, a répondu ainsi .

Les modèles à grande échelle sont le sujet le plus brûlant du monde de l'IA cette année. Comparé à Baidu, Ali et d'autres géants qui ont lancé pour la première fois le modèle à grande échelle sous-jacent à usage général, Tencent a concentré son attention directement sur l'industrie - avant la tenue du WAIC, le 19 juin, Tencent Cloud a officiellement annoncé le MaaS (Model as a Service ) panorama, qui a été Les 10 principales industries ont exporté plus de 50 solutions, couvrant de nombreux scénarios différents tels que le tourisme culturel, la finance, les médias, l'éducation et les affaires gouvernementales.

Naturellement, l'application de scénarios et l'atterrissage sont devenus le thème du forum WAIC Tencent.

"Les grands modèles à usage général ne sont pas la seule direction pour les applications de modèles. Les modèles pour les industries verticales deviendront le point de basculement de la valeur des grands modèles", a prédit Li Qiang, vice-président de Tencent et président des activités gouvernementales et d'entreprise de Tencent. le forum.

Wu Yunsheng a pris comme exemple le service client intelligent OTA (agence de voyage en ligne) et a expliqué que les utilisateurs ont souvent plusieurs intentions mélangées dans le processus de communication réel. Dans le processus de communication, l'intention peut également basculer à tout moment.

"(L'utilisateur) a juste demandé à réserver l'hôtel le 10, et la machine était sur le point de répondre, et a soudainement dit, laissez-moi voir l'hôtel le 11." Face au processus extrêmement compliqué du service client, le général grand modèle ne peut pas parfaitement Pour mener à bien la tâche, il est nécessaire de reconstruire certains modèles complexes en combinaison avec des scénarios spécifiques.

Cependant, le modèle à grande échelle à usage général actuel en est encore au stade précoce de la recherche et du développement, et il sera confronté au problème du coût élevé des applications industrielles. Wu Yunsheng a déclaré que dans certains scénarios spécifiques, puisque le grand modèle à usage général -le modèle réduit ne peut pas répondre à 100% aux besoins, alors "à en juger par le niveau de coût de la solution, il n'y a pas trop de sens." Bien que les solutions pour différents secteurs et scénarios varient considérablement, il n'y a aucun problème à améliorer l'efficacité des entreprises de plus de 30 % en général.

Wu Yunsheng, vice-président de Tencent Cloud et responsable de Tencent Cloud Intelligence. Source : Tencent

Lors du forum, Tencent Cloud a également présenté les récentes mises à niveau importantes autour du grand modèle. Ses deux principales bases techniques - le réseau Xingmai et la base de données vectorielle ont toutes subi des mises à niveau de capacité. Le réseau informatique haute performance Xingmai mis à niveau peut augmenter l'utilisation du GPU de 40 %, réduire les coûts de formation des modèles de 30 % à 60 % et améliorer les performances de communication des grands modèles d'IA de près de 10 fois.

Et juste le 4 juillet, Tencent Cloud a officiellement publié la base de données vectorielle native AI.Par rapport à la méthode traditionnelle, elle est utilisée pour la classification, la déduplication et le nettoyage des données de pré-formation de grands modèles, et la base de données peut atteindre un facteur 10 augmentation de l'efficacité. L'utiliser comme base de connaissances externe pour l'inférence de modèle peut réduire le coût de 2 à 4 ordres de grandeur.

Au WAIC de cette année, un phénomène intéressant est également apparu : plus de 30 modèles à grande échelle à usage général et industriel ont été dévoilés lors de la réunion, et ils ont tous déclaré faire des modèles à grande échelle. La question de l'homogénéisation a immédiatement été au centre des discussions : l'entrepreneuriat dans le domaine de l'IA a-t-il encore un sens ? Chaque grande usine a son propre grand modèle, si tout le monde le possède, le grand modèle sera-t-il toujours un Game Changer ?

Wu Yunsheng estime qu'au stade initial du développement de grands modèles, il n'est pas nécessaire de se précipiter pour porter des jugements sur ces questions. "J'aimerais voir que lorsque l'industrie est en plein essor, grâce à la combinaison de la technologie et de l'industrie, explorer diverses possibilités et améliorer l'efficacité des industries et des industries", a déclaré Wu Yunsheng.

Ce jugement vient aussi de son optimisme quant au potentiel commercial des grands modèles d'IA. Lors de la dernière vague d'IA avec des percées ponctuelles, de nombreuses entreprises d'IA sont tombées dans le dilemme de la livraison et de la mise en œuvre de projets et de privatisation, et n'ont pas été en mesure d'atteindre la rentabilité.

"A l'ère des grands modèles, la situation peut être différente d'avant." Wu Yunsheng estime qu'avec le développement de la technologie, y compris le développement de la puissance de calcul sous-jacente et des puces GPU, les paramètres des modèles qui coûtaient des centaines de milliards dans le passé sont de plus en plus petits; Tencent Il y a aussi beaucoup de progrès dans le renforcement de la formation et le renforcement du raisonnement, et le coût baisse rapidement. D'autre part, les possibilités d'application de grands modèles sont en constante expansion et la valeur ne cesse d'augmenter.

Aujourd'hui, Tencent étend sa technologie et son écologie d'application autour des grands modèles d'IA, et renforce également ses liens avec l'industrie. Le 6 juillet, l'Organisation des Nations Unies pour le développement industriel et Huawei et d'autres partenaires ont annoncé conjointement la création de la "Global Industrial and Manufacturing Artificial Intelligence Alliance" au WAIC.

Wu Yunsheng a également souligné que la mise à niveau de la base technique "pratique la force interne": "** Peu importe qu'il s'agisse d'un modèle à grande échelle à usage général ou d'un modèle industriel à grande échelle, il doit disposer des capacités de support sous-jacentes , y compris une énorme puissance de calcul, des données, etc.**."

"À l'ère des modèles à grande échelle, l'ouverture est très importante, et tout le monde devrait être ouvert. La technologie sous-jacente change trop vite et les capacités d'extension sont très larges. Lorsqu'elles sont combinées avec des industries spécifiques, il y aura beaucoup de recherche et les coûts de développement. » Wu Yunsheng a déclaré que seule l'ouverture peut permettre à davantage d'industries. Ce n'est que lorsque des experts et divers personnels se joignent à nous que nous pouvons cultiver un écosystème plus sain et créer plus de possibilités.

Ce qui suit est le compte rendu d'interview des médias et de Wu Yunsheng, édité par 36 Krypton :

**Médias :**Tencent Cloud a lancé au départ un modèle à grande échelle axé sur l'industrie, plutôt qu'un modèle à grande échelle à usage général. Est-ce une considération de revenus ?

Wu Yunsheng : Cela n'a rien à voir avec le coût et l'investissement. Nous avons toujours insisté sur le fait que nous voulions résoudre les problèmes des clients. Nous préférons résoudre le problème d'un client à 100 % plutôt que de résoudre les problèmes de 100 clients à 70 %-80 %. Nous pouvons réduire le problème, mais nous devons résoudre ce problème.

Média : Il semble que le modèle général et le modèle de l'industrie s'opposent. Comment voyez-vous la relation future entre les deux ?

Wu Yunsheng : Tout d'abord, je tiens à préciser que je ne me suis personnellement pas opposé aux deux. Une maquette de base est quelque chose comme un piédestal qui résout un besoin sans personnalisation particulière. Le modèle de l'industrie devrait être basé sur le modèle général pour améliorer efficacement la productivité et servir le public. Ce n'est qu'en pénétrant profondément dans l'industrie que nous pourrons résoudre des problèmes particulièrement importants.

La fonction de carte Vincent aura également des points industriels très détaillés et spécifiques, par exemple, la génération d'une carte publicitaire pour un package, et certains clients auront des besoins particuliers, tels qu'une certification spéciale. Face à des problèmes pratiques, une approche différente s'impose.

Médias : Sur quels domaines Tencent se concentrera-t-il cette année et quels objectifs de développement aura-t-il ? Quelles sont les mises à jour et itérations récentes ?

Wu Yunsheng : Notre grande stratégie consiste à nous concentrer sur la mise en œuvre de problèmes pratiques, en espérant résoudre 100 % des problèmes des clients dans chaque scénario spécifique, au lieu de trouver 100 produits pour résoudre 70 % à 80 % des problèmes. Par conséquent, nous nous concentrerons sur des industries spécifiques et travaillerons avec les clients pour résoudre les problèmes de l'industrie.

Par exemple, dans l'industrie du voyage culturel, les clients du domaine OTA (agence de voyage en ligne) combineront leurs propres scénarios commerciaux, utiliseront une technologie de modèle à grande échelle dans les processus commerciaux et utiliseront des ressources liées aux données pour affiner la stratégie à grande échelle. modèle. En termes de développement technologique, notre modèle et notre réseau de puissance de calcul ont été itérés et mis à niveau, et nous continuerons à itérer les technologies associées.

**Média : **Depuis la dernière version du modèle sectoriel, y a-t-il eu un changement significatif dans le nombre d'entreprises accédant au modèle ?

Wu Yunsheng : Nous avons beaucoup de contacts avec les entreprises, et nous étudierons honnêtement les scénarios réels des clients et comment répondre aux besoins commerciaux actuels. "L'accès" n'est pas spécifiquement défini. Il existe divers besoins dans le processus d'exploration. Peut-être que vous voyez généralement AIGC plus souvent.

Je dis quelque chose de légèrement différent. Nous avons une entreprise cliente qui fabrique des logiciels de niveau entreprise et qui a besoin de créer des formulaires intelligents. Par exemple, lors d'une réunion de gestion, un nouveau formulaire est ajouté. Certains éléments du formulaire sont obligatoires, d'autres non obligatoires et certaines listes déroulantes ne peuvent sélectionner que 4 ou 5 options. Une fois l'option terminée, elle doit être transformée en un processus approuvé par A, B et C, et l'approbation de chaque personne est différente.

La méthode originale consiste à concevoir le formulaire dans le système avec ses propres outils et codes de langage, à compiler l'ensemble du processus, puis à appeler l'organisation interne pour réaliser le processus. Mais l'exigence actuelle est de prendre une photo et de la mettre dans le système, et de la décrire avec le code système (propre langage de script).Les individus n'ont besoin que d'une communication et d'une communication en langage naturel simples, telles que celles qui sont nécessaires et celles qui ne le sont pas. La première étape Où aller, où aller dans la deuxième étape, utilisez votre propre langage système pour concevoir le processus d'amarrage.

Cet exemple est une exigence très spécifique qui ne peut pas être entièrement satisfaite par un modèle général. Nous aurons donc des échanges approfondis avec les entreprises pour voir de quels champs il s'agit et de quel langage de script il s'agit. La technologie à usage général peut être en mesure de résoudre directement 60 à 70 % des problèmes, mais si les clients veulent résoudre 100 % des problèmes, ils ont besoin d'une communication plus approfondie.

**Média : **Combien de coûts l'entreprise économisera-t-elle avec la mise en œuvre du modèle industriel à grande échelle ? Par rapport aux modèles à grande échelle à usage général, dans quels domaines les modèles à grande échelle industriels auront-ils des avantages ?

**Wu Yunsheng : **Le coût économisé varie en fait considérablement selon les entreprises et les différents scénarios. Par exemple, dans le scénario du service client, il existe une grande différence entre la taille du service client lui-même dans l'entreprise et son budget. En termes d'expérience réelle, je pense que ce n'est pas un problème d'augmenter l'efficacité de plus de 30 %.

Lorsqu'un grand modèle général est confronté à une industrie spécifique, il peut ne pas être en mesure de résoudre complètement les problèmes rencontrés par l'industrie. Par exemple, ce dont le service client a besoin, ce ne sont pas de simples discussions de questions-réponses, mais de robots et de grands modèles capables de comprendre les intentions humaines, de rechercher des bases de données, d'extraire les informations requises, puis de les combiner en texte compréhensible par l'homme pour les réponses.

La chose la plus importante est que le processus de communication réel de l'utilisateur est souvent mélangé avec plusieurs intentions. Il y a de nombreuses exigences dans une description, et l'intention peut changer à tout moment pendant le processus de communication. C'est très difficile et le processus est très compliqué, en particulier lors de l'interaction avec le système du client modèle complexe. Ce processus ne doit pas être résolu par un grand modèle général et doit être combiné avec des scénarios spécifiques.

**Média :**Quel type de gamme Tencent peut-il contrôler le coût du modèle à grande échelle de l'entreprise ?

Wu Yunsheng : Nous soulignons que grâce à cette technologie, les entreprises peuvent réduire les coûts, augmenter l'efficacité et améliorer l'efficacité de la production, mais nous ne dirons jamais à quel niveau contrôler les coûts. Notre produit est sorti depuis moins d'un mois, et nous avons une certaine coopération au début, mais nous ne pouvons certainement pas donner de données globales.

**36 Krypton :**Dans la dernière vague d'IA, les applications technologiques dirigées par CV (reconnaissance d'image) étaient davantage des applications ponctuelles, telles que l'appel de facturation API, mais après cela, les entreprises ont commencé à travailler sur des projets et la privatisation le rend difficile de faire des bénéfices. Les grands modèles d'IA connaîtront-ils la même chose à l'avenir ?

Wu Yunsheng : Je suis toujours optimiste. À en juger par le moment actuel, il y aura des défis relativement importants. Mais que vous anticipiez une demi-année ou que vous prévoyiez une demi-année dans le futur, le développement de la technologie est très rapide, y compris la puissance de calcul sous-jacente et les puces GPU. Le grand modèle était autrefois un modèle avec des centaines de milliards de paramètres, mais avec le développement de la technologie, les paramètres du modèle deviennent de plus en plus petits et la capacité est toujours maintenue à un niveau très élevé. Dans le même temps, nous avons fait beaucoup de progrès dans le renforcement de la formation et le renforcement du raisonnement, et le coût baisse rapidement.

D'un autre côté, en termes d'application, nous voyons plus de possibilités, et la tendance de l'application et de la valeur qui peut être générée est en constante augmentation.

**Média : **Que pensez-vous de l'équilibre entre le renforcement des capacités sous-jacentes et la mise en œuvre du scénario ?

Wu Yunsheng : Nous n'avons jamais voulu regarder les grands modèles d'un seul point de vue. Quel que soit le modèle à grande échelle à usage général ou le modèle industriel à grande échelle, les capacités de support sous-jacentes sont nécessaires, y compris une énorme puissance de calcul, des données, etc., qui est la dimension de la force interne. La scène est une autre dimension. Pour résoudre un problème pratique, utilisez 50 % de la résistance interne, les 30 % restants de la résistance externe, et ajoutez encore 20 %. Dans l'écologie du grand modèle, nous examinons le problème sous différents angles. Mais si vous ne parlez que de force interne, il n'y a certainement aucun problème.

**Média :**De nombreux PDG ont mentionné que le grand modèle change la donne pour l'industrie informatique. Maintenant que tous les grands constructeurs lancent des modèles à grande échelle, ce jugement est-il intenable ? Avons-nous besoin d'autant de grands modèles à usage général, ou sont-ils déjà redondants ?

Wu Yunsheng : Découvrez comment définir un changeur de jeu. À ce stade, l'industrie du modèle à grande échelle en est à un stade relativement précoce et de nombreuses possibilités sont nées. Dans le même temps, nous voyons que les grands modèles entraînent des changements technologiques et ont un grand potentiel.

Mon point de vue personnel est qu'il n'est pas nécessaire d'être trop impatient de tirer une conclusion maintenant. J'aimerais voir qu'au stade où une centaine de fleurs fleurissent dans l'industrie, grâce à la combinaison de la technologie et de l'industrie, diverses possibilités sont explorées pour améliorer l'efficacité des industries et des industries.

**Média : **La combinaison du modèle et de l'industrie en est à ses débuts. Quels problèmes existeront à ce stade ? Il existe une opinion selon laquelle, par rapport au modèle à grande échelle à usage général, le coût du modèle industriel à grande échelle n'est peut-être pas optimisé, mais peut être plus élevé. Que pensez-vous de ce point de vue ?

**Wu Yunsheng : **La technologie des grands modèles existe depuis peu de temps et se développe rapidement. La compréhension de l'industrie du grand modèle est encore à un stade précoce - je ne sais pas ce que le grand modèle peut faire et à quel point il peut être combiné avec l'industrie. Il y a en effet des changements dans la relation entre le modèle métier et le modèle de base, ainsi que la question des coûts.

Il existe en effet une opinion selon laquelle si un grand modèle résout tous les problèmes, le coût sera inférieur, et il existe également une opinion selon laquelle pour une certaine industrie, un grand modèle n'est pas nécessaire et un petit modèle suffit.

Cette question ne peut être jugée à partir d'une seule dimension, mais doit être considérée de manière objective et complète. J'ai souligné que les grands modèles généraux peuvent résoudre des problèmes généraux qui ne sont pas étroitement intégrés à l'industrie. Mais si vous voulez aller plus loin, vous devez aller plus loin dans la scène. De nombreux problèmes semblent être les mêmes, mais si vous approfondissez, vous ne résoudrez peut-être pas le même problème. Dans ce cas, cela n'a pas beaucoup de sens de juger du coût de la solution.

Médias : Du point de vue de l'industrie, comment évaluer l'augmentation du marché et le scénario d'augmentation provoqués par le changement technologique à grande échelle sur l'ensemble du marché du cloud computing ?

Wu Yunsheng : On peut voir qu'après l'avènement de l'ère des modèles à grande échelle, la demande de puissance de calcul a été fortement encouragée, en particulier pour la puissance de calcul liée à l'IA. Cependant, en termes de quantification spécifique du cloud computing, il est difficile de donner un chiffre, et il est encore en cours de développement continu.

En termes de scènes, tous les horizons associent désormais de grands modèles, et les scènes sont très riches, comprenant à la fois des scènes générales et des scènes d'industrie. Les scénarios courants incluent des mises à niveau de conférence intelligentes. Le service client Qidian de Tencent et l'analyse Qidian publiée sur 619 font également un travail intelligent. Nous faisons également des assistants de code sur le cloud. En termes d'application universelle et de mise à niveau de l'efficacité, il existe également de nombreuses applications. De plus, chaque industrie a des applications dans diverses industries, ce qui apportera également beaucoup de demande.

Médias : En plus de la scène d'atterrissage des modèles à grande échelle, Tencent fournira-t-il des services à d'autres sociétés de modèles à grande échelle ? Le moteur du volcan indique que 70 % des utilisateurs de modèles à grande échelle se trouvent dans le volcan. Quelles sont les données de Tencent ?

Wu Yunsheng : Nous fournissons une série d'assistance ou de fonctionnalités cloud pour les entreprises licornes ou d'autres solutions modèles à grande échelle. Nous avons publié un HCC informatique hautes performances, une base de données vectorielle et des capacités d'accélération améliorées, qui peuvent être fournies aux fabricants.

Outre les capacités sous-jacentes, nous disposons également d'une solution de réglage fin intégrée basée sur le grand modèle de la plate-forme TI, ainsi que d'une série d'outils, de processus et de support de service.

**Média :**De nombreux fournisseurs de services SaaS se sont accumulés depuis de nombreuses années. Notre MaaS (modèle en tant que service) est-il pour eux ou pour les meilleurs clients du secteur ?

Wu Yunsheng : Ce sont nos clients.

**Médias : combiner ** avec l'industrie est l'approche actuelle de Tencent. Hier, Huawei a établi une alliance, cela signifie-t-il que la concurrence est plus facile pour former un concours entre géants ?

Wu Yunsheng : Je ne vois pas ce problème de cette façon. Je pense que l'ouverture est très importante à l'ère des grands modèles, et tout le monde devrait être ouvert. La technologie sous-jacente change trop rapidement, et la capacité d'extension de la technologie est très large, et il en coûtera beaucoup d'argent pour l'intégrer dans des industries spécifiques. Dans ce cas, seule l'ouverture peut faire ressortir la plus grande valeur.Ce n'est qu'en s'ouvrant et en permettant à davantage d'experts et de personnel de l'industrie de se joindre à divers rôles que l'ensemble de l'écosystème sera plus sain et créera plus de possibilités.

Média : L'ouverture à chaque entreprise est-elle la même ?

Wu Yunsheng : L'ouverture que j'ai mentionnée fait référence au renforcement des capacités et à l'ouverture écologique. Par exemple, construire un grand modèle financier ne nécessite pas qu'une seule personne résume tous les grands modèles financiers : différentes personnes ont une expérience approfondie dans différents domaines, et construire ensemble est une sorte d'ouverture. L'ouverture directe aux clients de l'industrie est aussi une sorte d'ouverture.

De plus, sur la base des capacités fournies par le grand modèle, les partenaires mettent à niveau l'application d'outils d'efficacité ou de solutions sectorielles et combinent différentes formes d'applications. En termes de renforcement de la solidité interne du grand modèle, les partenaires fleurissent, et chacun présente des candidatures différentes, ce qui est aussi une forme d'ouverture.

Voir l'original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Récompense
  • Commentaire
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)