Dialogue avec Ji Xinhua, PDG de Youkede : les grands modèles compétitifs ne se contentent pas de se coucher et de gagner s'ils ont une carte

Auteur| He Sisi

Modifier | Zhang Jin

Source de l'image : générée par l'IA illimitée

"Dans une certaine mesure, l'interdiction de la puissance de calcul aux États-Unis limitera le développement de modèles nationaux à grande échelle, car il n'y a aucun moyen de former des modèles sans puissance de calcul de base." Concernant l'importance de la puissance de calcul pour les grands modèles, Ji Xinhua, président-directeur général d'UKED Dites-le.

Depuis que le grand modèle est devenu populaire en Chine en février de cette année, la puissance de calcul est instantanément devenue le sujet le plus préoccupant de l'industrie, et elle est également devenue un obstacle difficile à surmonter dans la formation nationale sur les grands modèles. En fait, d'un autre point de vue, la croissance explosive de la puissance de calcul a également apporté des opportunités de développement sans précédent aux fournisseurs nationaux de cloud computing.

À cet égard, Ji Xinhua a également accepté. Il a déclaré que la désactivation de la puissance de calcul est une mauvaise chose et une bonne chose. D'une part, si vous voulez résoudre le problème du goulot d'étranglement d'ici un ou deux ans, vous devez accélérer la recherche et le développement de puces domestiques, ce qui n'est pas une tâche facile ; d'autre part, les entreprises accordent de plus en plus d'attention à la puissance de calcul, ce qui favorisera plutôt le développement de puces domestiques.

En tant que fabricant neutre de cloud computing, Youkede a longtemps estimé que derrière la concurrence des grands modèles, le marché de la puissance de calcul inaugurerait d'énormes changements.

"Je suis entré en contact avec Stable Diffusion pour la première fois en novembre de l'année dernière. A cette époque, je pensais que son effet était incroyable, alors j'ai commencé à prêter attention au grand modèle. " Ji Xinhua a expliqué à Leifeng.com pourquoi il avait payé attention au grand modèle. Dans le même temps, il a également révélé que parce qu'à cette époque, les entreprises chinoises n'avaient pas commencé à prêter attention aux modèles à grande échelle, et elles ne savaient pas combien de valeur cela pouvait créer, alors elles ne se sont pas décidés à faire des affaires à grande échelle liées au modèle à l'époque.

L'application réelle des modèles à grande échelle et le service des entreprises de modèles à grande échelle par le Royaume-Uni commenceront en février de cette année, qui est également le moment où les modèles à grande échelle sortent du cercle en Chine.

Leifeng.com a appris que UKED avait d'abord développé quatre produits d'IA à usage interne basés sur le modèle à grande échelle, la plate-forme de questions-réponses de connaissances "Shiwen", la plate-forme d'assistant de code UCoder, la plate-forme d'assistant de peinture AI et le plate-forme de gestion de la sécurité des modèles à grande échelle.Pour un centre de données auto-construit à faible coût et à haute valeur ajoutée, UKED a créé une base de puissance de calcul AIGC, qui fournit de manière flexible une variété de ressources de puissance de calcul GPU pour la formation de grands modèles, le raisonnement , et le traitement des données.

Immédiatement après, UKED a lancé un modèle de machine tout-en-un privatisé à grande échelle, qui intègre la plate-forme de cloud privé à pile complète UCloudStack développée indépendamment par UKED, fournissant des solutions de privatisation pour les modèles de virtualisation, de stockage, de réseau et MaaS, combinés avec Modèles verticaux à grande échelle de l'industrie Les entreprises peuvent déployer de grandes applications de modèles en un seul clic.

Concernant le positionnement d'UKED à l'ère des grands modèles, Ji Xinhua a une nouvelle fois insisté sur le principe de "neutralité". Il a expliqué que la neutralité signifie non seulement que le Royaume-Uni n'a pas de concurrence avec les clients, mais aide également les grandes entreprises de modèles à trouver des clients. À cet égard, Ji Xinhua a également taquiné publiquement qu'à l'ère des grands modèles, ce que Youke doit faire est un "entremetteur".

D'après la réponse de Ji Xinhua, nous pouvons également obtenir indirectement les raisons de la R&D interne d'UKED et de l'application de produits modèles à grande échelle. L'une est que les employés de l'entreprise comprennent les modèles à grande échelle et apprennent à utiliser des modèles à grande échelle. Sur cette base, ils peuvent comprendre en profondeur les modèles à grande échelle, quels sont les points faibles et dans quels scénarios peuvent-ils être mis en œuvre, afin de mieux servir les clients.

En ce qui concerne l'avenir des grands modèles, Ji Xinhua a déclaré qu'il y avait trop d'incertitudes dans l'avenir, mais dans tous les cas, l'industrie Internet ou l'industrie de l'intelligence artificielle a besoin de puissance de calcul. est de construire une base de puissance de calcul à grande échelle.

Ce qui suit est la conversation entre Leifeng.com et Ji Xinhua :

Les grands modèles compétitifs ne se contentent pas de se coucher et de gagner s'ils ont des cartes. Les capacités d'ingénierie sont cruciales pour la formation des modèles.

**Leifeng.com :**Beaucoup de gens disent que seuls quelques fournisseurs de cloud peuvent enfin participer à la compétition des modèles à grande échelle. Tous ne disposent pas de réseaux à haut débit. Selon vous, quels sont les obstacles à la concurrence ?

Ji Xinhua : C'est vrai, les technologies comme les réseaux à haut débit ne sont pas le seuil principal pour les gros modèles concurrents. Y compris Youkede et la plupart des fournisseurs de cloud sont capables de le faire. Désormais, le réseau a deux structures : la première est le réseau RoCE, dont UKED a déjà cette capacité en 2019.

La seconde est la solution réseau IB, recommandée par Nvidia, cette solution est relativement simple et ne demande qu'à être déployée et maintenue. Par conséquent, pour les fournisseurs de cloud ou en particulier les grandes entreprises, la technologie n'est pas le seuil principal.

Leifeng.com : En fait, on dit que de nombreuses grandes entreprises ont commencé à s'approvisionner en cartes ?

** Ji Xinhua ** : Oui, en particulier certains grands fabricants accumulent des cartes, notamment A800, H800, etc. D'une part, sa propre entreprise d'IA doit utiliser des cartes, et avec plus d'investissement en capital, elle achètera un grand nombre de cartes avant ; d'autre part, l'attention nationale à grande échelle sur les grands modèles a commencé en février de cette année, et divers fabricants En raison de l'importance, cela accélérera également la vitesse de thésaurisation des cartes.

Leifeng.com : Cela signifie-t-il que plus vous avez de cartes, plus vous gagnerez ? Comment les autres fournisseurs de cloud rivalisent-ils avec les grands acteurs ?

** Ji Xinhua : ** Je ne me suis pas allongé et j'ai gagné. De nombreuses entreprises de modèles à grande échelle d'IA utilisent maintenant nos cartes. Ce phénomène est très courant.

Il y a plusieurs raisons : premièrement, il ne suffit pas d'utiliser une seule carte, et deuxièmement, pourquoi la grande entreprise de mannequins est-elle prête à coopérer avec Youkede ? C'est parce qu'ils estiment que les grandes usines ont de la puissance de calcul, des algorithmes, des données et des scénarios, et qu'ils s'inquiètent de la concurrence commerciale à la fin lorsqu'ils coopèrent avec de grandes usines. En tant que fournisseur de cloud neutre et sécurisé, Ukerd n'a aucune concurrence avec les grandes entreprises. Dans le même temps, l'UKDE est en mesure de développer des plates-formes de puissance de calcul, des bibliothèques de modèles, etc. à partir du centre de données et de l'architecture sous-jacente, avec une accumulation technique approfondie et des capacités de service d'ingénierie système à guichet unique.

Faites du bon travail au service de la puissance de calcul, et faites du bon travail dans le rôle du grand "entremetteur" de modèle

**Leifeng.com : **Quand Youkede a-t-il commencé à s'intéresser aux grands modèles ?

** Ji Xinhua : ** Le premier contact a eu lieu lors de la fête nationale de l'année dernière. La première chose que j'ai vue a été la diffusion stable. À cette époque, je pensais que son effet était incroyable, alors j'ai commencé à prêter attention au grand modèle, donc nous avons suivi ChatGPT plus tôt.

Leifeng.com : Vous avez donc décidé de faire cela lors de la fête nationale l'année dernière ?

** Ji Xinhua ** : Après la fête nationale de l'année dernière, UKED a fixé l'AIGC comme objectif pour cette année et a publié l'image de la plate-forme de peinture AI en novembre de l'année dernière. En février de cette année, après avoir communiqué avec les principales sociétés de modélisation à grande échelle en Chine, j'ai réalisé que le marché national de la puissance de calcul allait connaître un développement explosif, j'ai donc décidé de le faire fin mars.

Leifeng.com : Combien de clients potentiels y a-t-il dans ces grandes entreprises modèles ?

Ji Xinhua : Nous avons conclu qu'il existe 130 entreprises modèles à grande échelle en Chine, 78 entreprises polyvalentes et 52 entreprises verticales. Et ça ne cesse d'augmenter, plus de 30 d'entre eux sont déjà nos clients.

Leifeng.com : Sous quelle forme le service sera-t-il exporté ?

Ji Xinhua : L'un est notre puissance de calcul et l'autre les services de salle informatique, car certaines entreprises achètent leur propre équipement et l'installent dans notre salle informatique.

Leifeng.com : Comment comprenez-vous le service de salle informatique ? Est-ce parce que le client lui-même n'a pas de capacités opérationnelles ?

Ji Xinhua : L'entreprise elle-même a besoin d'une salle informatique, peu importe où elle se trouve. La salle informatique requise par un grand modèle a deux caractéristiques : la première est qu'elle consomme beaucoup d'énergie, et l'autre est que la consommation d'énergie d'une machine H100 dépasse 10 kW. La salle informatique ne peut pas répondre à cette demande, et le centre de données Ulanqab de Youkede est particulièrement adapté. De plus, de nombreuses entreprises ont aujourd'hui le problème d'avoir des serveurs mais ne peuvent pas les utiliser, Ukerde peut les aider à construire une plate-forme de puissance de calcul et à effectuer les travaux de maintenance ultérieurs.

Leifeng.com : En plus de fournir de la puissance de calcul, Youkede a également sorti "Shiwen" il y a quelque temps ?

** Ji Xinhua ** : UKED a construit quatre plates-formes internes : la plate-forme de questions et réponses de connaissances "Shiwen", la plate-forme d'assistant de code UCoder, la plate-forme d'assistant de peinture AI et la plate-forme de gestion de la sécurité des grands modèles. En fait, avant la "connaissance", la première chose que nous avons faite était le système de gestion des applications de modèle à grande échelle. C'est notre premier produit, et nous espérons que tout le monde pourra utiliser le modèle à grande échelle à l'avenir ;

Deuxièmement, afin de résoudre les problèmes de sécurité commerciale, nous avons mis en place certaines restrictions, y compris vos questions et fichiers téléchargés, nous les enregistrerons et les filtrerons pour éviter que les informations confidentielles de l'entreprise ne soient divulguées sur Internet ;

Troisièmement, pour les problèmes des utilisateurs, y compris les problèmes internes des employés et la communication et les commentaires externes, le système enregistrera automatiquement, afin que l'entreprise puisse continuer à effectuer sa propre formation de modèle à un stade ultérieur.

Leifeng.com : Pourquoi avez-vous créé ces quatre produits ? Peut-il sortir à l'extérieur ?

Ji Xinhua : Tout d'abord, pour que les employés de l'entreprise puissent comprendre et utiliser des modèles à grande échelle. Sur cette base, ils peuvent comprendre en profondeur quels sont les points faibles des entreprises de modèles à grande échelle et dans quels scénarios ils seront mis en œuvre, afin de mieux servir les clients.Fournir des services.

Ces quatre produits sont actuellement utilisés en interne par l'entreprise, mais si les clients en ont besoin, nous pouvons également communiquer davantage.

Leifeng.com : Sur quel modèle ces plates-formes sont-elles basées ?

** Ji Xinhua : ** Entraînez-vous d'abord avec GPT 4, effectuez une vérification du modèle, puis utilisez progressivement de grands modèles nationaux ou de grands modèles open source pour optimiser. À cet égard, j'ai également mentionné un concept appelé « affûter des armes à feu à l'étranger et combattre à la maison ».

Leifeng.com : Pour quels autres scénarios êtes-vous optimiste à l'avenir ?

Ji Xinhua : S'il est distingué en fonction de la tolérance à la nature inexacte du contenu de sortie de ChatGPT, nous avons divisé 10 scénarios.

Le premier est la traduction et le doublage. La capacité dans ce domaine est déjà très élevée et peut remplacer complètement les humains ; le deuxième est le PNJ du jeu ; le troisième est l'interaction sociale ; le quatrième est la sortie de contenu du commerce électronique ; le cinquième est la conception de jeux ; le sixième est le service client ; le septième est l'assistance aux documents et à la programmation ; le huitième est la gestion des connaissances au sein de l'entreprise ; le neuvième est les scénarios d'éducation et d'assurance ; et le dernier est l'assistance aux avocats et aux médecins.

Leifeng.com : Est-ce que ces 10 scènes seront tournées en même temps ? Ou étape par étape ?

Ji Xinhua : Ucar ne fabrique pas de grands modèles, nous nous contentons de mettre en relation des clients et des partenaires, ce qui peut être compris comme le rôle d'"entremetteur". Par exemple, connectez les clients de jeux à MiniMax et connectez les clients des secteurs du commerce électronique et de l'éducation à Zhipu Huazhang.

Il est difficile pour les modèles nationaux à grande échelle de rattraper GPT4, et il y a plus d'opportunités pour les start-up

Leifeng.com : Selon vous, en combien de types de grandes entreprises modèles nationales peuvent-elles être divisées ? Qui sont les principaux clients de Youkede ?

Ji Xinhua : Nous sommes divisés en cinq catégories. La première catégorie regroupe les géants, dont Ali, Baidu, Toutiao, Huawei, JD.com, etc. La deuxième catégorie est lancée par des scientifiques, tels que Zhipu Huazhang ; la troisième catégorie est la société d'IA d'origine, AI Four Tigers, Daguan, Yunzhisheng, 4Paradigm, etc. ; la quatrième catégorie est constituée d'entreprises en démarrage, telles que MiniMax ; La cinquième catégorie est que les sociétés cotées à l'origine sont passées à des modèles à grande échelle, tels que Kunlun, 360, et incluent également des chefs d'entreprise tels que Wang Xiaochuan et Li Kaifu.

Le premier type de grands fabricants ne sont pas les clients cibles de Youkede, et les derniers types sont nos principaux clients.

Leifeng.com : C'est-à-dire que les grandes usines ont la capacité de se construire, mais que les autres entreprises n'ont pas la capacité de se construire ?

Ji Xinhua : Parce qu'il s'agit du domaine de l'intelligence artificielle, il ne s'agit pas seulement d'un problème de réseau, mais également d'une série de problèmes tels que le stockage et les salles informatiques. Par exemple, les start-up peuvent également créer leur propre système informatique. puissance, mais le cycle sera très long. Attendez qu'il le construise lui-même Après cela, la compétition est terminée. La concurrence des grands modèles est une question de vitesse, et celui qui a la vitesse la plus rapide peut occuper les hauteurs dominantes.

Leifeng.com : Pour une grande usine, combien d'étapes et de nœuds y a-t-il pour un grand modèle ?

Ji Xinhua : Le premier est le lancement du grand modèle, et le second est la vérification de l'effet après le lancement. À l'heure actuelle, on sait que des entreprises telles que MiniMax, Zhipu, Baidu, Ali, HKUST Xunfei, etc. ont été lancées.

**Leifeng.com :**Lequel est le meilleur ? Cela dépend-il principalement de la puissance de calcul qu'il utilise ?

Ji Xinhua : Je ne pense pas. Plus de puissance de calcul pour la formation ne produit pas nécessairement un bon modèle, mais si le lien d'inférence est utilisé davantage, cela signifie qu'il y a un grand nombre d'utilisateurs, et plus de retours sera obtenu. Il est propice à la formation d'un bon modèle.

**Leifeng.com :**Peu importe l'entraînement ou le raisonnement, pour construire un grand modèle, il faut d'abord avoir de la puissance de calcul ?

Ji Xinhua : Oui, la première chose est d'avoir une carte. Si vous n'avez pas de carte, vous serez certainement en retard. Environ 40-50 %. Si les deux problèmes ci-dessus sont résolus, c'est un problème de sécurité, et le problème de flux est également très important.

Leifeng.com : Quel est le niveau des modèles nationaux ? Beaucoup de gens disent qu'il rattrapera GPT4 d'ici la fin de cette année.

Ji Xinhua : À l'heure actuelle, aucun modèle ne surpasse le GPT3.5 en Chine. Bien sûr, il est en fait très facile de surpasser le GPT3.5 sous certains aspects. Il est difficile de dépasser GPT4.La clé est que les documents avant GPT3.5 sont publics, mais GPT4 n'a pas encore été rendu public, donc tout le monde ne sait pas quoi faire.

Leifeng.com : Ces grands fabricants nationaux n'ont-ils pas une chance de se rattraper ?

Ji Xinhua : Je pense que l'effet des grandes entreprises n'est pas aussi bon que celui des start-up. Parce que certaines start-up avec des convictions et des idéaux ont déjà commencé à le faire, et Dachang a en fait commencé après avoir vu la popularité de ChatGPT.

Leifeng.com : Il va de soi que les grands fabricants ont accumulé la technologie, alors n'ont-ils pas plus d'opportunités ?

Ji Xinhua : Il existe de nombreuses directions pour l'IA. Dans le passé, la plupart des entreprises pensaient que les modèles verticaux à grande échelle avaient des opportunités, mais ne pensaient pas que les modèles à grande échelle à usage général en avaient. Par conséquent, dans le passé quelques années, ce sont des équipes entrepreneuriales avec conviction et des équipes de recherche scientifique, telles que Zhipu Huazhang, MiniMax, l'Académie chinoise des sciences, etc.

Pour les grands fabricants, il s'agit plutôt de voir que les pays étrangers suivent après cela, et cela n'a pas été à la hauteur de la stratégie de l'entreprise, ils n'ont donc pas beaucoup d'accumulation dans les grands modèles à usage général.

Leifeng.com : Le problème de la puissance de calcul sera résolu tôt ou tard, alors quels sont les avantages d'UKEDe en termes de grands modèles ?

Ji Xinhua : Cela peut se résumer en trois points : Premièrement, maintenir la neutralité et n'avoir aucune relation de concurrence avec les utilisateurs. Deuxièmement, il a la capacité de créer un ensemble complet de solutions AIGC pour les centres de données, les réseaux et le stockage de données, ce qui peut aider les petites et moyennes entreprises à créer rapidement des plates-formes et à résoudre le problème d'efficacité de l'utilisation de grands modèles ; troisièmement, il peut mieux aider les grandes entreprises de modèles à élargir leur clientèle.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)