La « vérité » de la mêlée de modèles à grande échelle d'IA : les investisseurs voient plus et investissent moins, 20 entreprises n'ont reçu que 6 milliards de yuans de financement

Source : Technologie Sohu

Auteur : Liang Changjun

Editeur : Yang Jin

Figure : Lors de la Conférence mondiale sur l'intelligence artificielle de 2023, de nombreuses entreprises ont présenté des produits et des applications de modèles d'IA à grande échelle

"Regardez plus, votez moins", "l'ambiance d'attente et d'observation est relativement forte". Parler de l'attitude des institutions d'investissement envers l'entrepreneuriat modèle à grande échelle de l'IA cette année, c'est le sentiment de certains investisseurs et entrepreneurs nationaux.

Mais dans l'industrie, les grands modèles d'IA sont toujours populaires. Lors de la conférence mondiale sur l'intelligence artificielle qui vient de s'achever, plus de 30 modèles à grande échelle ont collectivement montré leurs muscles. Les sociétés Internet nationales et de nombreuses sociétés d'intelligence artificielle se sont lancées dans la course aux modèles à grande échelle, et la bataille des 100 modèles a déjà commencé .

Sur le marché du capital-risque, de grands noms tels que Wang Huiwen, Wang Xiaochuan et Li Kaifu sont entrés sur le marché les uns après les autres, appelant à être l'OpenAI chinois, à être le meilleur modèle à grande échelle en Chine, etc., devenant un important force dans cette vague de modèles d'IA à grande échelle.

Selon les statistiques incomplètes de Sohu Technology, au cours du premier semestre de cette année, au moins 20 entreprises de mannequins à grande échelle ont reçu plus de 6 milliards de yuans de financement. D'un point de vue mondial, le nombre de financements connexes dépasse les 50, et la Chine et les États-Unis arrivent en tête, avec plus de 20 chacun, portant sur un total de 100 milliards de yuans.

Bien que le nombre de transactions nationales soit relativement important, le montant ne représente que 6% du monde, les investisseurs nationaux ne sont pas généreux et le marché de l'investissement des grands modèles d'IA est un peu désert.

Dans le même temps, toutes les parties ne sont pas parvenues à un consensus sur la valeur entrepreneuriale des grands modèles. Zhu Xiaohu, l'associé directeur de GSR Ventures, et Fu Sheng, le président de Cheetah Mobile, se sont disputés plus tôt.

Cheng Hao, le fondateur de Yuanwang Capital et Xunlei, a estimé qu'il n'y aura pas plus de 10 modèles polyvalents dans le monde et qu'il y a peu d'opportunités pour l'entrepreneuriat. Cela est fondamentalement devenu un consensus dans le cercle des investisseurs.Le PDG de Baidu, Robin Li, a également déclaré auparavant qu'il n'était pas nécessaire de réinventer la roue.

Mais de nombreux entrepreneurs ont du mal à s'entendre. Wang Xiaochuan estime que les start-up doivent avoir des opportunités, et sans le fardeau et une plus grande pression commerciale, elles fonctionneront plus rapidement que les grandes entreprises.

Li Wei, vice-président de l'ingénierie et scientifique en chef de Going out to ask, a déclaré à Sohu Technology qu'il est peu probable que les grands fabricants monopolisent les grands modèles à usage général. "De nombreuses startups ont lancé de grands modèles, prouvant que ce sujet n'est plus un gros problème."

Malgré les différences, il existe un consensus sur le fait que l'application sera la clé. De l'attente de savoir s'il faut le faire, à l'entrée de joueurs de tous horizons, le grand modèle est parvenu au stade de répondre à la manière de le mettre en œuvre. Qu'il s'agisse d'une grande usine ou d'une start-up, il s'agit d'une feuille de réponses incontournable.

Le boss a son auréole quand il entre dans le jeu, qui investit dans le gros modèle ?

ChatGPT est né, déclenchant l'apogée du grand modèle de la troisième vague d'IA, et un groupe de gros bonnets a lancé sa propre entreprise. Selon les statistiques incomplètes de Sohu Technology, au cours du premier semestre de cette année, au moins 20 grandes entreprises ont obtenu un financement, et la plupart d'entre elles étaient dans le premier tour des investisseurs providentiels ou A.

Ces entrepreneurs ont essentiellement leur propre auréole, notamment Kai-fu Lee, Wang Huiwen, Wang Xiaochuan, Li Zhifei, Zhou Bowen, etc., qui ont des antécédents d'entrepreneuriat ou à grande échelle, ainsi que des recrues universitaires telles que l'Université Tsinghua, le National People's Congrès et West Lake University, parmi lesquels l'Université Tsinghua est particulièrement typique.Les professeurs de Tsinghua soutiennent Shengshu Technology, Shenyan Technology, Dark Side of the Moon, Qingmao Intelligence, Face Wall Intelligence et Lingxin Intelligence.

Figure : Entreprises modèles d'IA à grande échelle qui ont publiquement obtenu un financement au cours du premier semestre de cette année Source : informations publiques, Tianyancha

Du point de vue des investisseurs, il n'y a pas seulement des capitaux industriels tels que Tencent, Baidu Ventures, Ant Group et TAL, mais aussi des capitaux à risque tels que Sequoia, IDG, ZhenFund, Sinovation Ventures, Qiming Ventures, Matrix Partners et Qiji Ventures. jeter. Sequoia est le plus actif, avec au moins 5 clichés, dont Light Years Beyond, Shenyan Technology, The Dark Side of the Moon et Project AI 2.0, tandis que Tencent a investi dans Light Years Beyond, MiniMax et Shenyan Technology.

En termes d'échelle de financement, le financement total divulgué par les projets dans ces statistiques dépasse 6 milliards de yuans. Selon des données publiques, au premier semestre de cette année, il y a eu 51 financements d'entreprises impliquant de grands modèles d'IA dans le monde, avec un montant d'investissement et de financement supérieur à 100 milliards de yuans, c'est-à-dire que le nombre de transactions nationales a représenté près de 40 % , mais le montant du financement n'était que d'environ 6 %.

Plusieurs transactions à grande échelle sur le marché américain représentaient la majorité, y compris l'investissement de 10 milliards de dollars de Microsoft dans OpenAI, Bill Gates, Microsoft, Nvidia, etc. ont conduit l'investissement de 1,3 milliard de dollars dans Inflection AI, et la société de données américaine Databricks a acquis MosaicML pour 1,3 milliard de dollars. Ces trois transactions représentaient à elles seules environ 90 % du total mondial.

Cela montre également dans une certaine mesure que, bien que les modèles nationaux à grande échelle soient fortement impliqués et que les stocks de concepts sur le marché des capitaux aient doublé et explosé, les investisseurs sur le marché primaire sont encore relativement prudents, en particulier dans les transactions de grande valeur.

Qu Kai, le fondateur de Chapter 42, qui est engagé dans des activités de capital-risque FA, a révélé que presque tous les fonds en dollars américains envisagent actuellement l'IA, et certains fonds en RMB sont également intéressés. "Beaucoup d'institutions sont très positives, mais au final il n'y en a pas beaucoup qui vont bouger. Il y en aura probablement cinquante ou soixante."

Li Wei, vice-président de l'ingénierie et scientifique en chef, peut également sentir que la communauté des investisseurs est en fait très préoccupée et aime les grands modèles, mais elle est également très prudente. "Après tout, il s'agit d'une nouvelle direction technologique avec un investissement important, mais le modèle commercial n'est actuellement pas clair."

Guo Tao, un investisseur providentiel et un expert senior en intelligence artificielle, a analysé Sohu Technology et a déclaré que de plus en plus d'institutions d'investissement ont réalisé que les grands modèles d'IA font face à de gros investissements, à de longues périodes de récupération, à de faibles taux de réussite, à une concurrence féroce dans l'industrie, et des réglementations de plus en plus strictes.Et d'autres problèmes, donc le tir a tendance à être prudent, et l'attentisme actuel est relativement fort.

Dans le même temps, Guo Tao estime qu'il n'y a pas beaucoup d'entreprises d'IA à grande échelle dans lesquelles il vaut la peine d'investir à l'heure actuelle.La plupart des entreprises en démarrage n'ont presque aucun avantage significatif en matière de technologie, de données et d'écologie.

En outre, les valorisations de nombreuses entreprises vedettes prometteuses sont trop chères, généralement à des années-lumière.En seulement trois mois, la valorisation est passée de 200 millions de dollars américains à 1 milliard de dollars américains, et de nombreuses institutions sont découragées. La fin de cette entreprise est également assez embarrassante : Meituan de Wang Xing a « sauvé » ses frères et investisseurs avec plus de 2 milliards de yuans, et Wang Huiwen est parti prématurément pour cause de maladie.

Poursuivre la préférence d'investissement Internet et commencer à se battre une fois la fièvre retombée

En termes de direction d'investissement spécifique des grands modèles d'IA, les institutions d'investissement ont presque continué les préférences de l'ère de l'investissement Internet, et la couche d'application est la plus populaire. Cheng Hao a déclaré que Yuanwang Capital investit principalement dans des sociétés de middleware et de couches applicatives.

Selon les données divulguées par Qu Kai, parmi les projets d'IA qui ont reçu de l'argent cette année, 10 % à 20 % concernent des modèles, 20 % à 30 % concernent des couches infra/intermédiaires et 60 % à 70 % sont pour les couches d'application. . Si vous ne comptez pas les projets qui obtiennent de l'argent, les projets qui font des demandes peuvent atteindre 95 %.

De l'infra sous-jacente (telle que les puces, les cadres et autres infrastructures) à la couche de modèle, au middleware et à diverses applications, l'industrie des modèles à grande échelle d'IA a également formé une structure pyramidale inversée similaire à l'industrie des puces. Dans le cas où la couche inférieure repose sur une technologie open source étrangère et est difficile à percer, la plupart des startups nationales parient sur la couche application, et la couche modèle à coût élevé n'est qu'un jeu pour quelques entreprises.

Li Wei pense que les start-ups font principalement des modèles de base à grande échelle et des applications en aval de modèles à grande échelle, et qu'il n'est ni réaliste ni nécessaire de créer des modèles de base à grande échelle. "Par conséquent, de nombreuses start-ups ont tendance à postuler dans des scénarios verticaux. Au moyen d'appels d'API ou de déploiement de privatisation OEM, elles s'appuieront sur les grands services de modèles de grands fournisseurs de modèles pour se concentrer sur la recherche et le développement innovants de données et d'applications. être une direction relativement claire."

Cependant, cette vague d'engouement pour les gros modèles semble avoir commencé à se calmer.L'exemple souvent cité est le pic de trafic ChatGPT. Selon les données du site Web tiers SimilarWeb, le trafic mondial du site Web et du client mobile de ChatGPT a diminué de 9,7 % d'un mois sur l'autre en juin de cette année, la première baisse depuis la fin de l'année dernière, et le temps passé par le nombre de visiteurs sur le site Web a également diminué de 8,5 %. En outre, le trafic de sites Web tels que Microsoft Bing et Character.AI a également diminué à des degrés divers en juin.

"Le marché s'est refroidi au cours des un ou deux derniers mois, car les changements qualitatifs des grands modèles ont récemment diminué, et il y a moins de nouveaux entrepreneurs et de nouvelles histoires à raconter qu'au début de l'année. Mais chaque piste et hotspot a ses propres avantages et inconvénients. Fu, c'est normal. ", A déclaré Qu Kai.

Il estime que dans la prochaine étape du grand modèle d'IA, nous devons travailler dur pour le mettre en œuvre. La prochaine vague de points chauds sera probablement deux ou trois mois plus tard. Pour un grand nombre de projets qui ont reçu de l'argent au premier semestre de l'année, il faudra quelques mois pour achever le lancement du produit. Voyez s'il y a plus et de meilleures applications qui tuent, et voyez qui sera le leader de la couche d'application.

En fait, les grands fabricants s'efforcent actuellement d'obtenir l'atterrissage et l'application commerciale de grands modèles. Lorsque Huawei a récemment publié Pangu 3.0, il a déclaré qu'il espérait l'utiliser pour aider tous les horizons, plutôt que de se concentrer sur le niveau du modèle vocal. "Nous sommes tellement occupés à faire des choses que nous n'avons pas le temps pour la poésie."

Guo Tao estime que bien que le modèle d'IA se soit refroidi, il durera environ un an dans son ensemble et l'accent passera progressivement du niveau technologique sous-jacent au niveau de l'application verticale.

Li Di, PDG de Xiaoice, a jugé que l'homogénéisation des grands modèles est sérieuse maintenant, et qu'il n'y a pas besoin d'autant de grands modèles sur le marché. La fièvre devrait s'apaiser en 2024, et on constate que qui est sur le rivage et qui nage nu.

Aucune chance pour le modèle général ? L'homogénéisation de la voie verticale est sérieuse

Pour les entrepreneurs, comment réfléchir à la direction avant d'entrer sur le marché est extrêmement critique. Zhu Xiaohu a déclaré que ChatGPT est très hostile aux start-up et qu'il abandonnera ses fantasmes de financement dans les deux à trois prochaines années. Fu Sheng s'en est plaint en disant : « Nos investisseurs sont ignorants et ceux qui n'ont peur de rien.

Plus tard, Zhu Xiaohu a expliqué qu'il n'avait pas nié les opportunités entrepreneuriales dans le domaine des modèles à grande échelle, mais a rappelé aux entrepreneurs de ne pas être superstitieux à propos des modèles à grande échelle à usage général. "Pour la plupart des entrepreneurs, les scénarios sont la priorité, et les données sont reines."

Ce point de vue est essentiellement devenu le consensus du cercle actuel des investisseurs nationaux. Guo Tao estime que les modèles à grande échelle à usage général formeront une certaine situation de monopole, et les entrepreneurs et les "petites usines" seront désavantagés en termes de capital, de technologie, de données et d'écologie lorsqu'ils déploieront des modèles à grande échelle à usage général. .

"Le fossé du modèle à grande échelle à usage général est très élevé, et son effet de réseau est également fort. Les commentaires des utilisateurs le rendront de plus en plus intelligent, et l'entreprise qui le fabrique en premier aura un avantage de premier arrivé. " Cheng Hao estime également qu'il n'y a aucune chance pour les start-ups de fabriquer un modèle à grande échelle à usage général.Les grandes, seules les grandes usines peuvent se le permettre.

Dans le même temps, il estime que le modèle de base général ne nécessitera pas autant d'entreprises à l'avenir. "Peut-être qu'il n'y aura pas plus de 10 modèles à usage général à source fermée et à source ouverte qui pourront être utilisés dans le monde à l'avenir, ce qui est trop."

Mais de nombreux entrepreneurs ne sont pas d'accord. "De nombreuses start-up ont lancé des modèles à grande échelle, prouvant que ce n'est pas un gros problème. Si vous voulez atteindre le niveau de GPT-4, c'est aussi très difficile pour les grands fabricants, et il semble impossible de le monopoliser. maintenant." dit Li Wei.

Il pense que même si les entreprises en démarrage ne peuvent pas rivaliser avec les fabricants à grande échelle en termes de ressources matérielles et de force d'ingénierie, leurs avantages sont qu'elles sont plus terre-à-terre, ont une voie d'atterrissage globale ou une demande de produits, et ne font pas les grands modèles pour les grands modèles.

"Le grand modèle de base n'est pas monolithique, et il y a de la place pour l'expansion. Les startups peuvent commencer avec un modèle d'un milliard ou dix milliards, puis décider de continuer à développer un modèle de 100 milliards en fonction de leurs propres besoins et suivre- des ressources.", a déclaré Li Wei.

De nombreuses entreprises en démarrage suivent cette voie lorsqu'elles fabriquent des modèles à grande échelle. Par exemple, Baichuan Intelligence a d'abord lancé un modèle de 7 milliards de paramètres et continue de former un modèle de 50 milliards de paramètres.En gros, aucune start-up ne choisit de créer un grand modèle avec 100 milliards de paramètres.

Selon Li Wei, la taille du modèle n'est pas le seul indicateur, et le scénario d'application est également une dimension de référence importante. "Pour la plupart des applications, un modèle à très grande échelle est comme un canon frappant un moustique. Non seulement cela prend beaucoup de temps à déduire, mais cela coûte cher, et il est difficile à appliquer et à déployer, et cela ne fait pas beaucoup de sens en termes d'effet réel."

Par conséquent, Li Wei estime que la concurrence aveugle pour la perfection ne devrait pas être le courant dominant de la R&D et de l'innovation des modèles à grande échelle.C'est une concurrence plus significative et plus saine pour promouvoir les modèles à grande échelle pour qu'ils soient légers et verticalisés.

Cheng Hao pense qu'à l'avenir, de nombreuses petites et moyennes entreprises auront leurs propres modèles verticaux et que les startups auront davantage d'opportunités de développer des applications ou des chaînes d'outils sur la voie verticale. "La plupart des institutions d'investissement étudient toujours la voie des industries verticales, comme Wang Xiaochuan et Wang Huiwen, dans une large mesure, elles parient sur les gens, pas sur la fabrication de modèles à grande échelle à usage général."

Cependant, le choix du tracé technique de la voie verticale se heurte également à de nombreux défis. Li Wei a dit franchement que la mise en œuvre à grande échelle de modèles à grande échelle dans le champ vertical sera plus difficile qu'on ne l'imaginait.

Il estime que l'un des défis actuels est que les changements sont trop rapides et fulgurants. Il est difficile pour les start-up de se connecter et de sélectionner des fournisseurs à grande échelle. La plupart des modèles à grande échelle n'ont pas encore produit de services matures et applicables. , et l'amont et l'aval ne peuvent pas être transparents. Le problème de l'amarrage et de la correspondance.

Dans le même temps, des problèmes subsistent tels que l'homogénéité technique et l'inter-laminage commercial. "Encourager la concurrence technologique et le développement différencié de modèles, coordonner la coopération commerciale et réduire l'inter-implication des entreprises sont les directions que les entreprises technologiques et les communautés devraient travailler ensemble", a lancé Li Wei.

Voir l'original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Récompense
  • Commentaire
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)