Des fonds "en volume" pour capter les talents, comprendre le paysage concurrentiel des modèles nationaux d'IA à grande échelle dans un article

Source originale : Titanium Media

Monteur : Liu Yaning, Sun Cheng

Source de l'image : générée par l'IA illimitée‌

Le 29 juin, Meituan a publié une annonce à la Bourse de Hong Kong, annonçant l'acquisition de la société de modèles à grande échelle "Light Years Beyond" fondée par Wang Huiwen, qui a également laissé spéculer sur le marché des modèles à grande échelle de l'IA. Non seulement en Chine, le nombre de visites sur ChatGPT a récemment diminué.Selon les données, les visites mondiales de ChatGPT en juin ont chuté de 9,7 % d'un mois sur l'autre, et le nombre de visiteurs uniques a chuté de 5,7 % d'un mois sur l'autre. En outre, la durée d'utilisation de ChatGPT est également en baisse.La durée de chaque visite a diminué de 8,5 % en mai. L'AIGC semble avoir inauguré une période de réflexion.

Mais d'autre part, le 4 juillet, la société de modèles à grande échelle "Zero One Creation" organisée par Kai-Fu Lee lui-même a été officiellement lancée, et le modèle de langage à grande échelle "Wen Xin Yi Yan" APP développé par Baidu a été lancé sur l'Apple App Market, et l'éditeur de chèques d'entreprise chèque Grand modèle - "Knowing the Enemy Alpha"... Diverses entreprises font des mouvements fréquents dans le domaine des grands modèles, et ils battent leur plein.

À quel point le marché des gros modèles d'IA est-il en vogue ? Quelle est la structure d'investissement du marché des capitaux pour ce point de vente ? Quelles sont les performances des modèles domestiques à grande échelle d'aujourd'hui ? Ce numéro de Titanium Media·Tidu Tuwen tente de faire le tri entre l'état actuel du développement des modèles nationaux à grande échelle et ce, au niveau des données.

** Les géants de la technologie de "combat de fées" de modèles nationaux à grande échelle d'IA s'affrontent pour tirer **

Depuis mars de cette année, les modèles d'IA nationaux ont poussé comme des champignons après la pluie. Le « China Artificial Intelligence Large Model Map Research Report » montre qu'à la fin du mois de mai 2023, au moins 79 grands modèles nationaux de base avec une échelle de paramètres de 1 milliard ou plus ont été publiés.

D'un point de vue mondial, les États-Unis se classent au premier rang pour le nombre de modèles à grande échelle dans le monde.Dès 2020, les États-Unis ont lancé 15 modèles à grande échelle, dont le GPT-3. En Chine, les modèles à grande échelle sont également entrés dans une phase de développement rapide à partir de 2020. En 2021, 30 modèles à grande échelle seront lancés, 28 modèles à grande échelle seront lancés en 2022 et 19 modèles à grande échelle seront lancés. être lancé au cours des cinq premiers mois de 2023, dépassant les 18 modèles à grande échelle aux États-Unis. Aujourd'hui, le nombre de modèles à grande échelle en Chine et aux États-Unis représente près de 90 % du nombre total de modèles à grande échelle dans le monde, et le nombre de modèles à grande échelle en Chine est entré dans le premier échelon.

La piste de modèles nationaux à grande échelle est très animée, et les "acteurs" impliqués dans la piste de modèles à grande échelle AI comprennent des sociétés Internet représentées par Ali, Tencent, Baidu, etc. Le 16 mars, Baidu a ouvert la voie et a lancé la version chinoise de ChatGPT "文心一言". Par la suite, de grands modèles tels que Ali, Huawei, Tencent et 360 ont fait surface les uns après les autres.

En outre, il existe des sociétés de technologie d'IA représentées par SenseTime et iFLYTEK, des sociétés d'éducation comme Kidswant, des sociétés financières comme Flush et des sociétés immobilières telles que I Love My Home. De plus, les grands modèles sont également très populaires dans le milieu universitaire.Dès février de cette année, l'Université de Fudan a lancé MOSS, le premier modèle de type ChatGPT en Chine.

Il convient de noter qu'avec la popularité de ChatGPT, il y a également eu un boom de l'entrepreneuriat à grande échelle en IA en Chine.De nombreux leaders technologiques et dirigeants de grandes entreprises se sont consacrés à des modèles à grande échelle et ont commencé à se réentreprendre.

En février 2023, Wang Huiwen, l'ancien co-fondateur de Meituan, a publié la "AI Hero List", une entrée très médiatisée dans le grand modèle de l'IA ; une autre entrée très médiatisée était Li Kaifu, PDG de Sinovation Le 19 mars, Li Kaifu a annoncé dans le cercle d'amis avoir créé la société Project AI 2.0 et est entré dans le modèle à grande échelle de l'IA ; par la suite, le fondateur de Sogou Wang Xiaochuan, l'ancien pionnier des affaires JD.com AI Zhou Bowen et Momenwen Le PDG Li Zhifei a également rejoint le boom entrepreneurial du modèle à grande échelle de l'IA.

Outre ces géants de la technologie, de nombreux dirigeants de grandes entreprises de l'Internet ont également rejoint la compétition. Par exemple, Li Yan, une ancienne figure centrale de l'IA de Kuaishou, a créé la société d'IA Yuanshi Technology pour mener des recherches et le développement de grands modèles multimodaux ; le "disciple fermé" de Li Kaifu et No. Reshape the model of human de Yitu Technology. - interaction informatique. Aujourd'hui, le "combat de fées" à grande échelle de l'IA domestique, la piste de l'industrie est très animée.

Les institutions d'investissement sont prudentes, et le marché recrute des talents dans le domaine des grands mannequins aux hauts salaires

Pour entrer dans le grand modèle, vous devez d'abord préparer de l'argent.Après tout, une grande entreprise de démarrage de modèles publie un modèle relativement mature, qui doit investir dans le coût d'une infrastructure de modèles de langage, de formations et de talents en R&D. Pour les start-up, le financement est le seul moyen de survivre.

Selon les statistiques incomplètes de Titanium Media·Tidu Tuwen, au 4 juillet 2023, le montant du financement des startups à grande échelle de l'IA qui ont obtenu un financement cette année se situe généralement entre des dizaines de millions et des centaines de millions. Parmi eux, MiniMax, une start-up modèle à grande échelle qui a reçu le plus gros montant de financement, a conclu une nouvelle ronde de financement de plus de 250 millions de dollars américains le 1er juin. La valorisation actuelle de l'entreprise dépasse 1,2 milliard de dollars américains, et il a été surnommé "Premier investissement de Tencent." Titre d'entrepreneuriat.

De plus, Light Years, qui vient d'être acquise par Meituan, a finalisé son tour de financement A de 230 millions de dollars US le 5 juin, mais ce tour de financement a également été intégralement remboursé après la finalisation de l'acquisition par Meituan. Il convient de mentionner que Xihu Xinchen, créée en 2021, a réalisé deux financements consécutifs en mars et avril de cette année, et la vitesse de financement est très rapide.

Dans l'investissement à grande échelle dans les modèles d'IA, les principaux VC tels que IDG Capital, Matrix Partners et ZhenFund ont fait moins de mouvements.

Selon les statistiques incomplètes de Titanium Media et Titanium News, Tencent Investment, Innovation Works, Qiji Chuangtan et Sequoia China sont les institutions d'investissement les plus actives, avec trois sociétés d'investissement, suivies de BV Baidu Ventures et Zhipu AI, les sociétés d'investissement sont respectivement 2 , et la plupart des institutions n'investissent que dans une seule entreprise, et Hillhouse Venture Capital et Shenzhen Venture Capital, qui ont toujours été actifs, ne disposent d'aucune donnée publique montrant qu'ils ont investi dans des pistes de modèles d'IA à grande échelle. La piste de l'entrepreneuriat modèle à grande échelle est plus prudente.

Outre le financement, les capacités techniques sont également au cœur de la compétition de modèles à grande échelle. Les grands modèles ont des exigences élevées en matière d'algorithmes, de puissance de calcul et de données. Les grands modèles d'IA nécessitent des coûts de formation élevés et des investissements en R & D. Certaines grandes sociétés Internet et sociétés de technologie ont des réserves de capital et techniques plus importantes.

Selon les statistiques incomplètes de Titanium Media·Tidu Tuwen, en 2022, Huawei investira 161,5 milliards de yuans dans les dépenses de R&D, devenant ainsi l'entreprise avec le plus de fonds d'investissement en R&D ; deuxièmement, Tencent se classe deuxième avec 61,4 milliards de yuans et Ali avec 55,5 milliards de yuans tiers. Les géants de l'Internet investissent chaque année des dizaines de milliards dans la R & D. De plus, ils disposent également d'une solide équipe de R & D. Ce sont des acteurs de « premier échelon » bien mérités sur la piste des modèles à grande échelle.

En plus du capital et de la technologie, le talent est également un élément indispensable de la compétition de modèles à grande échelle.

Au premier trimestre de cette année, diverses entreprises ont lancé un concours pour les meilleurs talents en IA. Wang Huiwen a déclaré qu'il utiliserait 75 % des actions pour inviter les meilleurs talents de R&D. Li Kaifu a appelé au recrutement de talents de classe mondiale dans le monde entier. Baidu a recruté des ingénieurs d'algorithmes de modèles à grande échelle d'IA avec un salaire de 25 à 40 000 /mois, et a recruté un ingénieur en architecture de modèles avec un salaire de 20 à 40 k/mois ; Ali recrute des ingénieurs en formation de modèles et en algorithmes à grande échelle avec un salaire de 40 à 70 k/mois, et les grandes entreprises sont avides de talents.

Les données pertinentes montrent qu'au premier trimestre de cette année, le nombre de postes liés aux grands modèles d'IA a augmenté de 10,16 % d'une année sur l'autre, ce qui est le domaine avec la plus forte croissance liée à ChatGPT. Parmi eux, le salaire annuel médian d'ingénieurs en apprentissage automatique et en algorithmes a atteint plus de 400 000 yuans. .

Les défis du développement de modèles à grande échelle fabriqués en Chine ont encore des domaines qui surpassent les modèles internationaux

Au cours des six derniers mois, de grands modèles sont sortis les uns après les autres, quelle est leur force actuelle ? Selon l'évaluation de 10 modèles d'IA à grande échelle dans le pays et à l'étranger par les institutions concernées, ChatGPT a une longueur d'avance relativement évidente dans l'ensemble, se classant au premier rang en termes de données complètes. En termes de sous-secteurs, le modèle national à grande échelle surpasse le modèle étranger en termes de compréhension des mots et des phrases et de questions de connaissance, c'est-à-dire que le modèle national à grande échelle de l'IA a une cognition de base et une capacité d'apprentissage du texte plus fortes.

Parmi les six modèles nationaux à grande échelle, les performances complètes des données de "Wen Xin Yi Yan" sont relativement excellentes, en particulier en tête des modèles nationaux de grande langue en termes de compréhension de mots et de phrases, de programmation, de questions de connaissances et de traduction ; en termes d'activité écrit, les produits nationaux sont les plus performants Le meilleur est "Xunfei Xinghuo" ; en termes de questions littéraires, le produit national "Tiangong 3.5" a le taux de score le plus élevé de 88,33 %, ce qui est à égalité avec ChatGPT ; en termes de raisonnement logique, "Wenxinyiyan" et "Xunfei "Spark" se sont plutôt bien comportés.

Les modèles nationaux à grande échelle fonctionnent très bien dans certains domaines subdivisés, mais il existe encore un certain écart avec les produits étrangers du même type, et il reste encore beaucoup à faire pour améliorer les technologies de base telles que les données et les scénarios d'atterrissage.

Au niveau des données, le développement de grands modèles nécessite des ensembles de données de formation de haute qualité. À l'heure actuelle, la quantité totale de données chinoises requises pour la formation de modèles à grande échelle basée sur la sémantique chinoise en Chine est insuffisante et la qualité n'est pas élevée.La rareté du corpus de formation de modèles chinois à grande échelle de haute qualité creuse également l'écart.

En termes de puissance de calcul, basée sur la capacité des centres de données, les entreprises leaders dans ce domaine en 2022 sont Google, Microsoft, Amazon et Meta.Ces quatre plates-formes de centres de données représentent plus de 70 % de la capacité totale des données auto-construites. centres de données dans le monde; et À l'heure actuelle, bien que certaines entreprises technologiques de premier plan telles qu'Alibaba, Baidu et Tencent aient achevé la construction de centres de données en Chine, il existe encore un certain écart en termes de capacité par rapport aux pays étrangers.

En termes de scénarios d'atterrissage, le coût d'atterrissage dans différents scénarios de subdivision est également un problème. Afin d'obtenir un grand modèle suffisamment efficace et facile à utiliser, un corpus suffisant et ciblé doit être investi, ce qui signifie que la mise en œuvre de différents scénarios de subdivision nécessite un investissement important en termes de coûts.

On estime que le coût de la formation d'un grand modèle se situe entre 2 et 12 millions de dollars US. En raison des coûts de formation élevés, la société de développement d'intelligence artificielle OpenAI perdra environ 540 millions de dollars américains en 2022. Par conséquent, la réalisation commerciale de grands modèles d'IA prendra du temps.

Sur cette piste très compétitive, même si les difficultés sont nombreuses, les gros modèles domestiques évoluent vers une direction technique plus parfaite. En outre, la concurrence sur la piste accélérera également le rythme de développement de la technologie des modèles nationaux à grande échelle et favorisera la modernisation technologique globale de l'industrie chinoise de l'IA.

*Source des données : Structure Research, InfoQ Research Center, Liepin Big Data, "China Artificial Intelligence Large Model Map Research Report" et d'autres informations publiques ne sont pas complètement compilées.

Voir l'original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Récompense
  • Commentaire
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)