4 ans de dizaines de milliards de valorisation, TOP 1 de l’entreprenariat de grand modèle national, fabriqué à Tsinghua

Source: Qubits

La grande entreprise de mannequins Zhipu AI a annoncé le montant du financement pour l’année : 2,5 milliards de yuans.

Une telle somme, quel est le concept ? Il a rafraîchi le montant cumulé du financement des startups nationales de grande taille, avec une valorisation de plus de 10 milliards.

Cette entreprise de 4 ans est devenue l’entreprise la plus absorbante d’or et la plus précieuse pour les grands modèles nationaux.

Dans la « deuxième phase de l’IA générative » dans la guerre des 100 modèles, les progrès financiers du leader Zhipu sont-ils aussi la preuve de l’effet Matthew de l’industrie ?

Les entreprises optimistes auront plus de ressources, tandis que les entreprises qui ne prouvent pas leur estime de soi risquent de se déplacer et de manquer la prochaine étape de la course.

Du point de vue des startups, il s’agit plutôt de la fin de la première moitié de l’entrepreneuriat des grands modèles, le tournant du modèle est apparu et le siège écologique a commencé à être clair.

**Pourquoi Wisdom Spectrum ? **

Avant de comprendre pourquoi la centrale de financement des modèles nationaux à grande échelle est un spectre de sagesse, nous devons d’abord en retracer la source et connaître l’origine.

Avant cela, il appartenait probablement à l’état d’être bien connu dans le cercle et inconnu en dehors du cercle.

Zhipu AI, fondée en juin 2019, est transformée avec succès à partir de la technologie du Laboratoire d’ingénierie des connaissances (KEG) du Département d’informatique de l’Université Tsinghua.

Les membres de l’équipe principale sont presque tous de la lignée Tsinghua, parmi eux, le PDG Zhang Peng est diplômé du département d’informatique de l’Université Tsinghua et est un leader de l’innovation 2018 de l’Université Tsinghua avec un doctorat en ingénierie.

Au KEG Lab, l’équipe a principalement étudié comment appliquer l’apprentissage automatique, l’exploration de données, les graphes de connaissances, etc. à la pratique de l’ingénierie, et a commencé à entraîner des modèles d’IA en 2017.

À l’occasion du premier anniversaire de la création de Zhipu, OpenAI a publié GPT-3.

Depuis, l’ensemble de l’entreprise s’est pleinement engagée dans le développement de grands modèles de pré-formation linguistique. Sur la route des grands modèles, OpenAI a choisi GPT, Google a choisi BERT et Zhipu a choisi GLM (General Language Model).

Presque toutes les histoires ultérieures tournaient autour de l’architecture unique de pré-entraînement GLM de Zhipu :

En 2022, Zhipu et Tsinghua ont coopéré pour développer le grand modèle bilingue GLM-130B, d’une valeur de 100 milliards de dollars, en l’utilisant comme base, et ont commencé à construire la plate-forme de grand modèle et la matrice de produits.

En 2023, Zhipu entreprendra des actions très fréquentes, à commencer par le lancement du modèle de dialogue ChatGLM et du modèle de version monocarte open source ChatGLM-6B, suivi du modèle visuel Visual-6B, du modèle de code CodeGeeX2, du modèle mathématique MathGLM, du modèle multimodal CogVLM-17B et du modèle d’agent de la série AgentLM, et tous sont open source.

Le 31 août de cette année, Zhipu Qingyan, un assistant d’IA générative basé sur le modèle de dialogue bilingue chinois-anglais ChatGLM2, est devenu l’un des 11 premiers produits de grand format à entrer dans les foyers des gens ordinaires par le biais du classement.

On peut dire que ces dernières années, l’essentiel de Zhipu dans le domaine des grands modèles est très clair, c’est-à-dire qu’il s’agit d’enfoncer la fondation (modèle de base) d’une main, puis de construire divers bâtiments modaux et fonctionnels sur la fondation.

Il convient de mentionner que Zhipu peut s’appuyer sur des capacités de service de la face B de la période embryonnaire, ce qui correspond à la confiance de l’entreprise face à la réalité acceptée des « grands modèles qui dépensent de l’argent comme de l’eau qui coule », mais aussi qui développent et lancent fréquemment de nouveaux modèles et de nouveaux produits.

Bien sûr, ce n’est pas la seule raison.

En plus des capacités de service et des capacités de revenus qui l’accompagnent, Zhipu dispose également d’une solide équipe de talents et d’une force technique.

Comme mentionné ci-dessus, Zhipu est né de Tsinghua, et ** « Tsinghua Department » est devenu un label prestigieux dans ce domaine **.

La raison en est que le département informatique de Tsinghua s’est consacré à la recherche de grands modèles plus tôt, a une longue expérience à long terme et a cultivé de nombreux talents - les joueurs qui peuvent être appelés sur le marché maintenant, représentés par Zhipu, ainsi que le côté obscur de la lune, la technologie Shenyan, la technologie de première classe, l’intelligence Baichuan, l’intelligence du mur du visage, la technologie Yuanyuan, la technologie Shengshu, etc., sont toutes des lignées Tsinghua.

Le nombre de citations de leurs articles publiés et la capacité vérifiable des modèles publiés sont une preuve forte de ce « label reconnu ».

De plus, selon les informations publiques, Zhipu est la seule entreprise de grande taille financée et développée au niveau national.

Un tel contexte d’entreprise permet à Zhipu d’avoir sa propre préparation et sa propre stratégie dans la discussion et la controverse sans fin de « la sécurité du modèle, de la sécurité des données et de la sécurité du contenu ».

Il est rapporté qu’afin de coopérer avec le développement de GPU nationaux, Zhipu est en train d’atterrir dans le plan d’adaptation de la puce domestique du modèle de langage universel GLM.

Plus précisément, il s’agit de coopérer avec les fabricants nationaux de puces de puissance de calcul pour adapter les algorithmes de modèle et adapter les puces domestiques du côté de l’inférence de l’algorithme, et il existe près de 10 types de puces domestiques qui peuvent être adaptées.

** Après avoir récolté autant d’argent, que faire ensuite ? **

Le bulletin ci-dessus et son caractère unique sont peut-être devenus la principale raison pour laquelle Zhipu a été très optimiste et s’est démarqué tout au long du processus.

Cependant, parce qu’il est très favorable, le spectre de sagesse qui a accumulé suffisamment de capital montre également la détermination à construire une compétitivité à long terme.

Après avoir levé 2,5 milliards de RMB de financement en 10 mois, Zhipu AI a officiellement déclaré :

Le financement ci-dessus sera utilisé pour la poursuite de la recherche et du développement du modèle de base, pour mieux soutenir l’écologie de l’industrie et pour développer rapidement avec des partenaires.

Le noyau se résume à deux aspects :

  • Tout d’abord, rendez-le plus grand, plus fort et plus solide, et la base du grand modèle.
  • La seconde est d’élargir l’écologie et le cercle d’amis.

Il doit y avoir à la fois de la profondeur et de l’ampleur.

**Tout d’abord, rendez la base du modèle plus grande et plus forte, et « développez » davantage le grand modèle de base. **

À l’heure actuelle, le grand modèle que Zhipu considère comme la base est le modèle dense bidirectionnel bilingue GLM-130B sorti en 2021, avec 130 milliards de paramètres.

À cette époque, en raison de nombreuses limitations telles que la technologie, les données et la puissance de calcul, l’entraînement d’un grand modèle avec cette quantité de paramètres était suffisant pour être chauve, mais les résultats étaient remarquables, et le GLM-130B a obtenu de meilleurs résultats que GPT-3 et PaLM.

Cependant, aujourd’hui, la demande induite par les données et la croissance modale, le mastodonte des 130 milliards de paramètres dans le passé semble un peu insuffisante.

Les dernières nouvelles de Qubit sont que ce vendredi (27 octobre), Zhipu aura une nouvelle action - la sortie d’une nouvelle génération de grands modèles de piédestaux. **

Deuxièmement, élargir l’écologie et le cercle d’amis. **

Lorsqu’il s’agit d’actions concrètes, nous ne devrions pas être en mesure de contourner le principe cohérent du spectre de la sagesse : l’open source continu.

Cette société a toujours été l’un des acteurs les plus ouverts dans le domaine des grands modèles, dès l’ère pré-ChatGPT, elle a été transparente et ouverte avec Baidu (ERNIE2.0), Ali (AliceMind), Zhiyuan (Qingyuan CPM), Lanzhou (Mencius Big Model) et d’autres.

En regardant le premier rapport GLM de Zhipu, il y a les mots « Nous invitons tout le monde à rejoindre sa communauté ouverte pour promouvoir le développement de modèles pré-entraînés à grande échelle ». Aujourd’hui, l’entreprise utilise toujours l’open source pour se lier d’amitié avec les développeurs et les utilisateurs de l’industrie.

Cette habitude se poursuit jusqu’à nos jours.

Combiné avec les données actuelles, nous pouvons voir plus clairement l’insistance de Zhipu sur l’open source et quels résultats progressifs ont été obtenus :

Communauté de développeurs, ChatGLM-6B a pris la première place de la liste des tendances quatre semaines après son lancement, avec un total cumulé de plus de 10 millions de téléchargements, et GitHub a accueilli 5w+.

D’autre part, le site officiel de Zhipu a listé ** les partenaires pour construire un environnement écologique, « 69 pays, 1000+ institutions de recherche ». De plus, les qubits ont été vérifiés, avec plus de 1 000 clients et 200 à 300 écosystèmes open source.

Une fois que l’écologie du grand modèle est établie, elle peut mieux intégrer les ressources de la couche de base, de la couche intermédiaire et de la couche d’application du grand modèle, optimiser l’allocation et obtenir l’effet d’une interaction et d’une co-évolution saines.

Parmi eux, le grand modèle de piédestal se classe au cœur de l’écologie du grand modèle en raison de sa fondation et de sa polyvalence. Pour comprendre cela, il n’est pas difficile de comprendre les avantages et la nécessité de Zhipu engagé à élargir l’écologie et le cercle d’amis.

Entrepreneuriat grand modèle, entrer dans un moment décisif

À la fin du mois de novembre dernier, OpenAI a envoyé ChatGPT au monde entier. Immédiatement après, la tendance de la technologie des grands modèles a déclenché vague après vague à une vitesse sans précédent.

Les données intuitives sont étonnantes et la vitesse de présentation est incroyable.

Des centaines de millions d’activités d’utilisateurs, des milliards de revenus, des dizaines de milliards de valorisations... Le grand modèle balaie le monde sans parler de vertu martiale, et tout le monde regarde et explore, pensant à l’étendue des limites de cette technologie d’intelligence artificielle et à la façon dont les produits qu’elle soutient peuvent-ils exercer le pouvoir de la technologie ?

En conséquence, il y a des pionniers tels qu’OpenAI et Anthropic à l’étranger, et il y a des dizaines de milliards de licornes telles que Zhipu AI et MiniMax en Chine.

Le jade perlé est en avance, certains des problèmes techniques et d’ingénierie ne peuvent pas être accélérés et ignorés, puis la gamme d’étoiles, puis le financement astronomique, tant que vous prenez la route des grands modèles, vous devez en faire l’expérience vous-même.

Le défi est de taille, mais les challengers sont heureux de faire de même.

La source : Séquoia

Aujourd’hui, près d’un an plus tard, nous assistons au développement de la technologie des grands modèles et à la façon dont l’innovation et la concurrence façonnent le domaine.

Ce que l’on peut voir plus clairement, c’est que le géant a terminé l’emplacement initial de la carte, que la start-up a commencé à mélanger les cartes et que le modèle de la première étape est apparu. **

C’est vrai, une entreprise ne peut pas tout faire dans les limites des capacités du grand modèle, mais les billets pour le grand modèle général sont si limités, et les joueurs qui n’ont pas la capacité de l’obtenir commencent à se détourner : soit aller à la spéciale et faire le modèle de l’industrie ; Soit on abandonne la couche modèle pour créer une entreprise, on commence à se tenir sur les épaules d’autres modèles, et on passe à la couche intermédiaire, la couche applicative...

L’entrepreneuriat des grands modèles entre dans un moment décisif.

Désormais, les progrès en matière de financement des startups de grande taille risquent de s’accumuler de plus en plus qu’ils ne le sont aujourd’hui. Des centaines de millions de dollars continueront d’être amassés dans des entreprises « pas moins d’argent ».

L’effet Matthew s’intensifie dans l’industrie. Le montant total du capital est limité, plus l’entreprise aura de la valeur, plus elle sera belle, et le meilleur et le plus de ressources seront envoyés au cheval ayant le plus de potentiel.

Sur le marché des capitaux, le seul inconvénient des entreprises chères est qu’elles sont chères, et le seul avantage des entreprises bon marché est qu’elles sont bon marché.

La première moitié de l’entrepreneuriat des grands modèles touche à sa fin.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)