Quel est le plus grand obstacle au développement de l’intelligence artificielle ? Comme il y a quelques années, la réponse aurait pu être variée. Mais à l’heure où les grands modèles prédominent, il n’y a qu’une seule réponse à cette question : pas assez de puissance de calcul !
Ou, en d’autres termes, les puces informatiques dédiées à l’IA de Nvidia ne suffisent pas.
Celui qui contrôle les puces IA de Nvidia contrôle l’avenir de l’IA.
Il existe désormais une telle entreprise, qui possède entre ses mains des dizaines de milliers de « cartes de calcul » d’IA de Nvidia, et parmi ses clients figurent de nombreux géants de l’IA tels qu’OpenAI et Microsoft.
En tant que « scalper de puissance de calcul de l'IA », cette société appelée CoreWeave a valorisé l'entreprise à 8 milliards de dollars américains en 4 ans. En plus de recevoir l'investissement exclusif de NVIDIA, CoreWeave a également utilisé ses puces NVIDIA comme garantie pour obtenir 2,3 milliards de dollars de financement par emprunt auprès d'institutions de premier plan telles que Blackstone et Coatue.
Rien ne peut arrêter la folle expansion de CoreWeave. Comment a-t-il réussi à gérer NVIDIA et à se transformer d'une société de « minage » de crypto-monnaie en un géant de « l'infrastructure informatique » d'IA ?
01 De "Carte minière" à "Carte de comptage"
L'équipe de démarrage de CoreWeave est composée de trois personnes, à savoir Michael Intrator, Brian Venturo et Brannin McBee, qui ont d'abord travaillé dans le domaine financier et ont dirigé des hedge funds et des family offices.
Lorsqu'ils géraient encore des fonds à New York, l'engouement pour le minage de cryptomonnaies ne s'était pas calmé : au début, juste pour gagner un revenu supplémentaire, ils achetaient le premier GPU, puis en achetaient de plus en plus, et les bureaux de Wall Street étaient remplis de GPU.
"En 2016, nous avons acheté notre premier GPU, l'avons branché, l'avons placé sur la table de billard dans notre bureau du bas de Manhattan surplombant l'East River et avons extrait le premier bloc du réseau Ethereum.'", a rappelé Michael Intrator, PDG de CoreWeave, dans un communiqué de 2021. article de blog.
Bientôt, en 2017, ils ont officiellement transformé leur activité secondaire en une entreprise, le nom de l'entreprise était à l'origine lié à la crypto-monnaie, puis a changé son nom en CoreWeave. Lorsqu'ils ont choisi de dire au revoir à Wall Street, tout comme les magnats de la Silicon Valley aiment démarrer une entreprise dans leur garage, ils ont déplacé le matériel GPU dans un garage. Cependant, ce garage n'était pas dans la Silicon Valley sur la côte ouest, mais dans la banlieue du New Jersey sur la côte Est. Elle appartenait à l'un des fondateurs, le grand-père de l'homme.
CoreWeave, trois co-fondateurs Michael Intrator (à gauche), Brian Venturo (au milieu) et Brannin McBee (à droite) | CoreWeave
Au cours de la dernière décennie, les GPU ont été un moteur important du boom technologique des cryptomonnaies et de l’intelligence artificielle. Fin 2018, CoreWeave est devenu l'un des plus grands mineurs d'Ethereum en Amérique du Nord, avec plus de 50 000 GPU en main, représentant plus de 1 % du réseau Ethereum.
Au cours de cette période, plusieurs personnes ont également commencé à comprendre le désir d'autres entreprises pour les ressources GPU. Ils se rendent également compte qu’il n’existe pas d’avantage concurrentiel durable dans le domaine des cryptomonnaies, car le marché est très concurrentiel et fortement affecté par les prix de l’électricité.
Lorsque les prix des cryptomonnaies ont chuté en 2018 et 2019, ils ont décidé de se diversifier dans d’autres domaines plus stables mais nécessitant également beaucoup de calcul GPU. Ils se concentrent sur les trois principaux domaines que sont l'intelligence artificielle, le divertissement multimédia et les sciences de la vie** et, à partir de 2019, ils se concentreront sur l'achat de chipsets GPU au niveau de l'entreprise, la création d'une infrastructure cloud spécialisée et l'ajustement de leurs activités autour des puces Nvidia**.
À mesure que la nouvelle activité se met en place, l’activité minière d’Ethereum est progressivement marginalisée. La décision de se transformer s'est avérée correcte et heureuse : aucun des fondateurs ne s'attendait à la prochaine vague d'IA, qui a permis à CoreWeave de passer progressivement d'un petit bureau à des centres de données à travers le pays pour répondre à la demande toujours croissante du marché de l'IA.
Selon l'un des fondateurs, le chiffre d'affaires de CoreWeave s'élèvera à environ 30 millions de dollars américains en 2022 et devrait dépasser 500 millions de dollars américains en 2023, soit une multiplication par plus de 10, et la société a signé près de 2 milliards de dollars américains de contrats. . Cette année, la société a annoncé un investissement de 1,6 milliard de dollars dans des centres de données au Texas, avec l'intention de s'étendre à 14 centres de données d'ici la fin de l'année.
02 IA "Réseau électrique"
Quelques années seulement après la création de CoreWeave, les GPU utilisés pour l'IA sont devenus l'un des actifs les plus précieux au monde. Comme Elon Musk et d'autres plaisantent, il est désormais plus difficile d'acheter un GPU que des médicaments. À mesure que l’IA générative enflamme le marché, la demande de GPU augmente considérablement et CoreWeave est bien placé pour fournir aux entreprises d’IA les ressources dont elles ont besoin.
En tant que fournisseur de services cloud, CoreWeave propose des services de location de ressources informatiques hautes performances, principalement pour les clients qui ont besoin de beaucoup de puissance de calcul. Le meilleur modèle est l'infrastructure en tant que service, et les GPU sont loués à l'heure. Les clients n'ont qu'à utiliser le temps et la quantité de ressources informatiques. Pour payer les frais**, les grands clients disposent également d'installations personnalisées, la bannière est "35 fois plus rapide que les fournisseurs de cloud traditionnels, 80 % de coût inférieur et 50 % de latence inférieure". La société se concentre sur les services informatiques hautes performances, contrairement aux fournisseurs de services cloud généraux qui fournissent également des services de stockage, de réseau et autres.
L'année dernière, juste au moment de la sortie de Stable Diffusion et Midjourney, les dirigeants de CoreWeave ont acheté de nombreuses dernières puces de Nvidia. Plus tard, lorsqu’ils ont vu la sortie de ChatGPT, ils ont réalisé qu’un tel investissement était loin d’être suffisant : ils avaient besoin non seulement de milliers de GPU, mais de millions.
Ils décrivent ce que CoreWeave essaie de faire comme « construire le réseau électrique pour le marché de l'IA » et affirment que « si ces choses ne sont pas construites, alors l'IA ne pourra pas évoluer ».
CoreWeave construit un nouveau centre de données au Texas | CoreWeave
Brannin McBee, directeur de la stratégie de CoreWeave, a déclaré dans un podcast qu'à la fin de l'année dernière, toutes les sociétés informatiques hyperscale réunies, y compris Amazon, Google, Microsoft et Oracle, y compris CoreWeave, ont fourni un total d'environ 50 à 10 000 GPU** , et d’ici la fin de cette année, peut-être près d’un million.
En termes de taux de croissance de l'industrie et de marges bénéficiaires, il estime que la demande du marché de l'IA peut être décomposée en deux étapes : la formation de modèles et l'exécution de tâches d'inférence. Actuellement, il y a une pénurie de puces au stade de la formation, ** alors que l'étape d'inférence sera la principale croissance de la demande future, c'est là que se situe la demande réelle**.
Pour un modèle d'entreprise d'IA, après avoir quitté la phase de formation, l'exécution d'inférences au cours de la phase de commercialisation au cours des deux premières années suivant le lancement du produit nécessite au moins un million de GPU, mais l'infrastructure mondiale d'IA n'est pas suffisante pour répondre à cette demande. être un défi à long terme, et il faudra encore au moins deux ans avant que la pénurie de GPU commence à s’atténuer.
Aujourd’hui, la majeure partie de l’argent chaud investi dans le domaine de l’IA est destinée au cloud computing. En juin, CNBC a rapporté que Microsoft "avait accepté de dépenser potentiellement des milliards de dollars au cours des prochaines années pour l'infrastructure de cloud computing de la startup CoreWeave". Des startups Star AI comme Inflection AI, qui ont récemment levé 1,3 milliard de dollars de financement pour construire d'énormes clusters GPU, en outre, le choix de l'entreprise s'est porté sur CoreWeave.
03 Embrassez les cuisses de Nvidia
En avril de cette année, CoreWeave a finalisé une ronde de financement de série B de 221 millions de dollars. Parmi les investisseurs figurent le fabricant de puces Nvidia, l'ancien PDG de GitHub Nat Friedman et l'ancien dirigeant d'Apple Daniel Gross. Un mois plus tard, la société a annoncé avoir reçu un investissement supplémentaire de 200 millions de dollars, portant le montant total du cycle de financement à 421 millions de dollars.
En août, CoreWeave a obtenu un financement par emprunt supplémentaire de 2,3 milliards de dollars en mettant en garantie le très recherché Nvidia H100. Les fonds seront utilisés pour acquérir davantage de puces et construire davantage de centres de données.
Selon les dernières nouvelles de Bloomberg, CoreWeave se prépare actuellement à vendre une participation de 10 % et la valorisation de son entreprise a atteint un maximum de 8 milliards de dollars.
Le fondateur de Nvidia, Jensen Huang, a déclaré lors de la conférence téléphonique sur les résultats de la société cette année : « Vous verrez un grand nombre de nouveaux fournisseurs de services cloud spécialisés dans les GPU. » « L'un des plus célèbres est CoreWeave, et ils font un très bon travail. »
La relation entre CoreWeave et NVIDIA a déjà commencé en 2020. La société a annoncé cette année-là qu'elle rejoindrait le programme de fournisseur de services cloud du NVIDIA Partner Network, dans le but principal d'introduire l'accélération GPU dans le cloud. Lors de la récente conférence Siggraph Computer Graphics 2023, Jen-Hsun Huang est apparue et chaque stand CoreWeave était spécifiquement marqué « Powered by NVIDIA » en petites lettres.
Jen-Hsun Huang est apparue sur le stand CoreWeave | CoreWeave
Les dirigeants de NVIDIA, dont Jen-Hsun Huang, n'hésitent pas à soutenir CoreWeave.
Le directeur mondial du développement commercial mondial, du cloud et des partenaires stratégiques de NVIDIA qualifie CoreWeave de « premier fournisseur de solutions informatiques cloud d'élite au sein du réseau de partenaires NVIDIA. Ils offrent aux clients une large gamme d'options informatiques, du A100 au A40, à un niveau sans précédent. » , et fournissant des résultats de classe mondiale en matière d'intelligence artificielle, d'apprentissage automatique, d'effets visuels et bien plus encore. NVIDIA est fier de CoreWeave." Un autre dirigeant de NVIDIA l'a positionné dans l'annonce de financement comme "la plus haute performance, la plus économe en énergie plateforme informatique".
De tels éloges concernent également les propres intérêts de Nvidia. Nvidia doit garantir que ses utilisateurs finaux informatiques peuvent accéder à leurs ressources informatiques avec les performances les plus élevées possibles, à grande échelle, tout comme les clients souhaitent mettre la main sur les nouvelles générations de puces dès leur sortie. Cela ne les incite pas non plus à promouvoir leur coopération avec CoreWeave, et il n'y a aucun mal à développer une « downline » fidèle**.
CoreWeave construit pour répondre aux normes et exigences de Nvidia, fonctionnant à grande échelle et lançant une nouvelle génération de puces dans les mois suivant leur sortie, plutôt que les trimestres que pourraient prendre les sociétés informatiques hyperscale traditionnelles. Cela donne à CoreWeave un accès élevé au sein de NVIDIA.
"En tant qu'entreprise, cela nous donne confiance aux yeux de NVIDIA, car ils savent que notre infrastructure sera livrée aux clients plus rapidement que quiconque sur le marché et dans les configurations les plus performantes", a déclaré Brannin McBee.
04 Hard Gang Géant de la Silicon Valley
Mais comment CoreWeave s’en sort-il face à la concurrence des géants de la Silicon Valley ?
D'un point de vue à l'échelle du secteur, les concurrents de CoreWeave dans les opérations d'infrastructure d'IA comprennent des géants de la technologie tels que Microsoft, Google et Amazon.
Fin août, Thomas Kurian, PDG de Google Cloud, a déclaré lors de la conférence annuelle Next qu'actuellement, plus de 50 % des startups d'IA du secteur et plus de 70 % des licornes d'IA générative sont des clients de Google Cloud.
Comment une start-up évaluée à 8 milliards de dollars peut-elle éviter d’être écrasée par une bande de géants valant des milliards de dollars ? La réponse immédiate réside dans la flexibilité et l’orientation commerciale des petites entreprises elles-mêmes, ainsi que dans le paysage stratégique sensible des entreprises technologiques.
Les dirigeants de CoreWeave aiment faire une analogie : « General Motors peut construire des voitures électriques, mais cela ne veut pas dire qu'elle devient Tesla. » Ils estiment que l'IA pose des défis que les plateformes cloud traditionnelles ne peuvent pas relever, permettant à l'entreprise émergente d'avoir un avantage sur des entreprises établies qui sont contraintes de s’adapter.
Les géants de la Silicon Valley comme Amazon, Google et Microsoft sont comme des porte-avions, et chaque fois qu’ils ajustent leur direction, ils ont besoin de plus de temps et d’espace. Selon lui, ils ont besoin de temps pour s'adapter à la nouvelle façon de construire une infrastructure d'IA, et il faut généralement un certain temps après la sortie des dernières puces pour fournir un accès à grande échelle. Maintenant, les gens accordent plus d'attention à la construction de superordinateurs, qui nécessitent des tâches hautement coordonnées entre ces ordinateurs, avec un débit de données plus élevé, et les principales ressources des géants ne sont pas utilisées ici.
« Lorsque ces trois géants créent des services cloud, ils le font pour servir des centaines de milliers, voire des millions de cas d'utilisation dits généraux au sein de leurs bases d'utilisateurs, et dans ces domaines, il se peut qu'il n'y ait qu'une petite partie de la capacité dédiée. au calcul GPU. » a déclaré Brian Venturo, directeur de la technologie de CoreWeave.
CoreWeave estime que sa flexibilité et son professionnalisme lui permettent de se démarquer dans le domaine de l'infrastructure d'IA, de bénéficier d'avantages concurrentiels en termes de performances et de rentabilité, et d'être plus adaptés aux applications d'IA. CoreWeave compte un peu plus de 200 employés et plus de clients que d'employés, mais l'entreprise a conclu des accords avec Inflection AI et même avec Microsoft, le bailleur de fonds d'OpenAI, pour fournir des systèmes et des puces personnalisés avec plus de configurations que celles équipées pour l'informatique à usage général. Les serveurs sont plus efficaces**.
Actuellement, en termes d'échelle, CoreWeave prétend disposer de plus de 45 000 GPU Nvidia haut de gamme pouvant être utilisés à la demande. Ce n'est pas seulement la quantité qui compte, c'est l'accès fourni. En termes de sélection, CoreWeave prétend maintenir la plus large sélection de GPU Nvidia du secteur pour répondre à une variété de besoins informatiques. Ils conçoivent des systèmes de charge de travail « à la bonne taille », affirmant « ni trop, ni trop peu : juste ce qu'il faut ».
Quant au prix, la bannière de CoreWeave est « 80 % moins chère que ses concurrents ».
D'un autre côté, la décision de Nvidia est également critique. En contrôlant les rares ressources GPU, le choix de la personne qui récupérera les marchandises affectera également l’ensemble du marché. Malgré l'offre restreinte, Nvidia a alloué un grand lot des dernières puces d'IA à CoreWeave, détournant ainsi l'offre des principaux fournisseurs de services cloud, dont AWS. La raison en est que ces entreprises tentent de développer leurs propres puces d'IA pour réduire leur dépendance à l'égard de Nvidia.
Les dirigeants de CoreWeave estiment que "ne pas fabriquer leurs propres puces n'est certainement pas un inconvénient", car cela les aidera à se battre pour plus de GPU de Nvidia. Après tout, ils n’ont aucun conflit d’intérêts avec Nvidia, ce qui n’est peut-être pas le cas des géants de la Silicon Valley aux énormes appétits.
Cependant, le géant de la technologie reste après tout un gros client de Nvidia. Fin août de cette année, Huang Renxun est apparu à la conférence annuelle Next de Google Cloud et a annoncé une nouvelle coopération avec Google.Le supercalculateur GPU A3 VM de Google sera lancé sur le marché en septembre, équipé du GPU H100 de Nvidia.
Lors de la conférence Google Cloud Next2023, Huang Renxun est apparu pour annoncer la coopération avec Google Cloud|Google Cloud
De plus, si une nouvelle puce apparaît soudainement, capable de fonctionner mieux que NVIDIA, ou qui ne lui est pas inférieure, quel impact cela aura-t-il sur l'activité de CoreWeave ?
Brannin McBee estime que la durée de vie d'une même puce comprend les deux à trois premières années pour la formation du modèle, puis quatre à cinq ans pour l'exécution des inférences, et qu'il n'y a pas beaucoup de risque à court terme. De plus, Nvidia travaille dur pour construire un écosystème ouvert autour de son matériel afin d'accroître la fidélité de l'industrie à sa technologie de puces. D'autres fabricants sont évidemment très motivés à se lancer dans ce domaine, mais il leur manque un écosystème, ce qui constitue une lacune qui ne peut être ignorée.
En l'absence d'une technologie de fabrication de puces de base, l'avantage relatif et le succès de CoreWeave sont étroitement liés à la chaîne d'approvisionnement et à la stabilité de ses partenaires. Lorsque l'industrie manque de GPU, cette dépendance reste un avantage.
De la "mine" de crypto-monnaie à la "mine de puissance de calcul" de l'intelligence artificielle, l'histoire du succès de CoreWeave est stupéfiante - un grain d'or dans le temps peut faire croître rapidement une start-up même si elle tombe dessus. En cette ère de croissance rapide de l'IA, le désir de puissance de calcul de l'industrie a créé la société Nvidia, qui vaut des milliards de dollars, et a évidemment également créé des sociétés comme CoreWeave qui peuvent saisir l'opportunité et se lancer à fond.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
NVIDIA soutient fortement ce « scalper de puissance de calcul IA » avec une valorisation de 56 milliards en 4 ans
Quel est le plus grand obstacle au développement de l’intelligence artificielle ? Comme il y a quelques années, la réponse aurait pu être variée. Mais à l’heure où les grands modèles prédominent, il n’y a qu’une seule réponse à cette question : pas assez de puissance de calcul !
Ou, en d’autres termes, les puces informatiques dédiées à l’IA de Nvidia ne suffisent pas.
Celui qui contrôle les puces IA de Nvidia contrôle l’avenir de l’IA.
Il existe désormais une telle entreprise, qui possède entre ses mains des dizaines de milliers de « cartes de calcul » d’IA de Nvidia, et parmi ses clients figurent de nombreux géants de l’IA tels qu’OpenAI et Microsoft.
En tant que « scalper de puissance de calcul de l'IA », cette société appelée CoreWeave a valorisé l'entreprise à 8 milliards de dollars américains en 4 ans. En plus de recevoir l'investissement exclusif de NVIDIA, CoreWeave a également utilisé ses puces NVIDIA comme garantie pour obtenir 2,3 milliards de dollars de financement par emprunt auprès d'institutions de premier plan telles que Blackstone et Coatue.
Rien ne peut arrêter la folle expansion de CoreWeave. Comment a-t-il réussi à gérer NVIDIA et à se transformer d'une société de « minage » de crypto-monnaie en un géant de « l'infrastructure informatique » d'IA ?
01 De "Carte minière" à "Carte de comptage"
L'équipe de démarrage de CoreWeave est composée de trois personnes, à savoir Michael Intrator, Brian Venturo et Brannin McBee, qui ont d'abord travaillé dans le domaine financier et ont dirigé des hedge funds et des family offices.
Lorsqu'ils géraient encore des fonds à New York, l'engouement pour le minage de cryptomonnaies ne s'était pas calmé : au début, juste pour gagner un revenu supplémentaire, ils achetaient le premier GPU, puis en achetaient de plus en plus, et les bureaux de Wall Street étaient remplis de GPU.
"En 2016, nous avons acheté notre premier GPU, l'avons branché, l'avons placé sur la table de billard dans notre bureau du bas de Manhattan surplombant l'East River et avons extrait le premier bloc du réseau Ethereum.'", a rappelé Michael Intrator, PDG de CoreWeave, dans un communiqué de 2021. article de blog.
Bientôt, en 2017, ils ont officiellement transformé leur activité secondaire en une entreprise, le nom de l'entreprise était à l'origine lié à la crypto-monnaie, puis a changé son nom en CoreWeave. Lorsqu'ils ont choisi de dire au revoir à Wall Street, tout comme les magnats de la Silicon Valley aiment démarrer une entreprise dans leur garage, ils ont déplacé le matériel GPU dans un garage. Cependant, ce garage n'était pas dans la Silicon Valley sur la côte ouest, mais dans la banlieue du New Jersey sur la côte Est. Elle appartenait à l'un des fondateurs, le grand-père de l'homme.
Au cours de la dernière décennie, les GPU ont été un moteur important du boom technologique des cryptomonnaies et de l’intelligence artificielle. Fin 2018, CoreWeave est devenu l'un des plus grands mineurs d'Ethereum en Amérique du Nord, avec plus de 50 000 GPU en main, représentant plus de 1 % du réseau Ethereum.
Au cours de cette période, plusieurs personnes ont également commencé à comprendre le désir d'autres entreprises pour les ressources GPU. Ils se rendent également compte qu’il n’existe pas d’avantage concurrentiel durable dans le domaine des cryptomonnaies, car le marché est très concurrentiel et fortement affecté par les prix de l’électricité.
Lorsque les prix des cryptomonnaies ont chuté en 2018 et 2019, ils ont décidé de se diversifier dans d’autres domaines plus stables mais nécessitant également beaucoup de calcul GPU. Ils se concentrent sur les trois principaux domaines que sont l'intelligence artificielle, le divertissement multimédia et les sciences de la vie** et, à partir de 2019, ils se concentreront sur l'achat de chipsets GPU au niveau de l'entreprise, la création d'une infrastructure cloud spécialisée et l'ajustement de leurs activités autour des puces Nvidia**.
À mesure que la nouvelle activité se met en place, l’activité minière d’Ethereum est progressivement marginalisée. La décision de se transformer s'est avérée correcte et heureuse : aucun des fondateurs ne s'attendait à la prochaine vague d'IA, qui a permis à CoreWeave de passer progressivement d'un petit bureau à des centres de données à travers le pays pour répondre à la demande toujours croissante du marché de l'IA.
Selon l'un des fondateurs, le chiffre d'affaires de CoreWeave s'élèvera à environ 30 millions de dollars américains en 2022 et devrait dépasser 500 millions de dollars américains en 2023, soit une multiplication par plus de 10, et la société a signé près de 2 milliards de dollars américains de contrats. . Cette année, la société a annoncé un investissement de 1,6 milliard de dollars dans des centres de données au Texas, avec l'intention de s'étendre à 14 centres de données d'ici la fin de l'année.
02 IA "Réseau électrique"
Quelques années seulement après la création de CoreWeave, les GPU utilisés pour l'IA sont devenus l'un des actifs les plus précieux au monde. Comme Elon Musk et d'autres plaisantent, il est désormais plus difficile d'acheter un GPU que des médicaments. À mesure que l’IA générative enflamme le marché, la demande de GPU augmente considérablement et CoreWeave est bien placé pour fournir aux entreprises d’IA les ressources dont elles ont besoin.
En tant que fournisseur de services cloud, CoreWeave propose des services de location de ressources informatiques hautes performances, principalement pour les clients qui ont besoin de beaucoup de puissance de calcul. Le meilleur modèle est l'infrastructure en tant que service, et les GPU sont loués à l'heure. Les clients n'ont qu'à utiliser le temps et la quantité de ressources informatiques. Pour payer les frais**, les grands clients disposent également d'installations personnalisées, la bannière est "35 fois plus rapide que les fournisseurs de cloud traditionnels, 80 % de coût inférieur et 50 % de latence inférieure". La société se concentre sur les services informatiques hautes performances, contrairement aux fournisseurs de services cloud généraux qui fournissent également des services de stockage, de réseau et autres.
L'année dernière, juste au moment de la sortie de Stable Diffusion et Midjourney, les dirigeants de CoreWeave ont acheté de nombreuses dernières puces de Nvidia. Plus tard, lorsqu’ils ont vu la sortie de ChatGPT, ils ont réalisé qu’un tel investissement était loin d’être suffisant : ils avaient besoin non seulement de milliers de GPU, mais de millions.
Ils décrivent ce que CoreWeave essaie de faire comme « construire le réseau électrique pour le marché de l'IA » et affirment que « si ces choses ne sont pas construites, alors l'IA ne pourra pas évoluer ».
Brannin McBee, directeur de la stratégie de CoreWeave, a déclaré dans un podcast qu'à la fin de l'année dernière, toutes les sociétés informatiques hyperscale réunies, y compris Amazon, Google, Microsoft et Oracle, y compris CoreWeave, ont fourni un total d'environ 50 à 10 000 GPU** , et d’ici la fin de cette année, peut-être près d’un million.
En termes de taux de croissance de l'industrie et de marges bénéficiaires, il estime que la demande du marché de l'IA peut être décomposée en deux étapes : la formation de modèles et l'exécution de tâches d'inférence. Actuellement, il y a une pénurie de puces au stade de la formation, ** alors que l'étape d'inférence sera la principale croissance de la demande future, c'est là que se situe la demande réelle**.
Pour un modèle d'entreprise d'IA, après avoir quitté la phase de formation, l'exécution d'inférences au cours de la phase de commercialisation au cours des deux premières années suivant le lancement du produit nécessite au moins un million de GPU, mais l'infrastructure mondiale d'IA n'est pas suffisante pour répondre à cette demande. être un défi à long terme, et il faudra encore au moins deux ans avant que la pénurie de GPU commence à s’atténuer.
Aujourd’hui, la majeure partie de l’argent chaud investi dans le domaine de l’IA est destinée au cloud computing. En juin, CNBC a rapporté que Microsoft "avait accepté de dépenser potentiellement des milliards de dollars au cours des prochaines années pour l'infrastructure de cloud computing de la startup CoreWeave". Des startups Star AI comme Inflection AI, qui ont récemment levé 1,3 milliard de dollars de financement pour construire d'énormes clusters GPU, en outre, le choix de l'entreprise s'est porté sur CoreWeave.
03 Embrassez les cuisses de Nvidia
En avril de cette année, CoreWeave a finalisé une ronde de financement de série B de 221 millions de dollars. Parmi les investisseurs figurent le fabricant de puces Nvidia, l'ancien PDG de GitHub Nat Friedman et l'ancien dirigeant d'Apple Daniel Gross. Un mois plus tard, la société a annoncé avoir reçu un investissement supplémentaire de 200 millions de dollars, portant le montant total du cycle de financement à 421 millions de dollars.
En août, CoreWeave a obtenu un financement par emprunt supplémentaire de 2,3 milliards de dollars en mettant en garantie le très recherché Nvidia H100. Les fonds seront utilisés pour acquérir davantage de puces et construire davantage de centres de données.
Selon les dernières nouvelles de Bloomberg, CoreWeave se prépare actuellement à vendre une participation de 10 % et la valorisation de son entreprise a atteint un maximum de 8 milliards de dollars.
Le fondateur de Nvidia, Jensen Huang, a déclaré lors de la conférence téléphonique sur les résultats de la société cette année : « Vous verrez un grand nombre de nouveaux fournisseurs de services cloud spécialisés dans les GPU. » « L'un des plus célèbres est CoreWeave, et ils font un très bon travail. »
La relation entre CoreWeave et NVIDIA a déjà commencé en 2020. La société a annoncé cette année-là qu'elle rejoindrait le programme de fournisseur de services cloud du NVIDIA Partner Network, dans le but principal d'introduire l'accélération GPU dans le cloud. Lors de la récente conférence Siggraph Computer Graphics 2023, Jen-Hsun Huang est apparue et chaque stand CoreWeave était spécifiquement marqué « Powered by NVIDIA » en petites lettres.
Les dirigeants de NVIDIA, dont Jen-Hsun Huang, n'hésitent pas à soutenir CoreWeave.
Le directeur mondial du développement commercial mondial, du cloud et des partenaires stratégiques de NVIDIA qualifie CoreWeave de « premier fournisseur de solutions informatiques cloud d'élite au sein du réseau de partenaires NVIDIA. Ils offrent aux clients une large gamme d'options informatiques, du A100 au A40, à un niveau sans précédent. » , et fournissant des résultats de classe mondiale en matière d'intelligence artificielle, d'apprentissage automatique, d'effets visuels et bien plus encore. NVIDIA est fier de CoreWeave." Un autre dirigeant de NVIDIA l'a positionné dans l'annonce de financement comme "la plus haute performance, la plus économe en énergie plateforme informatique".
De tels éloges concernent également les propres intérêts de Nvidia. Nvidia doit garantir que ses utilisateurs finaux informatiques peuvent accéder à leurs ressources informatiques avec les performances les plus élevées possibles, à grande échelle, tout comme les clients souhaitent mettre la main sur les nouvelles générations de puces dès leur sortie. Cela ne les incite pas non plus à promouvoir leur coopération avec CoreWeave, et il n'y a aucun mal à développer une « downline » fidèle**.
CoreWeave construit pour répondre aux normes et exigences de Nvidia, fonctionnant à grande échelle et lançant une nouvelle génération de puces dans les mois suivant leur sortie, plutôt que les trimestres que pourraient prendre les sociétés informatiques hyperscale traditionnelles. Cela donne à CoreWeave un accès élevé au sein de NVIDIA.
"En tant qu'entreprise, cela nous donne confiance aux yeux de NVIDIA, car ils savent que notre infrastructure sera livrée aux clients plus rapidement que quiconque sur le marché et dans les configurations les plus performantes", a déclaré Brannin McBee.
04 Hard Gang Géant de la Silicon Valley
Mais comment CoreWeave s’en sort-il face à la concurrence des géants de la Silicon Valley ?
D'un point de vue à l'échelle du secteur, les concurrents de CoreWeave dans les opérations d'infrastructure d'IA comprennent des géants de la technologie tels que Microsoft, Google et Amazon.
Fin août, Thomas Kurian, PDG de Google Cloud, a déclaré lors de la conférence annuelle Next qu'actuellement, plus de 50 % des startups d'IA du secteur et plus de 70 % des licornes d'IA générative sont des clients de Google Cloud.
Comment une start-up évaluée à 8 milliards de dollars peut-elle éviter d’être écrasée par une bande de géants valant des milliards de dollars ? La réponse immédiate réside dans la flexibilité et l’orientation commerciale des petites entreprises elles-mêmes, ainsi que dans le paysage stratégique sensible des entreprises technologiques.
Les dirigeants de CoreWeave aiment faire une analogie : « General Motors peut construire des voitures électriques, mais cela ne veut pas dire qu'elle devient Tesla. » Ils estiment que l'IA pose des défis que les plateformes cloud traditionnelles ne peuvent pas relever, permettant à l'entreprise émergente d'avoir un avantage sur des entreprises établies qui sont contraintes de s’adapter.
Les géants de la Silicon Valley comme Amazon, Google et Microsoft sont comme des porte-avions, et chaque fois qu’ils ajustent leur direction, ils ont besoin de plus de temps et d’espace. Selon lui, ils ont besoin de temps pour s'adapter à la nouvelle façon de construire une infrastructure d'IA, et il faut généralement un certain temps après la sortie des dernières puces pour fournir un accès à grande échelle. Maintenant, les gens accordent plus d'attention à la construction de superordinateurs, qui nécessitent des tâches hautement coordonnées entre ces ordinateurs, avec un débit de données plus élevé, et les principales ressources des géants ne sont pas utilisées ici.
« Lorsque ces trois géants créent des services cloud, ils le font pour servir des centaines de milliers, voire des millions de cas d'utilisation dits généraux au sein de leurs bases d'utilisateurs, et dans ces domaines, il se peut qu'il n'y ait qu'une petite partie de la capacité dédiée. au calcul GPU. » a déclaré Brian Venturo, directeur de la technologie de CoreWeave.
CoreWeave estime que sa flexibilité et son professionnalisme lui permettent de se démarquer dans le domaine de l'infrastructure d'IA, de bénéficier d'avantages concurrentiels en termes de performances et de rentabilité, et d'être plus adaptés aux applications d'IA. CoreWeave compte un peu plus de 200 employés et plus de clients que d'employés, mais l'entreprise a conclu des accords avec Inflection AI et même avec Microsoft, le bailleur de fonds d'OpenAI, pour fournir des systèmes et des puces personnalisés avec plus de configurations que celles équipées pour l'informatique à usage général. Les serveurs sont plus efficaces**.
Actuellement, en termes d'échelle, CoreWeave prétend disposer de plus de 45 000 GPU Nvidia haut de gamme pouvant être utilisés à la demande. Ce n'est pas seulement la quantité qui compte, c'est l'accès fourni. En termes de sélection, CoreWeave prétend maintenir la plus large sélection de GPU Nvidia du secteur pour répondre à une variété de besoins informatiques. Ils conçoivent des systèmes de charge de travail « à la bonne taille », affirmant « ni trop, ni trop peu : juste ce qu'il faut ».
Quant au prix, la bannière de CoreWeave est « 80 % moins chère que ses concurrents ».
D'un autre côté, la décision de Nvidia est également critique. En contrôlant les rares ressources GPU, le choix de la personne qui récupérera les marchandises affectera également l’ensemble du marché. Malgré l'offre restreinte, Nvidia a alloué un grand lot des dernières puces d'IA à CoreWeave, détournant ainsi l'offre des principaux fournisseurs de services cloud, dont AWS. La raison en est que ces entreprises tentent de développer leurs propres puces d'IA pour réduire leur dépendance à l'égard de Nvidia.
Les dirigeants de CoreWeave estiment que "ne pas fabriquer leurs propres puces n'est certainement pas un inconvénient", car cela les aidera à se battre pour plus de GPU de Nvidia. Après tout, ils n’ont aucun conflit d’intérêts avec Nvidia, ce qui n’est peut-être pas le cas des géants de la Silicon Valley aux énormes appétits.
Cependant, le géant de la technologie reste après tout un gros client de Nvidia. Fin août de cette année, Huang Renxun est apparu à la conférence annuelle Next de Google Cloud et a annoncé une nouvelle coopération avec Google.Le supercalculateur GPU A3 VM de Google sera lancé sur le marché en septembre, équipé du GPU H100 de Nvidia.
De plus, si une nouvelle puce apparaît soudainement, capable de fonctionner mieux que NVIDIA, ou qui ne lui est pas inférieure, quel impact cela aura-t-il sur l'activité de CoreWeave ?
Brannin McBee estime que la durée de vie d'une même puce comprend les deux à trois premières années pour la formation du modèle, puis quatre à cinq ans pour l'exécution des inférences, et qu'il n'y a pas beaucoup de risque à court terme. De plus, Nvidia travaille dur pour construire un écosystème ouvert autour de son matériel afin d'accroître la fidélité de l'industrie à sa technologie de puces. D'autres fabricants sont évidemment très motivés à se lancer dans ce domaine, mais il leur manque un écosystème, ce qui constitue une lacune qui ne peut être ignorée.
En l'absence d'une technologie de fabrication de puces de base, l'avantage relatif et le succès de CoreWeave sont étroitement liés à la chaîne d'approvisionnement et à la stabilité de ses partenaires. Lorsque l'industrie manque de GPU, cette dépendance reste un avantage.
De la "mine" de crypto-monnaie à la "mine de puissance de calcul" de l'intelligence artificielle, l'histoire du succès de CoreWeave est stupéfiante - un grain d'or dans le temps peut faire croître rapidement une start-up même si elle tombe dessus. En cette ère de croissance rapide de l'IA, le désir de puissance de calcul de l'industrie a créé la société Nvidia, qui vaut des milliards de dollars, et a évidemment également créé des sociétés comme CoreWeave qui peuvent saisir l'opportunité et se lancer à fond.