Les grands modèles vont devenir une « nécessité » pour les entreprises, comment les serveurs peuvent-ils répondre à la nouvelle demande de puissance de calcul ?

Source d’origine : Titanium Media

Auteur : Zhang Shenyu

Source de l’image : Généré par Unbounded AI

Dans la vague de la numérisation, la puissance de calcul est partout. La puissance de calcul native spécialement conçue pour la numérisation est devenue une nouvelle force motrice pour activer le potentiel des éléments de données d’entreprise et stimuler l’innovation et le développement de l’entreprise, et constitue la principale compétitivité des entreprises dans la période de transformation numérique. L’essor soudain des applications d’intelligence artificielle a encore creusé l’écart en matière de puissance de calcul native pour les entreprises.

Forte demande du marché

En tant qu’appareil clé pour convertir les watts en bits - serveurs, le marché des serveurs a également connu une croissance explosive dans le contexte de la demande de plus en plus forte des entreprises en matière de puissance de calcul et d’AGI. Gartner a publié les dernières données sur le marché mondial des serveurs pour 2022, montrant que le marché mondial des serveurs a fortement augmenté au premier semestre 2022, avec des expéditions de 6,689 millions d’unités, soit une augmentation de 11,8 % en glissement annuel, et des ventes de 56,65 milliards de dollars, soit une augmentation de 24,1 % en glissement annuel. Le marché des serveurs a connu une forte croissance au premier semestre 2022.

Dans le même temps, il est prévu que d’ici 2030, l’humanité entrera dans l’ère des données YB, avec une puissance de calcul générale multipliée par 10 et une puissance de calcul d’intelligence artificielle multipliée par 500.

À l’heure actuelle, la Chine dispose d’un stock énorme de plus de 20 millions de serveurs, et le volume annuel d’achat de serveurs à usage général est d’environ 4 à 5 millions d’unités. Certaines institutions prévoient que d’ici 2027, la taille totale du marché chinois des serveurs de centres de données sera proche de 500 milliards de yuans.

À partir des données ci-dessus, il n’est pas difficile de voir que, que ce soit en Chine ou dans le monde, dans le contexte de l’émergence continue d’une nouvelle génération de scénarios applicatifs représentés par de grands modèles, la demande de serveurs pris en charge par la puissance de calcul sous-jacente devient de plus en plus forte.

Le changement est en train de se produire

Avec la croissance explosive du marché des serveurs, alors que la demande des utilisateurs de serveurs est forte, les exigences en matière de produits ont également changé. Dans le même temps, dans le contexte du développement rapide de l’AGI, de nouveaux changements ont été apportés à l’ensemble de l’infrastructure.

Liu Hongcheng, vice-président de la gamme de produits de calcul et de stockage du groupe H3C, a déclaré que le développement rapide de l’AIGC a mis en avant des exigences plus élevées pour les serveurs, « en termes de tendances et de produits technologiques : le développement rapide de la technologie AIGC a apporté des opportunités et des défis sans précédent à l’activité principale des entreprises. Qu’il s’agisse de la finance, de la santé, des transports, de la fabrication ou d’autres domaines, toute interruption d’activité ou défaillance du système peut avoir de graves conséquences, mais quelle que soit l’évolution de l’application de la couche supérieure, une infrastructure informatique sous-jacente stable et fiable est toujours nécessaire pour prendre en charge les systèmes critiques de l’entreprise. Liu Hongcheng a souligné.

Liu Hongcheng a déclaré à Titanium Media que sous la vague de l’AIGC, la demande des entreprises pour une puissance de calcul intelligente hétérogène passera d’un chiffre initial à plus de 30 %. Dans le même temps, dans le scénario d’application des grands modèles, des exigences plus élevées sont mises en avant pour l’évolutivité des serveurs, « le nombre de visites peut être de 1 million aujourd’hui, et il atteindra 10 millions demain, et la demande d’évolutivité sera particulièrement forte ». « Bien que ce processus puisse répondre aux besoins d’expansion grâce à certaines améliorations logicielles, l’exigence finale incombera toujours aux performances du serveur lui-même. » "

En fait, sous l’effet de la demande croissante de puissance de calcul intelligente hétérogène de la part des entreprises, la transformation de l’industrie des serveurs s’est « produite discrètement ».

**Dans la nouvelle ère, comment les serveurs peuvent-ils répondre à la demande ? **

Dans le contexte des exigences de plus en plus élevées de l’industrie en matière de serveurs, les serveurs évolueront dans le sens des « quatre sommets », à savoir des performances élevées, une évolutivité élevée, une stabilité élevée et une sécurité élevée.

Si l’on prend l’exemple de la fiabilité, en 2021, les serveurs du centre de données du géant international de la technologie Facebook sont tombés en panne, et ses sites Web et applications Facebook, Instagram, WhatsApp, Messenger et d’autres sites Web et applications ont tous connu des erreurs de serveur de réponse, et 3,5 milliards d’utilisateurs dans le monde n’ont pas pu utiliser ces plateformes sociales pendant près de 6 heures. La panne a fait chuter l’action de Facebook de 6 %, et la fortune personnelle de Zuckerberg a effacé près de 6 milliards de dollars en une seule journée.

On peut voir qu’à l’heure actuelle, la fiabilité des serveurs affecte non seulement l’activité des entreprises, mais affecte également le développement des entreprises, et affecte même la « vie et la mort » des entreprises.

En termes de haute performance, IBM a mis en avant le concept de « Cloud in a Box », et Ying Kangyong, directeur technique d’IBM Asie-Pacifique hôte et LinuxONE, a déclaré un jour à Titanium Media que les utilisateurs ont besoin d’un serveur comme un « cloud in a box », qui peut héberger des dizaines de milliers de charges de travail dans un espace limité, et peut également assurer le niveau de service d’isolation et de transaction les uns avec les autres.

Huang Qiang, directeur général de la division Informatique intelligente et intelligence artificielle de Hewlett Packard Enterprise (Chine), a déclaré que la « mise à l’échelle » utilisée dans le nom du serveur est une bonne expression du point de vue de HPE : l’expansion verticale deviendra un moyen clé d’améliorer les performances du serveur, et ce concept de développement de haute évolutivité et de haute performance se complète. Il deviendra également l’une des directions du développement de l’industrie des serveurs à l’avenir.

Huang Qiang a déclaré à Titanium Media que du point de vue des besoins des utilisateurs de HPE, de plus en plus d’utilisateurs recherchent actuellement les performances ultimes des serveurs, « Lorsque le cloud computing est sorti pour la première fois, de nombreuses entreprises ont choisi de passer au cloud pour une « expansion horizontale ». Cependant, pour de nombreux utilisateurs qui ont des exigences extrêmes en matière de performances et de fiabilité, notamment dans les domaines de la finance, des télécommunications et des soins médicaux, ils sont plus susceptibles de choisir une « expansion verticale » avec le développement de la technologie. Huang Qiang a souligné : « C’est ce qu’on appelle aussi la « mise à l’échelle ». "

Si l’on prend l’exemple du scénario d’application de l’industrie médicale, pour l’application de l’industrie médicale nationale, la base de données multimédia qui intègre les radiographies, la tomodensitométrie et d’autres données est l’un des scénarios les plus largement utilisés dans l’industrie médicale chinoise à ce stade. Huang Qiang a déclaré qu’à ce stade, la scène des bases de données multimédias présente, et l’application de l’analyse de données, du traitement d’images et même des grands modèles devient de plus en plus « opportune », et la façon d’améliorer la vitesse et les performances est devenue le centre d’attention de l’industrie. « Dans ce domaine, le serveur doit avoir la capacité d’intégrer des GPU, d’utiliser les capacités de simultanéité des GPU pour l’analyse des données, de diviser la tâche d’analyse en centaines d’unités commerciales pour une analyse simultanée, et enfin de résumer les résultats, améliorant ainsi les exigences élevées en matière de rapidité dans ce scénario. » Huang Qiang a déclaré : « Et c’est l’un des points clés pour que les serveurs HPE 3200 prennent en charge les capacités d’intégration GPU. "

Selon Titanium Media, en plus des voies de développement mentionnées ci-dessus dans l’industrie des serveurs, certains fabricants ont trouvé une nouvelle voie de développement ces dernières années, comme l’amélioration de la densité des serveurs à travers l’ensemble des produits de serveurs d’armoire, et la disposition de plus de serveurs dans un espace limité pour répondre aux besoins de l’informatique haute densité.

L’ensemble du serveur d’armoire est une solution de serveur construite selon l’idée de conception modulaire, l’architecture du système est composée de 6 sous-systèmes : armoire, réseau, alimentation, nœud de serveur, dissipation thermique centralisée et gestion centralisée, et plusieurs nœuds de serveur partagent l’alimentation et le ventilateur dans le même châssis, ce qui peut améliorer considérablement l’efficacité de l’alimentation et du système de refroidissement, et finalement alléger le poids du corps et réduire le coût.

Non seulement cela, l’ensemble du serveur d’armoire adopte la conception préfabriquée en usine, ce qui raccourcit considérablement la période de construction, et à l’ère d’Internet de « seulement rapide et non cassé », plus tôt il est déployé et mis en production, plus tôt l’entreprise est ouverte, plus tôt il peut aider les utilisateurs à « profiter ».

À l’avenir, il est devenu indiscutable que le marché des serveurs évoluera dans le sens de hautes performances, d’une grande évolutivité, d’une grande stabilité et d’une haute sécurité. Bien que les chemins de développement des différents fournisseurs soient différents, il n’y a qu’un seul objectif ultime : répondre aux exigences élevées des utilisateurs en matière de serveurs.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)