Une puce à 288 cœurs, un supercalculateur alimenté par 4 000 processeurs IA, et un gros modèle qui ne nécessite pas de connexion Internet… Intel va riposter !
En 2022, avant son discours à la conférence Intel, le PDG d'Intel, Pat Gelsinger, a fait des pompes dans les coulisses ; mais cette année, il l'a fait directement sur la scène du discours d'ouverture.
Il y a eu une salve d'applaudissements
Le 19 septembre, au San Jose Convention and Exhibition Center, le PDG qui souhaitait ramener Intel au sommet semblait plein d'énergie. Au cours du discours d'ouverture de 90 minutes, Kissinger, qui s'était échauffé, a fait diverses annonces majeures : des derniers progrès des puces à 288 cœurs, à une série de puces de nouvelle génération qui ne peuvent être annoncées qu'avec des noms de code internes, en passant par 4 000 Depuis les 15 meilleurs supercalculateurs du monde composés de Gaudi2 jusqu'à la nouvelle technologie de packaging et le lancement complet de la plateforme cloud pour développeurs, ce discours contenait une énorme quantité d'informations.
Ces développements couvrent des aspects variés, mais force est de constater qu’ils ont tous le même thème : l’IA.
Éteignez ce wifi
Si vous pouvez trouver un moment parmi des milliers d'annonces pour démontrer le positionnement unique d'Intel dans la vague de l'IA, ce pourrait être la présentation du PDG de Rewind, Dan Siroker, après être monté sur scène.
Il s'agit d'une start-up en vogue. Son produit est comme une machine à voyager dans le temps. Une fois installé sur votre ordinateur, il peut vous aider à revoir tout ce que vous avez fait et vu et à le traiter avec l'IA. Après avoir démontré comment les capacités GPT-4 basées sur le réseau peuvent être utilisées avec Rewind, Gelsinger a demandé :
"Éteignez ce Wi-Fi."
Après avoir désactivé le Wi-Fi, Dan a sélectionné LLaMa en mode OpenVINO et est entré dans l'état de grand modèle hors ligne.
Kissinger demande de désactiver le Wi-Fi
Il a posé une question qui a été mentionnée dans une histoire que Kissinger vient de partager : quel est son son préféré.
Rewind a répondu : « Le son de sa petite-fille qui l'appelle « papa » (grand-père). » Il y a eu une salve d'applaudissements sur les lieux, ce qui montre qu'il peut utiliser la capacité du modèle à traiter les données hors ligne.
Imaginez ces terminaux existant en si grand nombre, avec la possibilité d'avoir de grands modèles sans être connectés à Internet.
Le support clé pour fournir cette fonctionnalité est OpenVINO d'Intel, la suite d'outils d'exécution d'inférence et de déploiement d'Intel qui offre aux développeurs des choix sur les plates-formes client et périphériques. Il comprend des modèles pré-entraînés optimisés pour l’intégration sur tous les systèmes d’exploitation et une variété de solutions cloud différentes, y compris plusieurs modèles d’IA génératifs tels que le modèle Llama 2 de Meta.
Alors que tout le monde se démène pour s'emparer du grand modèle, Intel choisit de commencer par ses avantages existants. À cette fin, Kissinger a également proposé le concept d'un PC IA, et Intel est une nécessité pour que ces PC se transforment de PC en PC IA. Si l’on applique le slogan publicitaire qui a fait le succès d’Intel, Kissinger veut dire cette fois que seul Intel Inside peut être qualifié de PC IA.
Un PC IA peut être réalisé. La plate-forme correspondante derrière est le processeur Intel Core Ultra, nommé Meteor Lake. Il est équipé du premier processeur de réseau neuronal (NPU) intégré d'Intel pour l'accélération de l'IA et le raisonnement local sur PC. Il s'agit d'un client Intel. Il s'agit d'un nœud important dans la feuille de route du processeur final. Il utilise pour la première fois la technologie de packaging Foveros, dispose d'un NPU intégré, possède des capacités indépendantes au niveau de la carte graphique et utilise le nœud de processus Intel 4. Il sortira le 14 décembre.
**Ces actions peuvent montrer le positionnement d'Intel dans la grande vague de modèles. Premièrement, elle doit saisir fermement les opportunités dans les terminaux et les centres de données et continuer à gagner de l'argent avec ses clients. Deuxièmement, elle doit servir les entreprises et les développeurs comme Rewind. accomplir une sorte de transformation géante. **
Ce dernier point peut sembler plus urgent, à tel point que l'élément que Kissinger a présenté pour la première fois lors de cette conférence n'était pas un GPU, un CPU ou une puce quelconque, mais un coupon pour Intel Developer Cloud.
Les développeurs présents peuvent bénéficier d'une semaine d'utilisation gratuite
Les panneaux de pourcentage sont partout
Pour réaliser l’une ou l’autre de ces deux choses, vous devez utiliser vos capacités pour impressionner l’autre partie, qu’il s’agisse d’un partenaire de l’écosystème ou d’un développeur.
Les performances de l'entreprise sont évidemment sous pression, vous pourrez donc constater que lors de cette conférence, Intel souhaite pleinement démontrer sa confiance.
Par conséquent, lors de la conférence, l'IA est partout, Intel est partout, et les signes et multiples de pourcentage sont également partout :
«1,09x»
Il s'agit du rythme de rattrapage de Gaudi2 par rapport au NVIDIA H100. Le H100 ne présente que de légers avantages en termes de performances de 1,09x (serveur) et 1,28x (hors ligne) par rapport à Gaudi2. Même s’ils sont encore à la traîne, être si proches est déjà un exploit.
« 150 % »
Il s’agit d’une amélioration des capacités HBM entre Gaudi3 à 5 nanomètres et Gaudi2 à 7 nanomètres.
«99,9%»
Ce sont les résultats MLPerf pour GPT-J pour la série Intel Xeon CPU Max, qui est la première fois qu'il est soumis à ce test et est le seul processeur à atteindre une précision de 99,9 %. Cette série offre jusqu'à 64 Go de bande passante élevée. mémoire.
« 240 % »
Il s'agit de l'amélioration des performances par watt par rapport au processeur E-core à 288 cœurs et économe en énergie Sierra Forest par rapport au Xeon de quatrième génération. Le processeur devrait également augmenter la densité du rack de 2,5 fois.
« 90 % »
Il s’agit du pourcentage d’augmentation des téléchargements d’OpenVINO l’année dernière. Des entreprises comme ai.io et Fit:Match ont démontré ce jour-là comment elles utilisent OpenVINO pour accélérer les applications : ai.io utilise OpenVINO pour évaluer les performances des athlètes ; Fit:Match utilise OpenVINO pour révolutionner les secteurs de la vente au détail et de la santé afin d'aider les consommateurs à trouver des vêtements qui leur vont. mieux.
Outre les données, Kissinger a également démontré un certain nombre de collaborations importantes.
Parmi eux, il y a ceux qui sont alliés depuis de nombreuses années, comme Microsoft, Kissinger a déclaré que les deux parties coopéreraient sur Copilot dans un avenir proche ; il y a aussi un nouveau lot de startups les plus en vogue, comme StabilityAI. , Kissinger a annoncé : « Un supercalculateur d'IA à grande échelle sera entièrement construit à l'aide de processeurs Intel Xeon et de 4 000 accélérateurs Intel Gaudi2, et Stability AI est son principal client.
Il existe également des alliances fortes, telles que le package de puces de test basé sur la spécification ouverte d'interconnexion haute vitesse Universal Core (UCIe), qui intègre non seulement les puces IP Intel UCIe basées sur le nœud de processus Intel 3, mais également Synopsys UCIe basé sur les particules de base IP du nœud de processus TSMC N3E. Ces puces sont interconnectées via la technologie de conditionnement avancée EMIB (Embedded Multi-die Interconnect Bridge).
Dans le même temps, Intel a également présenté une fois de plus le plan Intel Ignite visant à créer et à soutenir un écosystème de développeurs et de startups. Kissinger a mentionné un certain nombre de startups participant au plan Ignite dans son discours d'ouverture.
Un entrepreneur a déclaré à Silicon Stars que lorsque Gelsinger communiquait avec eux, ce qu'il leur demandait le plus, c'était leurs commentaires, comment les produits Intel pouvaient les aider et quels domaines devaient être améliorés.
Le corps est placé très bas.
2024, 2024 ou 2024 !
Ces développements pointent finalement vers le critère ultime, le plan « sur quatre ans et cinq nœuds de processus » que Kissinger s'est fixé.
** Kissinger a déclaré que le plan Intel "Cinq nœuds de processus en quatre ans" progressait sans problème. Intel 7 a atteint une production de masse à grande échelle, Intel 4 est prêt pour la production et Intel 3 progresse également comme prévu, avec l'objectif de 2023. La fin de l'année. Gelsinger redonne à Intel ses solides capacités d'exécution et de livraison. **
Au cours du discours d'ouverture, Gelsinger a présenté le premier lot de puces de test pour le processeur Intel Arrow Lake basé sur le nœud de processus Intel 20A. Arrow Lake sera lancé sur le marché client en 2024. Intel 20A sera le premier nœud de processus à appliquer la technologie d'alimentation arrière PowerVia et le nouveau transistor à grille polyvalent RibbonFET. Le nœud de processus Intel 18A, qui utilisera également ces deux technologies, progresse également comme prévu et sera prêt pour la production au second semestre 2024.
Les processeurs Intel Xeon de cinquième génération seront commercialisés le 14 décembre, tandis que Sierra Forest sera disponible au premier semestre 2024.
**Strata, une plateforme qui permet le développement de logiciels natifs pour l'informatique de pointe, sera également lancée en 2024. Il s’agit d’un moyen de faire évoluer l’infrastructure requise pour l’IA intelligente de pointe et hybride et d’intégrer les applications verticales d’Intel et de tiers au sein d’un écosystème unique. **
Vous remarquerez peut-être également que 2024 apparaît dans de nombreux plans de produits clés. En tant qu’année critique du plan quadriennal, il va sans dire à quel point 2024 est importante pour Intel.
Un dirigeant d'Intel m'a même dit que c'était peut-être l'année la plus importante de cette génération, ou de sa carrière :
« Cette année, nos propres progrès technologiques et la préparation technologique de nos clients s'adapteront l'un à l'autre et entraîneront des changements clés.
Lors de cette conférence de presse riche en informations, Intel espère dire à tout le monde qu'en tant que « société d'infrastructure » qui rend l'IA possible, les entreprises qui souhaitent développer l'IA aujourd'hui ne peuvent toujours pas l'éviter. Dans tous les aspects de l'IA auxquels vous pouvez penser, Intel est là pour vous attendre, même si certains restent la « deuxième option ».
Mais ce qu’Intel souhaite faire savoir au monde extérieur, c’est que d’ici 2024, il ne se contentera plus d’« être là », et que sa contre-attaque a véritablement commencé.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Une puce à 288 cœurs, un supercalculateur alimenté par 4 000 processeurs IA, et un gros modèle qui ne nécessite pas de connexion Internet… Intel va riposter !
Source originale : Silicon Star People
Auteur : Wang Zhaoyang
En 2022, avant son discours à la conférence Intel, le PDG d'Intel, Pat Gelsinger, a fait des pompes dans les coulisses ; mais cette année, il l'a fait directement sur la scène du discours d'ouverture.
Le 19 septembre, au San Jose Convention and Exhibition Center, le PDG qui souhaitait ramener Intel au sommet semblait plein d'énergie. Au cours du discours d'ouverture de 90 minutes, Kissinger, qui s'était échauffé, a fait diverses annonces majeures : des derniers progrès des puces à 288 cœurs, à une série de puces de nouvelle génération qui ne peuvent être annoncées qu'avec des noms de code internes, en passant par 4 000 Depuis les 15 meilleurs supercalculateurs du monde composés de Gaudi2 jusqu'à la nouvelle technologie de packaging et le lancement complet de la plateforme cloud pour développeurs, ce discours contenait une énorme quantité d'informations.
Ces développements couvrent des aspects variés, mais force est de constater qu’ils ont tous le même thème : l’IA.
Éteignez ce wifi
Si vous pouvez trouver un moment parmi des milliers d'annonces pour démontrer le positionnement unique d'Intel dans la vague de l'IA, ce pourrait être la présentation du PDG de Rewind, Dan Siroker, après être monté sur scène.
Il s'agit d'une start-up en vogue. Son produit est comme une machine à voyager dans le temps. Une fois installé sur votre ordinateur, il peut vous aider à revoir tout ce que vous avez fait et vu et à le traiter avec l'IA. Après avoir démontré comment les capacités GPT-4 basées sur le réseau peuvent être utilisées avec Rewind, Gelsinger a demandé :
"Éteignez ce Wi-Fi."
Après avoir désactivé le Wi-Fi, Dan a sélectionné LLaMa en mode OpenVINO et est entré dans l'état de grand modèle hors ligne.
Il a posé une question qui a été mentionnée dans une histoire que Kissinger vient de partager : quel est son son préféré.
Rewind a répondu : « Le son de sa petite-fille qui l'appelle « papa » (grand-père). » Il y a eu une salve d'applaudissements sur les lieux, ce qui montre qu'il peut utiliser la capacité du modèle à traiter les données hors ligne.
Imaginez ces terminaux existant en si grand nombre, avec la possibilité d'avoir de grands modèles sans être connectés à Internet.
Le support clé pour fournir cette fonctionnalité est OpenVINO d'Intel, la suite d'outils d'exécution d'inférence et de déploiement d'Intel qui offre aux développeurs des choix sur les plates-formes client et périphériques. Il comprend des modèles pré-entraînés optimisés pour l’intégration sur tous les systèmes d’exploitation et une variété de solutions cloud différentes, y compris plusieurs modèles d’IA génératifs tels que le modèle Llama 2 de Meta.
Alors que tout le monde se démène pour s'emparer du grand modèle, Intel choisit de commencer par ses avantages existants. À cette fin, Kissinger a également proposé le concept d'un PC IA, et Intel est une nécessité pour que ces PC se transforment de PC en PC IA. Si l’on applique le slogan publicitaire qui a fait le succès d’Intel, Kissinger veut dire cette fois que seul Intel Inside peut être qualifié de PC IA.
Un PC IA peut être réalisé. La plate-forme correspondante derrière est le processeur Intel Core Ultra, nommé Meteor Lake. Il est équipé du premier processeur de réseau neuronal (NPU) intégré d'Intel pour l'accélération de l'IA et le raisonnement local sur PC. Il s'agit d'un client Intel. Il s'agit d'un nœud important dans la feuille de route du processeur final. Il utilise pour la première fois la technologie de packaging Foveros, dispose d'un NPU intégré, possède des capacités indépendantes au niveau de la carte graphique et utilise le nœud de processus Intel 4. Il sortira le 14 décembre.
Ce dernier point peut sembler plus urgent, à tel point que l'élément que Kissinger a présenté pour la première fois lors de cette conférence n'était pas un GPU, un CPU ou une puce quelconque, mais un coupon pour Intel Developer Cloud.
Les panneaux de pourcentage sont partout
Pour réaliser l’une ou l’autre de ces deux choses, vous devez utiliser vos capacités pour impressionner l’autre partie, qu’il s’agisse d’un partenaire de l’écosystème ou d’un développeur.
Les performances de l'entreprise sont évidemment sous pression, vous pourrez donc constater que lors de cette conférence, Intel souhaite pleinement démontrer sa confiance.
Par conséquent, lors de la conférence, l'IA est partout, Intel est partout, et les signes et multiples de pourcentage sont également partout :
«1,09x»
Il s'agit du rythme de rattrapage de Gaudi2 par rapport au NVIDIA H100. Le H100 ne présente que de légers avantages en termes de performances de 1,09x (serveur) et 1,28x (hors ligne) par rapport à Gaudi2. Même s’ils sont encore à la traîne, être si proches est déjà un exploit.
« 150 % »
Il s’agit d’une amélioration des capacités HBM entre Gaudi3 à 5 nanomètres et Gaudi2 à 7 nanomètres.
Ce sont les résultats MLPerf pour GPT-J pour la série Intel Xeon CPU Max, qui est la première fois qu'il est soumis à ce test et est le seul processeur à atteindre une précision de 99,9 %. Cette série offre jusqu'à 64 Go de bande passante élevée. mémoire.
« 240 % »
Il s'agit de l'amélioration des performances par watt par rapport au processeur E-core à 288 cœurs et économe en énergie Sierra Forest par rapport au Xeon de quatrième génération. Le processeur devrait également augmenter la densité du rack de 2,5 fois.
« 90 % »
Il s’agit du pourcentage d’augmentation des téléchargements d’OpenVINO l’année dernière. Des entreprises comme ai.io et Fit:Match ont démontré ce jour-là comment elles utilisent OpenVINO pour accélérer les applications : ai.io utilise OpenVINO pour évaluer les performances des athlètes ; Fit:Match utilise OpenVINO pour révolutionner les secteurs de la vente au détail et de la santé afin d'aider les consommateurs à trouver des vêtements qui leur vont. mieux.
Outre les données, Kissinger a également démontré un certain nombre de collaborations importantes.
Parmi eux, il y a ceux qui sont alliés depuis de nombreuses années, comme Microsoft, Kissinger a déclaré que les deux parties coopéreraient sur Copilot dans un avenir proche ; il y a aussi un nouveau lot de startups les plus en vogue, comme StabilityAI. , Kissinger a annoncé : « Un supercalculateur d'IA à grande échelle sera entièrement construit à l'aide de processeurs Intel Xeon et de 4 000 accélérateurs Intel Gaudi2, et Stability AI est son principal client.
Il existe également des alliances fortes, telles que le package de puces de test basé sur la spécification ouverte d'interconnexion haute vitesse Universal Core (UCIe), qui intègre non seulement les puces IP Intel UCIe basées sur le nœud de processus Intel 3, mais également Synopsys UCIe basé sur les particules de base IP du nœud de processus TSMC N3E. Ces puces sont interconnectées via la technologie de conditionnement avancée EMIB (Embedded Multi-die Interconnect Bridge).
Un entrepreneur a déclaré à Silicon Stars que lorsque Gelsinger communiquait avec eux, ce qu'il leur demandait le plus, c'était leurs commentaires, comment les produits Intel pouvaient les aider et quels domaines devaient être améliorés.
Le corps est placé très bas.
2024, 2024 ou 2024 !
Ces développements pointent finalement vers le critère ultime, le plan « sur quatre ans et cinq nœuds de processus » que Kissinger s'est fixé.
** Kissinger a déclaré que le plan Intel "Cinq nœuds de processus en quatre ans" progressait sans problème. Intel 7 a atteint une production de masse à grande échelle, Intel 4 est prêt pour la production et Intel 3 progresse également comme prévu, avec l'objectif de 2023. La fin de l'année. Gelsinger redonne à Intel ses solides capacités d'exécution et de livraison. **
Au cours du discours d'ouverture, Gelsinger a présenté le premier lot de puces de test pour le processeur Intel Arrow Lake basé sur le nœud de processus Intel 20A. Arrow Lake sera lancé sur le marché client en 2024. Intel 20A sera le premier nœud de processus à appliquer la technologie d'alimentation arrière PowerVia et le nouveau transistor à grille polyvalent RibbonFET. Le nœud de processus Intel 18A, qui utilisera également ces deux technologies, progresse également comme prévu et sera prêt pour la production au second semestre 2024.
**Strata, une plateforme qui permet le développement de logiciels natifs pour l'informatique de pointe, sera également lancée en 2024. Il s’agit d’un moyen de faire évoluer l’infrastructure requise pour l’IA intelligente de pointe et hybride et d’intégrer les applications verticales d’Intel et de tiers au sein d’un écosystème unique. **
Vous remarquerez peut-être également que 2024 apparaît dans de nombreux plans de produits clés. En tant qu’année critique du plan quadriennal, il va sans dire à quel point 2024 est importante pour Intel.
Un dirigeant d'Intel m'a même dit que c'était peut-être l'année la plus importante de cette génération, ou de sa carrière :
« Cette année, nos propres progrès technologiques et la préparation technologique de nos clients s'adapteront l'un à l'autre et entraîneront des changements clés.
Lors de cette conférence de presse riche en informations, Intel espère dire à tout le monde qu'en tant que « société d'infrastructure » qui rend l'IA possible, les entreprises qui souhaitent développer l'IA aujourd'hui ne peuvent toujours pas l'éviter. Dans tous les aspects de l'IA auxquels vous pouvez penser, Intel est là pour vous attendre, même si certains restent la « deuxième option ».
Mais ce qu’Intel souhaite faire savoir au monde extérieur, c’est que d’ici 2024, il ne se contentera plus d’« être là », et que sa contre-attaque a véritablement commencé.