Um chip de 288 núcleos, um supercomputador equipado com 4.000 processadores AI e um modelo grande que não requer conexão com a Internet... A Intel vai reagir!
Em 2022, antes de seu discurso na Conferência da Intel, o CEO da Intel, Pat Gelsinger, fez flexões nos bastidores; mas este ano, ele fez isso diretamente no palco do discurso principal.
Houve uma salva de palmas
No dia 19 de setembro, no Centro de Convenções e Exposições de San Jose, o CEO que queria trazer a Intel de volta ao topo parecia cheio de energia. Durante o discurso de abertura de 90 minutos, Kissinger, que havia se aquecido, fez vários anúncios importantes: desde o mais recente progresso de chips de 288 núcleos até uma série de chips de próxima geração que só podem ser anunciados com codinomes internos, até 4.000 Dos 15 melhores supercomputadores do mundo compostos por Gaudi2 à nova tecnologia de embalagem e ao lançamento completo da plataforma de nuvem para desenvolvedores, este discurso continha uma enorme quantidade de informações.
Estes desenvolvimentos abrangem uma variedade de aspectos, mas é claro que todos têm o mesmo tema: IA.
Desligue esse wi-fi
Se você encontrar um momento entre milhares de anúncios para demonstrar o posicionamento único da Intel na onda de IA, pode ser a apresentação do CEO da Rewind, Dan Siroker, após subir ao palco.
Esta é uma empresa iniciante. Seu produto é como uma máquina do tempo. Uma vez instalado em seu computador, ele pode ajudá-lo a revisar tudo o que você fez e viu e processá-lo com IA. Depois de demonstrar como os recursos do GPT-4 baseados em rede podem ser usados com o Rewind, Gelsinger perguntou:
"Desligue esse Wi-Fi."
Depois de desligar o Wi-Fi, Dan selecionou LLaMa no modo OpenVINO e entrou no estado de modelo grande offline.
Kissinger instrui para desligar o Wi-Fi
Ele inseriu uma pergunta que foi mencionada em uma história que Kissinger acabou de compartilhar: Qual é o seu som favorito.
Rewind respondeu: “O som de sua neta chamando-o de ‘papa’ (vovô).” Houve uma salva de palmas no local, o que mostra que ele pode usar a capacidade do modelo de processar dados offline.
Imagine essas máquinas terminais existindo em tão grande número, com a capacidade de ter modelos grandes sem estar conectado à Internet.
O principal suporte para fornecer esse recurso é o OpenVINO da Intel, o conjunto de ferramentas de tempo de execução e inferência de IA da Intel que fornece aos desenvolvedores opções em plataformas de cliente e de borda. Inclui modelos pré-treinados otimizados para integração entre sistemas operacionais e uma variedade de diferentes soluções em nuvem, incluindo vários modelos generativos de IA, como o modelo Llama 2 da Meta.
Quando todos estão lutando para adquirir o grande modelo, a Intel opta por começar com as vantagens existentes. Para tanto, Kissinger também propôs o conceito de PC com IA, e a Intel é uma necessidade para que esses PCs se transformem de PCs em PCs com IA. Se aplicarmos o slogan publicitário que tornou a Intel tão bem-sucedida, Kissinger quer dizer desta vez que apenas o Intel Inside pode ser chamado de AI PC.
AI PC pode ser realizado. A plataforma correspondente por trás dele é o processador Intel Core Ultra, codinome Meteor Lake. Ele é equipado com o primeiro processador de rede neural integrado (NPU) da Intel para aceleração de IA e raciocínio local no PC. Este é um cliente da Intel É um nó importante no roteiro do processador final. Ele usa a tecnologia de empacotamento Foveros pela primeira vez, possui um NPU integrado, possui recursos de nível de placa gráfica independente e usa o nó de processo Intel 4. Será lançado no dia 14 de dezembro.
**Essas ações podem mostrar o posicionamento da Intel na grande onda de modelos. Primeiro, ela deve aproveitar com firmeza as oportunidades em terminais e data centers e continuar a ganhar dinheiro com seus clientes. Em segundo lugar, ela deve servir empresas e desenvolvedores como a Rewind. Ou, completar uma espécie de transformação gigante. **
Este último pode parecer mais urgente, tanto que o item que Kissinger exibiu pela primeira vez nesta conferência não foi uma GPU, CPU ou qualquer chip, mas um cupom para o Intel Developer Cloud.
Os desenvolvedores presentes podem obter uma semana de uso gratuito
Os sinais de porcentagem estão por toda parte
Para conseguir qualquer uma dessas duas coisas, você deve usar suas capacidades para impressionar a outra parte, seja ela um parceiro do ecossistema ou um desenvolvedor.
O desempenho da empresa está obviamente sob pressão, então você pode ver que nesta conferência a Intel quer demonstrar plenamente a sua confiança.
Portanto, na conferência, a IA está em toda parte, a Intel está em toda parte e os sinais percentuais e múltiplos também estão em toda parte:
“1,09x”
Este é o ritmo de recuperação do Gaudi2 em comparação com o NVIDIA H100. O H100 mostra apenas pequenas vantagens de desempenho de 1,09x (servidor) e 1,28x (offline) em comparação com o Gaudi2. Embora ainda estejam atrasados, estar tão perto já é uma conquista.
“150%”
Esta é uma melhoria nas capacidades da HBM entre o Gaudi3 de 5 nanômetros e o Gaudi2 de 7 nanômetros.
“99,9%”
Estes são os resultados do MLPerf para GPT-J para a série Intel Xeon CPU Max, que é a primeira vez que é submetido a este teste e é o único CPU a atingir 99,9% de precisão. Esta série oferece até 64 GB de alta largura de banda memória.
“240%”
Esta é a melhoria de desempenho por watt em comparação com o processador E-core de 288 núcleos e eficiência energética Sierra Forest em comparação com o Xeon de quarta geração.O processador também deve aumentar a densidade do rack em 2,5 vezes.
“90%”
Este é o aumento percentual nos downloads do OpenVINO no ano passado. Empresas como ai.io e Fit:Match demonstraram no dia como usam OpenVINO para acelerar aplicações: ai.io usa OpenVINO para avaliar o desempenho dos atletas; Fit:Match usa OpenVINO para revolucionar os setores de varejo e saúde para ajudar os consumidores a encontrar roupas que caibam melhorar.
Além dos dados, Kissinger também demonstrou uma série de colaborações importantes.
Entre eles, há aqueles que são aliados há muitos anos, como a Microsoft, Kissinger disse que as duas partes irão cooperar no Copilot num futuro próximo; há também um novo lote de startups mais quentes, como StabilityAI , Kissinger anunciou, Um supercomputador de IA em grande escala será construído inteiramente usando processadores Intel Xeon e 4.000 aceleradores Intel Gaudi2, e Stability AI é seu principal cliente.
Existem também algumas alianças fortes, como o pacote de chips de teste baseado na Especificação Aberta de Interconexão de Alta Velocidade Universal Core (UCIe), que não apenas integra chips Intel UCIe IP baseados no nó de processo Intel 3, mas também Synopsys UCIe baseado em as partículas principais de IP do nó de processo TSMC N3E. Essas matrizes são interconectadas por meio da avançada tecnologia de empacotamento EMIB (Embedded Multi-die Interconnect Bridge).
Ao mesmo tempo, a Intel também apresentou mais uma vez o plano Intel Ignite para criar e apoiar um ecossistema de desenvolvedores e startups.Kissinger mencionou uma série de startups participantes do plano Ignite em seu discurso de abertura.
Um empresário disse à Silicon Stars que quando Gelsinger se comunicou com eles, o que ele mais perguntou sobre eles foi o feedback deles, como os produtos da Intel podem ajudá-los e quais áreas precisam ser melhoradas.
O corpo é colocado muito baixo.
2024, 2024 ou 2024!
Estes desenvolvimentos apontam, em última análise, para o critério último, o plano de “quatro anos, cinco nós de processo” que Kissinger estabeleceu para si mesmo.
** Kissinger disse que o plano "Cinco nós de processo em quatro anos" da Intel está progredindo sem problemas. Intel 7 alcançou produção em massa em grande escala, Intel 4 está pronto para produção e Intel 3 também está progredindo conforme planejado, com meta de 2023 Final do ano. Gelsinger está devolvendo à Intel sua forte capacidade de execução e entrega. **
Durante o discurso de abertura, Gelsinger demonstrou o primeiro lote de chips de teste para o processador Intel Arrow Lake baseado no nó de processo Intel 20A. Arrow Lake será lançado para o mercado cliente em 2024. Intel 20A será o primeiro nó de processo a aplicar a tecnologia de fonte de alimentação traseira PowerVia e o novo transistor de porta versátil RibbonFET. O nó de processo Intel 18A, que também utilizará essas duas tecnologias, também está progredindo conforme planejado e estará pronto para produção no segundo semestre de 2024.
Os processadores Intel Xeon de quinta geração serão lançados em 14 de dezembro, enquanto o Sierra Forest estará disponível no primeiro semestre de 2024.
**Strata, uma plataforma que fornece desenvolvimento de software nativo para edge computing, também será lançada em 2024. É uma forma de ampliar a infraestrutura necessária para IA híbrida e de ponta inteligente e integrar aplicativos verticais da Intel e de terceiros em um único ecossistema. **
Você também pode notar que 2024 aparece em muitos planos de produtos importantes. Sendo um ano crítico no plano de quatro anos, nem é preciso dizer a importância de 2024 para a Intel.
Um executivo da Intel até me disse que este pode ser o ano mais importante desta geração, ou de sua carreira:
"Nosso próprio progresso tecnológico e a prontidão tecnológica de nossos clientes se adaptarão este ano e trarão mudanças importantes."
Nesta conferência de imprensa com uma grande quantidade de informações, a Intel espera dizer a todos que, como uma “empresa de infraestrutura” que torna a IA possível, as empresas que desejam desenvolver a IA hoje ainda não podem evitá-la. Em todos os aspectos da IA que você possa imaginar, a Intel está esperando por você, mesmo que alguns ainda sejam a “segunda opção”.
Mas o que a Intel quer que o mundo exterior saiba mais é que, até 2024, já não se contentará apenas em “estar lá” e o seu contra-ataque já começou verdadeiramente.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
Um chip de 288 núcleos, um supercomputador equipado com 4.000 processadores AI e um modelo grande que não requer conexão com a Internet... A Intel vai reagir!
Fonte original: Silicon Star People
Autor: Wang Zhaoyang
Em 2022, antes de seu discurso na Conferência da Intel, o CEO da Intel, Pat Gelsinger, fez flexões nos bastidores; mas este ano, ele fez isso diretamente no palco do discurso principal.
No dia 19 de setembro, no Centro de Convenções e Exposições de San Jose, o CEO que queria trazer a Intel de volta ao topo parecia cheio de energia. Durante o discurso de abertura de 90 minutos, Kissinger, que havia se aquecido, fez vários anúncios importantes: desde o mais recente progresso de chips de 288 núcleos até uma série de chips de próxima geração que só podem ser anunciados com codinomes internos, até 4.000 Dos 15 melhores supercomputadores do mundo compostos por Gaudi2 à nova tecnologia de embalagem e ao lançamento completo da plataforma de nuvem para desenvolvedores, este discurso continha uma enorme quantidade de informações.
Estes desenvolvimentos abrangem uma variedade de aspectos, mas é claro que todos têm o mesmo tema: IA.
Desligue esse wi-fi
Se você encontrar um momento entre milhares de anúncios para demonstrar o posicionamento único da Intel na onda de IA, pode ser a apresentação do CEO da Rewind, Dan Siroker, após subir ao palco.
Esta é uma empresa iniciante. Seu produto é como uma máquina do tempo. Uma vez instalado em seu computador, ele pode ajudá-lo a revisar tudo o que você fez e viu e processá-lo com IA. Depois de demonstrar como os recursos do GPT-4 baseados em rede podem ser usados com o Rewind, Gelsinger perguntou:
"Desligue esse Wi-Fi."
Depois de desligar o Wi-Fi, Dan selecionou LLaMa no modo OpenVINO e entrou no estado de modelo grande offline.
Ele inseriu uma pergunta que foi mencionada em uma história que Kissinger acabou de compartilhar: Qual é o seu som favorito.
Rewind respondeu: “O som de sua neta chamando-o de ‘papa’ (vovô).” Houve uma salva de palmas no local, o que mostra que ele pode usar a capacidade do modelo de processar dados offline.
Imagine essas máquinas terminais existindo em tão grande número, com a capacidade de ter modelos grandes sem estar conectado à Internet.
O principal suporte para fornecer esse recurso é o OpenVINO da Intel, o conjunto de ferramentas de tempo de execução e inferência de IA da Intel que fornece aos desenvolvedores opções em plataformas de cliente e de borda. Inclui modelos pré-treinados otimizados para integração entre sistemas operacionais e uma variedade de diferentes soluções em nuvem, incluindo vários modelos generativos de IA, como o modelo Llama 2 da Meta.
Quando todos estão lutando para adquirir o grande modelo, a Intel opta por começar com as vantagens existentes. Para tanto, Kissinger também propôs o conceito de PC com IA, e a Intel é uma necessidade para que esses PCs se transformem de PCs em PCs com IA. Se aplicarmos o slogan publicitário que tornou a Intel tão bem-sucedida, Kissinger quer dizer desta vez que apenas o Intel Inside pode ser chamado de AI PC.
AI PC pode ser realizado. A plataforma correspondente por trás dele é o processador Intel Core Ultra, codinome Meteor Lake. Ele é equipado com o primeiro processador de rede neural integrado (NPU) da Intel para aceleração de IA e raciocínio local no PC. Este é um cliente da Intel É um nó importante no roteiro do processador final. Ele usa a tecnologia de empacotamento Foveros pela primeira vez, possui um NPU integrado, possui recursos de nível de placa gráfica independente e usa o nó de processo Intel 4. Será lançado no dia 14 de dezembro.
Este último pode parecer mais urgente, tanto que o item que Kissinger exibiu pela primeira vez nesta conferência não foi uma GPU, CPU ou qualquer chip, mas um cupom para o Intel Developer Cloud.
Os sinais de porcentagem estão por toda parte
Para conseguir qualquer uma dessas duas coisas, você deve usar suas capacidades para impressionar a outra parte, seja ela um parceiro do ecossistema ou um desenvolvedor.
O desempenho da empresa está obviamente sob pressão, então você pode ver que nesta conferência a Intel quer demonstrar plenamente a sua confiança.
Portanto, na conferência, a IA está em toda parte, a Intel está em toda parte e os sinais percentuais e múltiplos também estão em toda parte:
“1,09x”
Este é o ritmo de recuperação do Gaudi2 em comparação com o NVIDIA H100. O H100 mostra apenas pequenas vantagens de desempenho de 1,09x (servidor) e 1,28x (offline) em comparação com o Gaudi2. Embora ainda estejam atrasados, estar tão perto já é uma conquista.
“150%”
Esta é uma melhoria nas capacidades da HBM entre o Gaudi3 de 5 nanômetros e o Gaudi2 de 7 nanômetros.
Estes são os resultados do MLPerf para GPT-J para a série Intel Xeon CPU Max, que é a primeira vez que é submetido a este teste e é o único CPU a atingir 99,9% de precisão. Esta série oferece até 64 GB de alta largura de banda memória.
“240%”
Esta é a melhoria de desempenho por watt em comparação com o processador E-core de 288 núcleos e eficiência energética Sierra Forest em comparação com o Xeon de quarta geração.O processador também deve aumentar a densidade do rack em 2,5 vezes.
“90%”
Este é o aumento percentual nos downloads do OpenVINO no ano passado. Empresas como ai.io e Fit:Match demonstraram no dia como usam OpenVINO para acelerar aplicações: ai.io usa OpenVINO para avaliar o desempenho dos atletas; Fit:Match usa OpenVINO para revolucionar os setores de varejo e saúde para ajudar os consumidores a encontrar roupas que caibam melhorar.
Além dos dados, Kissinger também demonstrou uma série de colaborações importantes.
Entre eles, há aqueles que são aliados há muitos anos, como a Microsoft, Kissinger disse que as duas partes irão cooperar no Copilot num futuro próximo; há também um novo lote de startups mais quentes, como StabilityAI , Kissinger anunciou, Um supercomputador de IA em grande escala será construído inteiramente usando processadores Intel Xeon e 4.000 aceleradores Intel Gaudi2, e Stability AI é seu principal cliente.
Existem também algumas alianças fortes, como o pacote de chips de teste baseado na Especificação Aberta de Interconexão de Alta Velocidade Universal Core (UCIe), que não apenas integra chips Intel UCIe IP baseados no nó de processo Intel 3, mas também Synopsys UCIe baseado em as partículas principais de IP do nó de processo TSMC N3E. Essas matrizes são interconectadas por meio da avançada tecnologia de empacotamento EMIB (Embedded Multi-die Interconnect Bridge).
Um empresário disse à Silicon Stars que quando Gelsinger se comunicou com eles, o que ele mais perguntou sobre eles foi o feedback deles, como os produtos da Intel podem ajudá-los e quais áreas precisam ser melhoradas.
O corpo é colocado muito baixo.
2024, 2024 ou 2024!
Estes desenvolvimentos apontam, em última análise, para o critério último, o plano de “quatro anos, cinco nós de processo” que Kissinger estabeleceu para si mesmo.
** Kissinger disse que o plano "Cinco nós de processo em quatro anos" da Intel está progredindo sem problemas. Intel 7 alcançou produção em massa em grande escala, Intel 4 está pronto para produção e Intel 3 também está progredindo conforme planejado, com meta de 2023 Final do ano. Gelsinger está devolvendo à Intel sua forte capacidade de execução e entrega. **
Durante o discurso de abertura, Gelsinger demonstrou o primeiro lote de chips de teste para o processador Intel Arrow Lake baseado no nó de processo Intel 20A. Arrow Lake será lançado para o mercado cliente em 2024. Intel 20A será o primeiro nó de processo a aplicar a tecnologia de fonte de alimentação traseira PowerVia e o novo transistor de porta versátil RibbonFET. O nó de processo Intel 18A, que também utilizará essas duas tecnologias, também está progredindo conforme planejado e estará pronto para produção no segundo semestre de 2024.
**Strata, uma plataforma que fornece desenvolvimento de software nativo para edge computing, também será lançada em 2024. É uma forma de ampliar a infraestrutura necessária para IA híbrida e de ponta inteligente e integrar aplicativos verticais da Intel e de terceiros em um único ecossistema. **
Você também pode notar que 2024 aparece em muitos planos de produtos importantes. Sendo um ano crítico no plano de quatro anos, nem é preciso dizer a importância de 2024 para a Intel.
Um executivo da Intel até me disse que este pode ser o ano mais importante desta geração, ou de sua carreira:
"Nosso próprio progresso tecnológico e a prontidão tecnológica de nossos clientes se adaptarão este ano e trarão mudanças importantes."
Nesta conferência de imprensa com uma grande quantidade de informações, a Intel espera dizer a todos que, como uma “empresa de infraestrutura” que torna a IA possível, as empresas que desejam desenvolver a IA hoje ainda não podem evitá-la. Em todos os aspectos da IA que você possa imaginar, a Intel está esperando por você, mesmo que alguns ainda sejam a “segunda opção”.
Mas o que a Intel quer que o mundo exterior saiba mais é que, até 2024, já não se contentará apenas em “estar lá” e o seu contra-ataque já começou verdadeiramente.