Em 17 de outubro, o Bureau of Industry and Security (BIS) do Departamento de Comércio dos EUA emitiu uma nova proibição de exportação de chips, endurecendo as restrições à compra pela China de importantes chips high-end.
Restringir as importações chinesas de chips topo de gama é, sem dúvida, travar o desenvolvimento da indústria tecnológica chinesa. Estudos anteriores mostraram que, para cada aumento de 1 ponto no índice de poder de computação, a economia digital e o PIB aumentarão 3,5‰ e 1,8‰, respectivamente.
No entanto, o endurecimento das restrições externas não causou a estagnação da indústria de energia de computação da China, que ultrapassou a marca de trilhões de dólares. **De acordo com a Academia Chinesa de Tecnologia da Informação e Comunicação, até o final de 2021, a escala da principal indústria de energia de computação da China excedeu 1,5 trilhão de yuans, e a escala das indústrias relacionadas excedeu 8 trilhões de yuans.
Por trás do mercado de trilhões de dólares, empresas e governos trabalham juntos para aproveitar a era da IA.
Por um lado, desde o lançamento do ChatGPT, empresas nacionais e institutos de pesquisa lançaram mais de 130 grandes modelos em pouco mais de meio ano, entre os quais os principais players começaram a aplicar grandes modelos a cenários específicos e criar aplicações explosivas.
Por outro lado, a fim de construir uma base de poder computacional, os governos locais iniciaram a construção de centros de computação inteligente, colocando a informação em alta velocidade na era do big data, promovendo a inovação e atualização industrial e reduzindo o custo das empresas chamando as conquistas científicas e tecnológicas representadas por grandes modelos.
O comércio externo de chips esfriou gradualmente, e o mercado interno de poder de computação brilhou, e entre os dois céus de gelo e fogo, as pessoas não podem deixar de ficar curiosas:
Qual cidade capturou a batalha revolucionária da indústria de energia de computação da China? Como quebrar a cadeia da indústria de poder de computação? Neste processo, que empresas assumiram a responsabilidade de pioneiras?
**01 NVIDIA corta o fornecimento, afeta a geometria? **
"Se o modelo de linguagem grande é usado como base para processar as solicitações de inferência de 1,4 bilhão de pessoas na China ao mesmo tempo, a quantidade de computação necessária excede o poder de computação total dos centros de dados da China em 3 ordens de magnitude. "
Na Conferência Mundial de Inteligência Artificial (WAIC) de 2023, em Xangai, em julho deste ano, Wang Yu, professor de engenharia eletrônica na Universidade de Tsinghua, revelou a escala da lacuna de poder de computação doméstica.
Na verdade, não só os grandes modelos, mas também a popularidade de aplicações diversificadas em 5G, cidades inteligentes e Internet das Coisas também trouxe a aceleração contínua da geração de dados.
A IDC prevê que a escala do poder de computação inteligente da China chegará a 1271EFLOPS em 2026, com uma taxa composta de crescimento anual de 69,45%. No final de 2022, o "2023 Intelligent Computing Power Development White Paper" compilado pelo New H3C Group e pela China Academy of Information and Communications Technology mostra que o poder de computação doméstico total é de apenas 180EFLOPS. (Nota: FLOPS refere-se a operações de vírgula flutuante por segundo e 1271EFLOPS significa 1271 operações à exaescala por segundo.) )
** A fim de resolver a atual situação de escassez de energia de computação, o estado tem sucessivamente emitido uma série de documentos para apoiar e orientar todas as localidades para acelerar a construção de infraestrutura de energia de computação. **
Entre eles, o Plano de Ação para o Desenvolvimento de Alta Qualidade da Infraestrutura de Poder de Computação divulgado em outubro afirma claramente que a escala do poder de computação excederá 300EFLOPS em 2025, dos quais a proporção de poder de computação inteligente que pode ser usado para treinamento de grandes modelos precisa chegar a 35%.
Atualmente, existem cerca de 31 centros de computação inteligente financiados pelo governo, correspondendo ao poder de computação total de 10,13EFLOPS no plano, com um investimento total de quase 47 bilhões de yuans, que ainda está longe da escala de poder de computação inteligente total planejada de 105E, 50 centros de computação inteligente e escala de poder de computação de centro único de 2,1EFLOPS.
**Na verdade, não só na China, mas também no mundo, há uma escassez de poder de computação. De acordo com dados da OpenAI, há uma diferença de 10.000 vezes entre a taxa de crescimento do volume de computação de modelos e a taxa de crescimento do poder de computação de hardware de inteligência artificial. **
A escassez de poder de computação contribuiu primeiro para a disparada do preço das GPUs. Desde dezembro do ano passado, o preço do NVIDIA A100 aumentou quase 40% em 5 meses. O novo H100 deste ano é ainda mais inestimável.
Devido ao fluxo de pedidos, o ciclo de entrega da NVIDIA, a fabricante de GPUs com maior participação de mercado, foi estendido de um mês para mais de três meses, e até mesmo alguns pedidos podem não ser entregues até 2024. A principal razão é que a cadeia de suprimentos de chips é longa e fragmentada, e é impossível expandir rapidamente a capacidade de produção.
**Devido às restrições da proibição dos EUA, os planos dos fabricantes nacionais para expandir o poder de computação são mais difíceis de implementar do que Google, Meta e OpenAI. **
Antes de anunciar a nova rodada de proibição, a Nvidia adaptou as regras de restrição, fornecendo ao mercado chinês "versões castradas" dos principais chips de computação A800 e H800, que reduziram as velocidades de interconexão.
Em agosto, a mídia informou que empresas como Baidu, Tencent, Alibaba e ByteDance haviam encomendado US$ 5 bilhões em chips da Nvidia. Desse montante, US$ 1 bilhão foi encomendado para o A800, que deve ser entregue este ano. O pedido restante de US$ 4 bilhões será entregue em 2024.
Após o anúncio desta proibição, devido à densidade de desempenho como um requisito relevante para limitar o novo padrão, os chips A800 e H800, por excederem o padrão, também serão completamente proibidos.
No arquivo 8-K atualizado da NVIDIA junto à Comissão de Valores Mobiliários dos EUA (SEC), é mencionado que o governo dos EUA adiantou o tempo efetivo da proibição dos cinco chips GPU da NVIDIA, incluindo A100, A800, H100, H800 e L40S, do final original de novembro para entrar em vigor imediatamente.
**As alterações acima significam que os cerca de 100.000 chips A800 que a BAT já encomendou provavelmente não serão entregues. **
No entanto, a infraestrutura de poder de computação doméstica não parece ser muito afetada. Atualmente, existem quase 30 centros de computação inteligente que estão em construção ou concluídos, dos quais mais de 50% dos fornecedores de chips são Huawei Ascend.
Anteriormente, Liu Qingfeng, presidente da iFLYTEK, disse na conferência de imprensa que o desempenho do Huawei Ascend 910B já pode ser comparado com o A100.
**No geral, embora o endurecimento adicional das restrições dos EUA à China tenha arrastado o progresso da iteração de grandes modelos de alguns gigantes da Internet, a infraestrutura de poder de computação doméstica ainda está avançando constantemente. **
E como a dificuldade de importar chips continuará a aumentar no futuro próximo, por considerações de segurança da cadeia de suprimentos, espera-se que os fabricantes nacionais de chips inaugurem uma nova onda de oportunidades de desenvolvimento.
02 Avanço do Poder de Computação: Auto-pesquisa canhota, Ecologia da mão direita
Embora os únicos fabricantes de GPU que são geralmente reconhecidos no mercado internacional são NVIDIA e AMD, isso não significa que não há outras opções além deles.
**Em comparação com os chips ASIC, as GPUs têm a vantagem de uma forte versatilidade e são adequadas para vários campos de pesquisa. No entanto, subdividido em várias empresas, na verdade, há um excesso geral de poder de computação, ** como a grande capacidade de inferência de modelo que só precisa usar a GPU, e não precisa de seu poder de computação gráfica.
Por conseguinte, muitos fabricantes enveredaram pelo caminho da investigação e desenvolvimento independentes de acordo com as suas próprias necessidades. **
Por exemplo, o Alibaba lançou seu chip auto-desenvolvido Hanguang 800 em maio deste ano, que é dito ser o desempenho mais forte em chips de IA na época, com poder de computação equivalente a 10 CPUs; O chip de IA de função completa em nuvem autodesenvolvido da Baidu, Kunlun, também foi iterado para 3.0 e alcançará a produção em massa em 2024.
Entre as empresas de chips auto-desenvolvidas, a mais barulhenta é, sem dúvida, a já mencionada Huawei.
Recentemente, a máquina all-in-one Spark, criada em conjunto pela Huawei e pela iFLYTEK, foi colocada novamente na cúspide.
De acordo com informações públicas, a máquina all-in-one Xinghuo é baseada em CPU Kunpeng + GPU Ascend, usando armazenamento e rede Huawei para fornecer uma solução de gabinete completa, com poder de computação FP16 de 2,5 PFLOPS. Em contraste, a NVIDIA DGX A100 8-GPU, que é a mais popular no treinamento de modelos grandes, pode produzir 5PFLOPS FP16 poder de computação.
A "Wisdom" informou que em cenários específicos de grandes modelos, como Pangu e Xunfei Xinghuo, o Ascend 910 excedeu ligeiramente a versão A100 80GB PCIe, alcançando a substituição doméstica. No entanto, a versatilidade ainda é insuficiente, e outros modelos, como o GPT-3, precisam ser profundamente otimizados antes que possam funcionar sem problemas na plataforma Huawei.
Além disso, Moore Thread e Walltech que foram recentemente incluídas na lista de entidades nesta rodada de sanções também têm produtos de placa única GPU correspondentes, e alguns indicadores estão próximos da NVIDIA.
Além do impacto das sanções dos EUA, os chips autodesenvolvidos também podem enfraquecer a dependência excessiva da NVIDIA, aumentar a autonomia estratégica das empresas e assumir a liderança na expansão da escala do poder de computação à frente dos concorrentes. **
Uma prova é que mesmo empresas como Google, OpenAI e Apple, que não estão sujeitas a sanções, lançaram planos para desenvolver seus próprios chips.
Para não estarem mais sujeitos a um único fornecedor, alguns fabricantes de servidores também começaram a adotar uma arquitetura aberta que é compatível com chips de inovação independentes nacionais. **
Por exemplo, a Inspur Information, que atualmente responde pela maior quota de mercado de servidores domésticos, lançou uma arquitetura de computação aberta, que se diz ter as características de grande poder de computação, alta interconexão e forte expansão.
Com base nisso, a Inspur lançou três gerações de produtos de servidor de IA, percebeu o pouso de vários produtos de computação de IA com mais de 10 parceiros de chip e lançou a plataforma AIStation, que pode programar eficientemente mais de 30 chips de IA.
**Objetivamente falando, os fabricantes de servidores são um elo relativamente fraco na cadeia da indústria de poder de computação, o upstream precisa de gigantes internacionais com posições de monopólio como a NVIDIA para comprar chips, e o downstream é G-end e fabricantes de nuvem, que não têm poder de barganha de cima para baixo. **
Assim, podemos ver que, embora a receita da NVIDIA em um único trimestre tenha atingido um recorde, atingindo US$ 13,51 bilhões, um aumento anual de 101%, e o lucro líquido tenha subido 843% ano a ano, para US$ 6,188 bilhões, o lucro líquido da Inspur no primeiro semestre deste ano ainda está no vermelho.
**A fim de garantir que eles possam sobreviver ao trilhão de dinheiro do mercado, os fornecedores de servidores não estão poupando esforços para provar seu valor. Especificamente, ele fornece soluções de gerenciamento e implantação de cluster de servidor de IA para garantir alta disponibilidade, alto desempenho e alta eficiência dos servidores.
Ao mesmo tempo, os fabricantes também estão competindo para lançar relatórios, normas e diretrizes da indústria na esperança de ganhar voz.
Com chips autodesenvolvidos na mão esquerda e ecologia aberta na mão direita, a cadeia nacional da indústria de energia de computação está em uma situação complexa sem precedentes, com concorrência e cooperação entre elas.
A longo prazo, o verdadeiro fator decisivo para o avanço do poder de computação continua a ser a tecnologia, que abrange a ecologia, o software e o hardware, etc., que exige que os intervenientes a montante e a jusante façam um buraco para ultrapassar as dificuldades em conjunto.
Mas antes de realmente passar pela estrada independente do chip, o mais crítico é como usar cada centavo de poder de computação na lâmina, até certo ponto, a resposta a essa pergunta também sugere o esboço dos jogadores que ganharão o mercado de 100 bilhões no futuro. **
03 Usar bem o poder de computação é uma prioridade máxima
Antes de responder como usar bem o poder de computação, você precisa pensar em outra pergunta: como usar o poder de computação para usá-lo bem?
**O dilema enfrentado pela indústria doméstica de poder de computação é principalmente triplo: **
**Primeiro, falta de poder de computação. **Recursos de poder de computação de alta qualidade são insuficientes e dispersos, os incrementos de GPU são limitados e o estoque é seriamente insuficiente, o que é difícil de suportar ainda mais o treinamento de modelos grandes, e gradualmente se torna um novo problema de "pescoço preso".
Em segundo lugar, o poder de computação é caro. **A infraestrutura de poder de computação é uma indústria de ativos pesados e de capital intensivo, com as características de grande investimento inicial, iteração tecnológica rápida e alto limiar de construção, e sua construção e operação exigem enormes custos de tempo e capital, muito além do escopo das pequenas e médias empresas.
**Em terceiro lugar, a procura de poder de computação é diversificada e fragmentada, e os desfasamentos entre a oferta e a procura de recursos de poder de computação ocorrem ocasionalmente. **
O primeiro dilema está sendo resolvido, mas não é um esforço de um dia, portanto, nesta fase, o significado real de usar o poder de computação deve ser tornar o poder de computação menos dispendioso e capaz de lidar com necessidades diversificadas.
Então, quais empresas têm os movimentos mais imaginativos?
**Em termos de redução do consumo e aumento da eficiência para o centro de computação inteligente, vale a pena esperar pelo conceito do Alibaba de "ecologizar toda a cadeia de poder de computação da indústria". **
Como todos sabemos, o custo energético da formação de grandes modelos é muito elevado. Mas, na realidade, apenas 20% desse poder é usado para a computação em si, e o restante é usado para manter o servidor funcionando. O relatório ambiental de 2023 do Google confirma isso de lado. De acordo com o relatório, o Google consumiu quase 5,2 bilhões de galões de água em 2022 para resfriar centros de dados, o equivalente a 1/4 da água potável diária do mundo, e pode encher um lago oeste e meio.
A fim de alcançar um maior grau de economia de energia global e efeitos de redução de emissões, o Ant Group e a Academia Chinesa de Tecnologia da Informação e Comunicação (CAICT) lançaram o Livro Branco sobre Ecologização da Computação para Aplicações de Poder de Computação, que apresentou o conceito de "computação verde de ponta a ponta".
Especificamente, a computação verde de ponta a ponta deve considerar o custo de consumo de energia durante a operação no estágio inicial de construção, desde a produção de energia, produção de energia de computação (incluindo construtores de centros de computação inteligentes, fabricantes de hardware, fornecedores de nuvem) até aplicativos de poder de computação.
Em certa medida, com base na proporção de utilização de energia no passado, a redução de custos proporcionada pela cadeia da indústria ecológica pode ser mais eficaz em termos de custos do que o avanço da tecnologia de chips a curto prazo, que é conducente à atualização da inteligência digital das pequenas e médias empresas.
**Em termos de melhoria do nível de programação de poder de computação, Huawei, Alibaba, Tencent, Baidu e outras empresas contribuíram com sua própria força, mas entre elas, os genes empresariais mais compatíveis ainda são a Huawei. **
Atualmente, o projeto de agendamento de poder de computação mais central na China é o projeto "East Data and West Computing" proposto pela primeira vez explicitamente no "National Integrated Big Data Center Collaborative Innovation System Computing Power Hub Implementation Plan" em 2021, com o objetivo de construir a tarefa do sistema nacional de rede de poder de computação.
O armazenamento e processamento de dados no leste no oeste apresenta grandes desafios tanto do lado da oferta quanto do lado da distribuição.
Tomemos como exemplo o problema comum de perda de pacotes.
Quando vários servidores enviam um grande número de pacotes para um servidor ao mesmo tempo, o número de pacotes excede a capacidade de cache do switch e ocorre perda de pacotes, o que, por sua vez, afeta a eficiência da computação e do armazenamento.
Para resolver esse problema, a Huawei introduziu algoritmos inteligentes em switches de rede de data center, coletou informações de status de rede em tempo real, como profundidade da fila, taxa de transferência de largura de banda, modelo de tráfego e outras dimensões, e definiu dinamicamente o pipeline de fila ideal por meio de algoritmos inteligentes sem perdas, finalmente alcançando um equilíbrio de sem perda de pacotes, alto desempenho e baixa latência após o treinamento de simulação.
Além disso, a Huawei inovou tecnologias como roteamento adaptativo distribuído e algoritmos inteligentes de mapas em nuvem para participar do projeto e construção de nós de hub nacionais.
À medida que os grandes modelos domésticos se tornam cada vez mais práticos no caminho para capacitar milhares de indústrias, a questão de "como resolver o dilema do poder de computação da China" se tornará cada vez mais importante. Podemos ver que a cadeia da indústria de poder de computação da China produziu muitas mudanças, como os gigantes da Internet adicionando chips de código auto-desenvolvidos, a base de poder de computação construída com chips domésticos e a germinação da ecologia de software que não era valorizada no passado... Por trás dessas mudanças está a perseverança e a determinação das empresas chinesas em romper barreiras técnicas.
** Objetivamente falando, em termos de força técnica, os players nacionais ainda têm uma certa distância dos fabricantes de classe mundial, mas não se pode ignorar que mesmo a NVIDIA, que está em pleno andamento, tem pairado à beira da vida e da morte por muitos anos antes do advento da era da IA. **
A noite antes do amanhecer é mais escura, mas os raios de sol já estão no horizonte.
Recursos:
*Investigação da verdade da escassez de servidores de IA: o preço aumentou em 300.000 em dois dias, e até mesmo o "MSG King" entrou no mercado.
Poder de computação inteligente nova infraestrutura sobreposta no exterior atualização multimodal, aplicação de poder de computação para atender ao catalisador | Zheshang Valores Mobiliários
Mestre da Cadeia Tecnológica, Huawei Ecosystem | TF Valores Mobiliários
Demanda de treinamento explosão "sede de poder de computação" como resolver | Netinfo Jilin
A proibição de chips nos EUA se intensificou! NVIDIA, Intel ou Limited | Notícias Econômicas do Século 21*
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
A NVIDIA cortou o fornecimento de chips high-end com antecedência, e o poder de computação das empresas chinesas rompeu
Fonte original: Laboratório à base de silício
Em 17 de outubro, o Bureau of Industry and Security (BIS) do Departamento de Comércio dos EUA emitiu uma nova proibição de exportação de chips, endurecendo as restrições à compra pela China de importantes chips high-end.
Restringir as importações chinesas de chips topo de gama é, sem dúvida, travar o desenvolvimento da indústria tecnológica chinesa. Estudos anteriores mostraram que, para cada aumento de 1 ponto no índice de poder de computação, a economia digital e o PIB aumentarão 3,5‰ e 1,8‰, respectivamente.
No entanto, o endurecimento das restrições externas não causou a estagnação da indústria de energia de computação da China, que ultrapassou a marca de trilhões de dólares. **De acordo com a Academia Chinesa de Tecnologia da Informação e Comunicação, até o final de 2021, a escala da principal indústria de energia de computação da China excedeu 1,5 trilhão de yuans, e a escala das indústrias relacionadas excedeu 8 trilhões de yuans.
Por trás do mercado de trilhões de dólares, empresas e governos trabalham juntos para aproveitar a era da IA.
Por um lado, desde o lançamento do ChatGPT, empresas nacionais e institutos de pesquisa lançaram mais de 130 grandes modelos em pouco mais de meio ano, entre os quais os principais players começaram a aplicar grandes modelos a cenários específicos e criar aplicações explosivas.
Por outro lado, a fim de construir uma base de poder computacional, os governos locais iniciaram a construção de centros de computação inteligente, colocando a informação em alta velocidade na era do big data, promovendo a inovação e atualização industrial e reduzindo o custo das empresas chamando as conquistas científicas e tecnológicas representadas por grandes modelos.
O comércio externo de chips esfriou gradualmente, e o mercado interno de poder de computação brilhou, e entre os dois céus de gelo e fogo, as pessoas não podem deixar de ficar curiosas:
Qual cidade capturou a batalha revolucionária da indústria de energia de computação da China? Como quebrar a cadeia da indústria de poder de computação? Neste processo, que empresas assumiram a responsabilidade de pioneiras?
**01 NVIDIA corta o fornecimento, afeta a geometria? **
"Se o modelo de linguagem grande é usado como base para processar as solicitações de inferência de 1,4 bilhão de pessoas na China ao mesmo tempo, a quantidade de computação necessária excede o poder de computação total dos centros de dados da China em 3 ordens de magnitude. "
Na Conferência Mundial de Inteligência Artificial (WAIC) de 2023, em Xangai, em julho deste ano, Wang Yu, professor de engenharia eletrônica na Universidade de Tsinghua, revelou a escala da lacuna de poder de computação doméstica.
Na verdade, não só os grandes modelos, mas também a popularidade de aplicações diversificadas em 5G, cidades inteligentes e Internet das Coisas também trouxe a aceleração contínua da geração de dados.
A IDC prevê que a escala do poder de computação inteligente da China chegará a 1271EFLOPS em 2026, com uma taxa composta de crescimento anual de 69,45%. No final de 2022, o "2023 Intelligent Computing Power Development White Paper" compilado pelo New H3C Group e pela China Academy of Information and Communications Technology mostra que o poder de computação doméstico total é de apenas 180EFLOPS. (Nota: FLOPS refere-se a operações de vírgula flutuante por segundo e 1271EFLOPS significa 1271 operações à exaescala por segundo.) )
Entre eles, o Plano de Ação para o Desenvolvimento de Alta Qualidade da Infraestrutura de Poder de Computação divulgado em outubro afirma claramente que a escala do poder de computação excederá 300EFLOPS em 2025, dos quais a proporção de poder de computação inteligente que pode ser usado para treinamento de grandes modelos precisa chegar a 35%.
Atualmente, existem cerca de 31 centros de computação inteligente financiados pelo governo, correspondendo ao poder de computação total de 10,13EFLOPS no plano, com um investimento total de quase 47 bilhões de yuans, que ainda está longe da escala de poder de computação inteligente total planejada de 105E, 50 centros de computação inteligente e escala de poder de computação de centro único de 2,1EFLOPS.
**Na verdade, não só na China, mas também no mundo, há uma escassez de poder de computação. De acordo com dados da OpenAI, há uma diferença de 10.000 vezes entre a taxa de crescimento do volume de computação de modelos e a taxa de crescimento do poder de computação de hardware de inteligência artificial. **
A escassez de poder de computação contribuiu primeiro para a disparada do preço das GPUs. Desde dezembro do ano passado, o preço do NVIDIA A100 aumentou quase 40% em 5 meses. O novo H100 deste ano é ainda mais inestimável.
Devido ao fluxo de pedidos, o ciclo de entrega da NVIDIA, a fabricante de GPUs com maior participação de mercado, foi estendido de um mês para mais de três meses, e até mesmo alguns pedidos podem não ser entregues até 2024. A principal razão é que a cadeia de suprimentos de chips é longa e fragmentada, e é impossível expandir rapidamente a capacidade de produção.
**Devido às restrições da proibição dos EUA, os planos dos fabricantes nacionais para expandir o poder de computação são mais difíceis de implementar do que Google, Meta e OpenAI. **
Antes de anunciar a nova rodada de proibição, a Nvidia adaptou as regras de restrição, fornecendo ao mercado chinês "versões castradas" dos principais chips de computação A800 e H800, que reduziram as velocidades de interconexão.
Em agosto, a mídia informou que empresas como Baidu, Tencent, Alibaba e ByteDance haviam encomendado US$ 5 bilhões em chips da Nvidia. Desse montante, US$ 1 bilhão foi encomendado para o A800, que deve ser entregue este ano. O pedido restante de US$ 4 bilhões será entregue em 2024.
No arquivo 8-K atualizado da NVIDIA junto à Comissão de Valores Mobiliários dos EUA (SEC), é mencionado que o governo dos EUA adiantou o tempo efetivo da proibição dos cinco chips GPU da NVIDIA, incluindo A100, A800, H100, H800 e L40S, do final original de novembro para entrar em vigor imediatamente.
**As alterações acima significam que os cerca de 100.000 chips A800 que a BAT já encomendou provavelmente não serão entregues. **
No entanto, a infraestrutura de poder de computação doméstica não parece ser muito afetada. Atualmente, existem quase 30 centros de computação inteligente que estão em construção ou concluídos, dos quais mais de 50% dos fornecedores de chips são Huawei Ascend.
Anteriormente, Liu Qingfeng, presidente da iFLYTEK, disse na conferência de imprensa que o desempenho do Huawei Ascend 910B já pode ser comparado com o A100.
**No geral, embora o endurecimento adicional das restrições dos EUA à China tenha arrastado o progresso da iteração de grandes modelos de alguns gigantes da Internet, a infraestrutura de poder de computação doméstica ainda está avançando constantemente. **
E como a dificuldade de importar chips continuará a aumentar no futuro próximo, por considerações de segurança da cadeia de suprimentos, espera-se que os fabricantes nacionais de chips inaugurem uma nova onda de oportunidades de desenvolvimento.
02 Avanço do Poder de Computação: Auto-pesquisa canhota, Ecologia da mão direita
Embora os únicos fabricantes de GPU que são geralmente reconhecidos no mercado internacional são NVIDIA e AMD, isso não significa que não há outras opções além deles.
**Em comparação com os chips ASIC, as GPUs têm a vantagem de uma forte versatilidade e são adequadas para vários campos de pesquisa. No entanto, subdividido em várias empresas, na verdade, há um excesso geral de poder de computação, ** como a grande capacidade de inferência de modelo que só precisa usar a GPU, e não precisa de seu poder de computação gráfica.
Por conseguinte, muitos fabricantes enveredaram pelo caminho da investigação e desenvolvimento independentes de acordo com as suas próprias necessidades. **
Por exemplo, o Alibaba lançou seu chip auto-desenvolvido Hanguang 800 em maio deste ano, que é dito ser o desempenho mais forte em chips de IA na época, com poder de computação equivalente a 10 CPUs; O chip de IA de função completa em nuvem autodesenvolvido da Baidu, Kunlun, também foi iterado para 3.0 e alcançará a produção em massa em 2024.
Entre as empresas de chips auto-desenvolvidas, a mais barulhenta é, sem dúvida, a já mencionada Huawei.
Recentemente, a máquina all-in-one Spark, criada em conjunto pela Huawei e pela iFLYTEK, foi colocada novamente na cúspide.
De acordo com informações públicas, a máquina all-in-one Xinghuo é baseada em CPU Kunpeng + GPU Ascend, usando armazenamento e rede Huawei para fornecer uma solução de gabinete completa, com poder de computação FP16 de 2,5 PFLOPS. Em contraste, a NVIDIA DGX A100 8-GPU, que é a mais popular no treinamento de modelos grandes, pode produzir 5PFLOPS FP16 poder de computação.
Além disso, Moore Thread e Walltech que foram recentemente incluídas na lista de entidades nesta rodada de sanções também têm produtos de placa única GPU correspondentes, e alguns indicadores estão próximos da NVIDIA.
Além do impacto das sanções dos EUA, os chips autodesenvolvidos também podem enfraquecer a dependência excessiva da NVIDIA, aumentar a autonomia estratégica das empresas e assumir a liderança na expansão da escala do poder de computação à frente dos concorrentes. **
Uma prova é que mesmo empresas como Google, OpenAI e Apple, que não estão sujeitas a sanções, lançaram planos para desenvolver seus próprios chips.
Para não estarem mais sujeitos a um único fornecedor, alguns fabricantes de servidores também começaram a adotar uma arquitetura aberta que é compatível com chips de inovação independentes nacionais. **
Por exemplo, a Inspur Information, que atualmente responde pela maior quota de mercado de servidores domésticos, lançou uma arquitetura de computação aberta, que se diz ter as características de grande poder de computação, alta interconexão e forte expansão.
**Objetivamente falando, os fabricantes de servidores são um elo relativamente fraco na cadeia da indústria de poder de computação, o upstream precisa de gigantes internacionais com posições de monopólio como a NVIDIA para comprar chips, e o downstream é G-end e fabricantes de nuvem, que não têm poder de barganha de cima para baixo. **
Assim, podemos ver que, embora a receita da NVIDIA em um único trimestre tenha atingido um recorde, atingindo US$ 13,51 bilhões, um aumento anual de 101%, e o lucro líquido tenha subido 843% ano a ano, para US$ 6,188 bilhões, o lucro líquido da Inspur no primeiro semestre deste ano ainda está no vermelho.
**A fim de garantir que eles possam sobreviver ao trilhão de dinheiro do mercado, os fornecedores de servidores não estão poupando esforços para provar seu valor. Especificamente, ele fornece soluções de gerenciamento e implantação de cluster de servidor de IA para garantir alta disponibilidade, alto desempenho e alta eficiência dos servidores.
Ao mesmo tempo, os fabricantes também estão competindo para lançar relatórios, normas e diretrizes da indústria na esperança de ganhar voz.
Com chips autodesenvolvidos na mão esquerda e ecologia aberta na mão direita, a cadeia nacional da indústria de energia de computação está em uma situação complexa sem precedentes, com concorrência e cooperação entre elas.
Mas antes de realmente passar pela estrada independente do chip, o mais crítico é como usar cada centavo de poder de computação na lâmina, até certo ponto, a resposta a essa pergunta também sugere o esboço dos jogadores que ganharão o mercado de 100 bilhões no futuro. **
03 Usar bem o poder de computação é uma prioridade máxima
Antes de responder como usar bem o poder de computação, você precisa pensar em outra pergunta: como usar o poder de computação para usá-lo bem?
**O dilema enfrentado pela indústria doméstica de poder de computação é principalmente triplo: **
**Primeiro, falta de poder de computação. **Recursos de poder de computação de alta qualidade são insuficientes e dispersos, os incrementos de GPU são limitados e o estoque é seriamente insuficiente, o que é difícil de suportar ainda mais o treinamento de modelos grandes, e gradualmente se torna um novo problema de "pescoço preso".
Em segundo lugar, o poder de computação é caro. **A infraestrutura de poder de computação é uma indústria de ativos pesados e de capital intensivo, com as características de grande investimento inicial, iteração tecnológica rápida e alto limiar de construção, e sua construção e operação exigem enormes custos de tempo e capital, muito além do escopo das pequenas e médias empresas.
**Em terceiro lugar, a procura de poder de computação é diversificada e fragmentada, e os desfasamentos entre a oferta e a procura de recursos de poder de computação ocorrem ocasionalmente. **
O primeiro dilema está sendo resolvido, mas não é um esforço de um dia, portanto, nesta fase, o significado real de usar o poder de computação deve ser tornar o poder de computação menos dispendioso e capaz de lidar com necessidades diversificadas.
Então, quais empresas têm os movimentos mais imaginativos?
**Em termos de redução do consumo e aumento da eficiência para o centro de computação inteligente, vale a pena esperar pelo conceito do Alibaba de "ecologizar toda a cadeia de poder de computação da indústria". **
Como todos sabemos, o custo energético da formação de grandes modelos é muito elevado. Mas, na realidade, apenas 20% desse poder é usado para a computação em si, e o restante é usado para manter o servidor funcionando. O relatório ambiental de 2023 do Google confirma isso de lado. De acordo com o relatório, o Google consumiu quase 5,2 bilhões de galões de água em 2022 para resfriar centros de dados, o equivalente a 1/4 da água potável diária do mundo, e pode encher um lago oeste e meio.
A fim de alcançar um maior grau de economia de energia global e efeitos de redução de emissões, o Ant Group e a Academia Chinesa de Tecnologia da Informação e Comunicação (CAICT) lançaram o Livro Branco sobre Ecologização da Computação para Aplicações de Poder de Computação, que apresentou o conceito de "computação verde de ponta a ponta".
Em certa medida, com base na proporção de utilização de energia no passado, a redução de custos proporcionada pela cadeia da indústria ecológica pode ser mais eficaz em termos de custos do que o avanço da tecnologia de chips a curto prazo, que é conducente à atualização da inteligência digital das pequenas e médias empresas.
**Em termos de melhoria do nível de programação de poder de computação, Huawei, Alibaba, Tencent, Baidu e outras empresas contribuíram com sua própria força, mas entre elas, os genes empresariais mais compatíveis ainda são a Huawei. **
Atualmente, o projeto de agendamento de poder de computação mais central na China é o projeto "East Data and West Computing" proposto pela primeira vez explicitamente no "National Integrated Big Data Center Collaborative Innovation System Computing Power Hub Implementation Plan" em 2021, com o objetivo de construir a tarefa do sistema nacional de rede de poder de computação.
O armazenamento e processamento de dados no leste no oeste apresenta grandes desafios tanto do lado da oferta quanto do lado da distribuição.
Tomemos como exemplo o problema comum de perda de pacotes.
Quando vários servidores enviam um grande número de pacotes para um servidor ao mesmo tempo, o número de pacotes excede a capacidade de cache do switch e ocorre perda de pacotes, o que, por sua vez, afeta a eficiência da computação e do armazenamento.
Para resolver esse problema, a Huawei introduziu algoritmos inteligentes em switches de rede de data center, coletou informações de status de rede em tempo real, como profundidade da fila, taxa de transferência de largura de banda, modelo de tráfego e outras dimensões, e definiu dinamicamente o pipeline de fila ideal por meio de algoritmos inteligentes sem perdas, finalmente alcançando um equilíbrio de sem perda de pacotes, alto desempenho e baixa latência após o treinamento de simulação.
À medida que os grandes modelos domésticos se tornam cada vez mais práticos no caminho para capacitar milhares de indústrias, a questão de "como resolver o dilema do poder de computação da China" se tornará cada vez mais importante. Podemos ver que a cadeia da indústria de poder de computação da China produziu muitas mudanças, como os gigantes da Internet adicionando chips de código auto-desenvolvidos, a base de poder de computação construída com chips domésticos e a germinação da ecologia de software que não era valorizada no passado... Por trás dessas mudanças está a perseverança e a determinação das empresas chinesas em romper barreiras técnicas.
** Objetivamente falando, em termos de força técnica, os players nacionais ainda têm uma certa distância dos fabricantes de classe mundial, mas não se pode ignorar que mesmo a NVIDIA, que está em pleno andamento, tem pairado à beira da vida e da morte por muitos anos antes do advento da era da IA. **
A noite antes do amanhecer é mais escura, mas os raios de sol já estão no horizonte.
Recursos:
*Investigação da verdade da escassez de servidores de IA: o preço aumentou em 300.000 em dois dias, e até mesmo o "MSG King" entrou no mercado.
Poder de computação inteligente nova infraestrutura sobreposta no exterior atualização multimodal, aplicação de poder de computação para atender ao catalisador | Zheshang Valores Mobiliários
Mestre da Cadeia Tecnológica, Huawei Ecosystem | TF Valores Mobiliários
Demanda de treinamento explosão "sede de poder de computação" como resolver | Netinfo Jilin