Reexamine os chips da perspetiva dos clusters de computação!

Fonte do artigo: Data Ape

Autor: A Smoke Rain

Fonte da imagem: Gerado por Unbounded AI

Desde a antiguidade, a tecnologia e a inovação têm estado no centro da competitividade nacional. Na era da informação de hoje, essa regra ainda se aplica, especialmente na indústria de computação. Ao longo das últimas décadas, a China fez avanços notáveis em várias áreas tecnológicas, desde a fabricação de telefones celulares até as comunicações 5G e a inteligência artificial. No entanto, no campo da indústria de computação, especialmente a tecnologia de chips, a China ainda enfrenta muitos desafios.

A importância da indústria da computação é evidente, é a pedra angular da tecnologia da informação, seja big data, inteligência artificial ou Internet das Coisas, é inseparável de capacidades de computação poderosas e estáveis. No entanto, para um país que quer assumir uma posição de liderança em tecnologia global, depender apenas do fornecimento externo de poder de computação não é suficiente. Especialmente no contexto do ambiente político e econômico global cada vez mais complexo, bloqueio tecnológico e atritos frequentes, a localização da indústria de computação não está relacionada apenas à independência tecnológica, mas também à chave para a segurança nacional.

Por causa disso, a China tem tentado construir sua própria indústria de computação. Mas, de facto, apesar dos bons progressos em algumas subáreas, de um modo geral, ainda enfrentamos enormes desafios. Entre eles, o mais proeminente é o atraso da tecnologia de chips. Quer se trate de telemóveis, servidores ou aplicações de inteligência artificial, a maioria dos chips core atuais ainda dependem de fabricantes internacionais, especialmente Intel, AMD, NVIDIA, Qualcomm, etc.

Como é que isto mudou? Há um novo caminho a seguir? É exatamente isso que este artigo espera explorar.

Esquema Anterior - Rígido Frontal Rígido

No caminho da recuperação tecnológica no passado, a estratégia da China na indústria de chips pode ser considerada "frontal e dura". Esta é uma forma direta e ativa de recuperar o atraso, com o objetivo de reduzir a diferença em relação ao nível avançado global o mais rapidamente possível. Tal estratégia pode funcionar para algumas indústrias, mas no campo dos chips, os desafios são particularmente grandes.

O sucesso da Huawei no campo das CPUs de telefones celulares injetou grande confiança na comunidade de tecnologia nacional. Os seus chips da série Kirin não só alcançaram uma quota significativa no mercado nacional, como até demonstraram uma forte competitividade no mercado internacional. Esta conquista parece indicar que a indústria de chips da China está prestes a inaugurar uma reviravolta.

Mas quando voltamos nossa perspetiva para o espaço do servidor, as coisas são muito diferentes. Neste mercado, a Intel, a AMD e a NVIDIA continuam a ocupar uma posição dominante absoluta. Não só o desempenho e a estabilidade de seus chips são reconhecidos pelos clientes, mas mais importante, o acúmulo de tecnologia e a construção ecológica por trás dessas duas empresas dificultam a aproximação de outros concorrentes emergentes.

Especificamente, existem várias razões principais para isso, incluindo:

1. A enorme lacuna na acumulação de tecnologia:

Intel, AMD e NVIDIA exploram o campo dos chips há mais de décadas. Esta acumulação de tecnologia a longo prazo permitiu-lhes acumular uma rica experiência em design, testes e fabrico. Para os fabricantes chineses de chips que estão apenas começando, essa lacuna não pode ser reduzida em um curto período de tempo.

2. A enorme diferença entre I&D e investimento na indústria transformadora:

O investimento é uma força motriz importante para o progresso tecnológico, quer se trate da investigação fundamental ou da exploração de novas tecnologias, exigindo um grande apoio financeiro. Intel, AMD e outros investimentos nesta área são, sem dúvida, muito mais do que os fabricantes nacionais de chips. Isso coloca os fabricantes chineses em uma desvantagem significativa em termos de velocidade de pesquisa e desenvolvimento, atualização tecnológica e aplicações inovadoras.

3. Barreiras ecológicas maduras:

O chip não existe isoladamente, ele precisa ser combinado com vários sistemas de hardware e software. Intel, AMD, NVIDIA e outros chips em torno do ecossistema de software e hardware é muito maduro, de sistemas operacionais, estruturas de desenvolvimento, middleware para aplicativos, há suporte rico. Se os fabricantes chineses querem entrar neste mercado, eles devem não só ter produtos competitivos, mas também enfrentar o enorme desafio de reconstruir todo o ecossistema.

Face a estes três grandes problemas, o caminho para recuperar o atraso na indústria nacional de chips está obviamente cheio de reviravoltas. Mas isso não significa que não tenhamos saída, talvez possamos pensar de um ângulo diferente e encontrar um caminho de desenvolvimento mais adequado.

Outra solução - reconstruir todo o ecossistema de computação com base na "nuvem"

Diante das limitações de uma estratégia frontal rígida, a indústria de computação da China deve ponderar: existe uma estratégia que pode alcançar um rápido desenvolvimento tecnológico sem colidir diretamente com os gigantes globais? A resposta é: existe. E essa resposta vem da rápida ascensão da tecnologia de computação em nuvem.

A computação em nuvem está revolucionando a face da indústria de computação. Se o modelo de computação tradicional é orientado para hardware, então a computação em nuvem é orientada a serviços, o que não apenas fornece às empresas e usuários métodos de computação mais eficientes e convenientes, mas, mais importante, fornece uma nova ideia para a indústria de chips.

Especificamente, com base nos chips domésticos da Huawei, como HiSilicon, Loongson e Feiteng, combinados com hardware de armazenamento de alta velocidade e equipamentos de rede de nível de data center, um pool básico de recursos de computação e armazenamento doméstico é construído. Em termos de software e arquitetura de sistemas, os sistemas operacionais baseados em Linux podem ser usados para garantir compatibilidade e estabilidade. Ao mesmo tempo, por meio de tecnologias de virtualização e conteinerização, como KVM, Docker e Kubernetes, ele fornece implantação rápida, dimensionamento elástico e gerenciamento conveniente de pools de recursos de computação.

O cerne desta ideia é a congregação de recursos. Na computação tradicional, uma tarefa precisa ser executada por um ou vários chips poderosos, enquanto na computação em nuvem, essa tarefa pode ser concluída por vários chips com desempenho menos excecional. Esta abordagem é como "três fedores no topo", não mais focando no desempenho de um único chip, mas focando no poder de computação geral, o que apenas contorna nossa falta de capacidades técnicas em um único chip. **

Para a indústria de chips da China, isso representa uma grande oportunidade. Não temos que perseguir excessivamente o desempenho absoluto de cada chip, mas podemos integrar vários chips domésticos através da tecnologia para formar um poderoso cluster de computação. Por exemplo, dois ou três chips do HiSilicon, Loongson ou Feiteng da Huawei têm toda a probabilidade de atingir ou mesmo exceder o poder de computação de um chip Intel.

Além disso, essa abordagem nos oferece uma oportunidade de reimaginar o data center. Os data centers tradicionais geralmente são baseados em chips Intel, AMD e NVIDIA, mas no modelo de computação em nuvem, espera-se que essa situação seja quebrada. Suponhamos que, em um data center, seja totalmente possível construir um cluster de computação comparável a 1 milhão de chips Intel com 2 milhões de chips domésticos. Isso não significa apenas uma redução de custos, mas, mais importante, construímos com sucesso uma plataforma de computação baseada inteiramente em tecnologia nacional.

Esta transformação abriu, sem dúvida, um novo oceano azul para a indústria de computação da China. Não estamos mais frente a frente na mesma arena que os gigantes globais, mas usamos as vantagens da computação em nuvem para quebrar a fronteira da computação tradicional, construir um modelo de computação completamente diferente e abrir um segundo campo de batalha.

Nessa direção, espera-se que evitemos conflitos frontais com gigantes globais e, em vez disso, construamos um ecossistema de computação mais eficiente, competitivo e orientado para o futuro por meio de inovação e integração tecnológicas.

De outro ângulo, evitamos a vantagem dos gigantes internacionais de chips, mas mudamos o campo de batalha para conseguir "você acertou o seu, eu acertei o meu".

Mesma maneira de construir um cluster de computação GPU doméstico

Com a ascensão da inteligência artificial e do big data, as GPUs tornaram-se gradualmente a principal fonte de poder de computação para computação de alto desempenho e aprendizagem profunda. A posição de monopólio da NVIDIA neste campo torna a localização mais urgente. Diante de uma enorme lacuna em tecnologia e desempenho, o caminho das GPUs domésticas também pode aumentar sua participação de mercado nos mercados interno e externo por meio da computação em nuvem, como CPUs?

A inteligência artificial, especialmente o treinamento de grandes modelos, requer enorme poder de computação. Todo avanço de inovação geralmente requer uma grande quantidade de dados para treinamento e otimização. As GPUs únicas tradicionais têm sido difíceis de atender às necessidades de computação atuais, e as GPUs de alto desempenho de fabricantes internacionais, como a NVIDIA, estão enfrentando enormes desafios devido aos seus altos preços e incerteza da cadeia de suprimentos.

Neste contexto, o desenvolvimento de GPUs domésticas é particularmente importante. Embora a tecnologia e o desempenho atuais ainda estejam longe da NVIDIA, isso não significa que não temos como começar a construir clusters de computação GPU de alto desempenho. Como temos feito no campo da CPU, a tecnologia de agrupamento de recursos de computação em nuvem nos fornece novas soluções.

Através do agrupamento de recursos, podemos reunir várias GPUs domésticas com desempenho ligeiramente inferior para formar um poderoso cluster de computação. Isso pode não apenas atender aos requisitos de poder de computação do treinamento de modelos em larga escala, mas também reduzir efetivamente o custo geral e melhorar a eficiência da computação. Esta estratégia de "quantidade por qualidade" pode "comprar" GPUs domésticas para o tempo de desenvolvimento e otimização, para que elas possam gradualmente reduzir a lacuna tecnológica com a NVIDIA.

Além disso, a construção de clusters de computação baseados em GPUs domésticas também proporciona um espaço de desenvolvimento mais amplo para ecossistemas de software e hardware relacionados. Podemos começar pela camada inferior e otimizar o sistema operacional, drivers, compiladores e até mesmo a estrutura superior de aprendizado profundo para melhor se adaptar às características das GPUs domésticas. Ao mesmo tempo, este método de computação paralela multi-GPU também trará novos desafios e oportunidades para os pesquisadores de algoritmos e promoverá mais inovação de algoritmos.

Com base no desktop 5G + nuvem, espera-se reconstruir o padrão de poder de computação nos campos PC e telefone celular

Atualmente, a computação em nuvem altera principalmente o modo de fornecimento de energia de computação do lado do servidor, em computadores pessoais, telefones inteligentes e outros terminais inteligentes, ou um único chip para fornecer poder de computação, o papel da computação em nuvem não é óbvio.

No entanto, espera-se que todo o sistema de rede de comunicação construído na rede 5G abra o poder de computação da "nuvem" e do terminal. O poder de computação do cluster de computação de servidor em nuvem é fornecido diretamente a terminais inteligentes, como PCs e smartphones, em tempo real através da rede 5G.

Para ser claro, o 5G não é apenas uma melhoria na velocidade de comunicação, mas também traz baixa latência, alta largura de banda e conexões massivas, proporcionando possibilidades sem precedentes para o poder de computação em nuvem para "entrar" no terminal. No passado, a computação em nuvem não deixou uma marca significativa nos dispositivos inteligentes, principalmente porque a largura de banda limita sua aplicação em dispositivos móveis. Mas com a implantação generalizada do 5G e a aceleração contínua das redes 5G, tudo isso será diferente.

Sob o efeito aditivo do 5G e da tecnologia de desktop em nuvem, estamos prestes a entrar em uma era digital disruptiva. A maior revolução trazida por esta combinação é uma reformulação fundamental da definição de terminais inteligentes. Eles não são mais um hub para computação independente, mas um gateway e extensão de recursos de nuvem.

Quando os terminais inteligentes são usados apenas como interfaces de entrada e saída, seus processos de design e fabricação mudam drasticamente. Os terminais já não necessitam de sistemas de refrigeração complexos, baterias de alta capacidade ou armazenamento de alta capacidade, o que significa que podemos criar dispositivos mais finos, duradouros e portáteis que melhoram ainda mais a mobilidade e a experiência do utilizador. Não só isso, devido à eliminação de chips caros de alto desempenho, o custo de produção dos terminais inteligentes será muito reduzido, para que mais consumidores possam desfrutar de serviços digitais avançados.

Além disso, quando o hardware não está mais vinculado à computação de alto desempenho, os designers podem se concentrar mais na interação do usuário, na inovação da forma do dispositivo e na expansão da função. Os futuros dispositivos inteligentes não se limitam aos telemóveis, tablets e computadores portáteis existentes, podendo também surgir com tipos de dispositivos inteiramente novos, como óculos inteligentes, wearables ou outros dispositivos de realidade aumentada.

À medida que a tecnologia de desktop em nuvem amadurece, a estrutura de energia do fornecimento global de chips pode enfrentar interrupções. No passado, o poderoso desempenho do hardware determinou em grande parte o poder de computação dos dispositivos terminais, e a Intel e a Qualcomm estabeleceram uma posição inabalável nos mercados de PC e smartphones. Mas à medida que a computação gradualmente se mudou para a nuvem, isso começou a mudar.

Esta mudança oferece uma rara oportunidade para os fabricantes nacionais de chips se livrarem de suas desvantagens tecnológicas de longa data e estabelecerem uma nova imagem de marca e posição no mercado. "Três fedores domésticos" na nuvem podem valer um "Zhuge Liang estrangeiro" no terminal.

É claro que, como uma solução de transição, o poder de computação pode ser dividido entre terminais inteligentes, como computadores e telefones celulares e servidores em nuvem, ** a maior parte do poder de computação é colocada na nuvem, e apenas uma pequena parte do poder de computação é retida no terminal. Desta forma, colocar um chip doméstico com baixo desempenho no equipamento terminal é suficiente para atender às necessidades de uso.

Para concretizar esta ideia, ainda existem muitas formas de o fazer

Deve-se salientar que o programa da indústria de computação doméstica baseado em computação em nuvem que demos acima ainda tem um longo caminho a percorrer para realmente aterrissar. Construir um cluster de computação de alto desempenho baseado em chips domésticos não é apenas uma "emenda" de hardware, mas uma guerra abrangente envolvendo hardware, software, rede e armazenamento.

De telefones celulares a TVs e carros, podemos ver que o sucesso de qualquer produto requer um ecossistema de som para apoiá-lo. Para clusters de computação, a ecologia é mais complexa. Então, como transformar essa ideia em realidade? No seu conjunto, exige o triplo esforço da tecnologia, da ecologia e do mercado.

Aspetos técnicos - não é um simples empilhamento de fichas

Embora a combinação de vários chips domésticos possa fornecer um poder de computação considerável, isso não significa que a simples sobreposição possa alcançar o efeito desejado. Por exemplo, a sobrecarga de comunicação entre vários chips pode ser significativa, o que pode afetar a eficiência geral do processamento paralelo. Ao mesmo tempo, a interoperabilidade entre hardware também é um enorme desafio, e como garantir que cada componente possa exercer sua máxima eficiência, em vez de se tornar um gargalo para outros componentes, é um problema de computação que deve ser enfrentado.

Ecologia de Software - A Alma dos Clusters de Computação

No entanto, não é suficiente para resolver o problema em hardware. O software é a alma de um sistema. Precisamos construir um ecossistema completo de software e hardware baseado em clusters de computação domésticos. Isso significa desenvolver um novo sistema operacional de computação em nuvem, que não só precisa ser compatível com os aplicativos de software existentes, mas também pode maximizar as características dos chips domésticos. Ao mesmo tempo, também precisamos desenvolver um ecossistema apropriado de middleware, banco de dados e software de aplicativos para garantir que tudo isso possa funcionar perfeitamente em um ambiente localizado.

Quebra-gelo do mercado – Inicie o volante de iteração

Em última análise, o sucesso de uma tecnologia depende do seu desempenho no mercado. Se uma boa tecnologia não for reconhecida pelo mercado, ela não sobreviverá no final. Portanto, para o cluster de computação doméstico, o verdadeiro teste é como trazê-lo para o mercado e permitir que mais usuários experimentem o valor que ele traz. Isto requer aplicações orientadas para o mercado em larga escala, iteração e melhoria contínuas através de aplicações práticas, para resolver as deficiências e problemas expostos e, no processo, reduzir custos e melhorar continuamente o seu nível de serviço.

Acima, conduzimos uma discussão aprofundada sobre a localização da indústria de computação da China e propusemos uma nova direção para a construção de clusters de computação domésticos baseados na computação em nuvem. Deve-se salientar que este esquema não é localizado por uma questão de localização, mas um movimento para seguir a tendência da transformação global da indústria de computação, representando a direção de desenvolvimento futuro da indústria de computação global. **

O cluster de computação doméstico construído com base na computação em nuvem tira proveito da tendência geral da indústria de computação global para a cloudificação e clustering, compreende a ideia central de agrupamento de recursos de computação em nuvem e integração eficiente, e evita com sucesso a concorrência direta com gigantes internacionais. Esta é uma estratégia que segue a tendência e faz pleno uso da tecnologia e dos recursos nacionais que já temos, libertando um maior potencial.

Olhando para o futuro, esta estratégia irá, sem dúvida, fornecer um forte apoio para a localização da indústria de computação da China. Com a iteração contínua da tecnologia e a expansão gradual do mercado, estamos confiantes de que veremos uma nova ecologia da indústria de computação baseada na tecnologia nacional gradualmente tomar forma. Isso não só acelerará o processo de localização da indústria de computação da China, mas também mais provavelmente redefinirá o padrão da indústria de computação global e tornará a China líder neste campo.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Partilhar
Comentar
0/400
Nenhum comentário
  • Pino
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)