NVIDIA cortó el suministro de chips de gama alta por adelantado y el poder de cómputo de las empresas chinas se abrió paso

Fuente original: Laboratorio a base de silicio

Fuente de la imagen: Generado por Unbounded AI

El 17 de octubre, la Oficina de Industria y Seguridad (BIS) del Departamento de Comercio de Estados Unidos emitió una nueva prohibición de exportación de chips, endureciendo las restricciones a la compra por parte de China de importantes chips de alta gama.

Restringir las importaciones chinas de chips de alta gama es, sin duda, restringir el desarrollo de la industria tecnológica china. Estudios anteriores han demostrado que por cada aumento de 1 punto en el índice de potencia de cómputo, la economía digital y el PIB aumentarán en 3,5‰ y 1,8‰ respectivamente.

Sin embargo, el endurecimiento de las restricciones externas no ha provocado el estancamiento de la industria de la potencia informática de China, que ha superado la marca del billón de dólares. **Según la Academia de Tecnología de la Información y las Comunicaciones de China, a finales de 2021, la escala de la industria de la potencia informática central de China ha superado los 1,5 billones de yuanes, y la escala de las industrias relacionadas ha superado los 8 billones de yuanes.

Detrás del mercado de un billón de dólares, las empresas y los gobiernos trabajan juntos para aprovechar la era de la IA.

Por un lado, desde el lanzamiento de ChatGPT, las empresas nacionales y los institutos de investigación han lanzado más de 130 modelos grandes en poco más de medio año, entre los cuales los principales actores han comenzado a aplicar modelos grandes a escenarios específicos y crear aplicaciones explosivas.

Por otro lado, con el fin de construir una base de poder de cómputo, los gobiernos locales han comenzado la construcción de centros de cómputo inteligentes, colocando la información a alta velocidad en la era de big data, promoviendo la innovación y actualización industrial, y reduciendo el costo de las empresas que llaman logros científicos y tecnológicos representados por grandes modelos.

El comercio externo de chips se ha enfriado gradualmente y el mercado interno de potencia informática ha brillado, y entre los dos cielos de hielo y fuego, la gente no puede evitar sentir curiosidad:

¿Qué ciudad ha capturado la batalla revolucionaria de la industria de la potencia informática de China? ¿Cómo romper la cadena de la industria de la potencia informática? En este proceso, ¿qué empresas han asumido la responsabilidad de pioneros?

**01 NVIDIA cortó el suministro, ¿afecta la geometría? **

Si el modelo de lenguaje grande se utiliza como base para procesar las solicitudes de inferencia de 1.400 millones de personas en China al mismo tiempo, la cantidad de computación requerida excede la potencia de cálculo total de los centros de datos de China en 3 órdenes de magnitud. "**

En la Conferencia Mundial de Inteligencia Artificial (WAIC) de 2023 celebrada en Shanghái en julio de este año, Wang Yu, profesor de ingeniería electrónica en la Universidad de Tsinghua, reveló la magnitud de la brecha de potencia informática nacional.

De hecho, no solo los grandes modelos, sino también la popularidad de las aplicaciones diversificadas en 5G, las ciudades inteligentes y el Internet de las cosas también han provocado la aceleración continua de la generación de datos.

IDC predice que la escala de la potencia de cómputo inteligente de China alcanzará los 1271 EFLOPS en 2026, con una tasa de crecimiento anual compuesta del 69,45%. A finales de 2022, el "Libro blanco sobre el desarrollo de la potencia informática inteligente de 2023", elaborado por New H3C Group y la Academia China de Tecnología de la Información y las Comunicaciones, muestra que la potencia informática nacional total es de sólo 180 EFLOPS. (Nota: FLOPS se refiere a operaciones de punto flotante por segundo, y 1271EFLOPS significa 1271 operaciones de exaescala por segundo). )

** Con el fin de resolver la situación actual de escasez de potencia de cómputo, el estado ha emitido sucesivamente una serie de documentos para apoyar y guiar a todas las localidades a acelerar la construcción de infraestructura de potencia de cómputo. **

Entre ellos, el Plan de Acción para el Desarrollo de Alta Calidad de la Infraestructura de Potencia Informática publicado en octubre establece claramente que la escala de la potencia de cálculo superará los 300 EFLOPS en 2025, de los cuales la proporción de potencia de computación inteligente que se puede utilizar para el entrenamiento de modelos grandes debe alcanzar el 35%.

En la actualidad, hay alrededor de 31 centros de computación inteligente financiados por el gobierno, lo que corresponde a la potencia informática total de 10,13 EFLOPS en el plan, con una inversión total de casi 47 mil millones de yuanes, que aún está lejos de la escala de potencia de computación inteligente total planificada de 105E, 50 centros de computación inteligente y la escala de potencia de computación de un solo centro de 2,1EFLOPS.

** De hecho, no solo en China, sino también en el mundo, hay una escasez de poder de cómputo. Según los datos de OpenAI, existe una brecha de 10.000 veces entre la tasa de crecimiento del volumen de computación modelo y la tasa de crecimiento de la potencia informática del hardware de inteligencia artificial. **

La escasez de potencia de cálculo contribuyó en primer lugar al aumento vertiginoso del precio de las GPU. Desde diciembre del año pasado, el precio de NVIDIA A100 ha aumentado casi un 40% en 5 meses. El nuevo H100 de este año es aún más valioso.

Debido a la afluencia de pedidos, el ciclo de entrega de NVIDIA, el fabricante de GPU con mayor cuota de mercado, se ha ampliado de un mes a más de tres meses, e incluso es posible que algunos pedidos no se entreguen hasta 2024. La razón principal es que la cadena de suministro de chips es larga y fragmentada, y es imposible expandir rápidamente la capacidad de producción.

** Debido a las restricciones de la prohibición de EE. UU., los planes de los fabricantes nacionales para expandir el poder de cómputo son más difíciles de implementar que Google, Meta y OpenAI. **

Antes de anunciar la nueva ronda de prohibición, Nvidia adaptó las reglas de restricción suministrando al mercado chino "versiones castradas" de los chips informáticos insignia A800 y H800, que han reducido las velocidades de interconexión.

En agosto, los medios informaron de que empresas como Baidu, Tencent, Alibaba y ByteDance habían encargado 5.000 millones de dólares en chips a Nvidia. De esa cantidad, 1.000 millones de dólares se han encargado para el A800, que se espera que se entregue este año. El pedido restante, de 4.000 millones de dólares, se entregará en 2024.

Tras el anuncio de esta prohibición, debido a la densidad de rendimiento como requisito relevante para limitar el nuevo estándar, los chips A800 y H800, por exceder el estándar, también quedarán completamente prohibidos.

En la presentación actualizada de NVIDIA 8-K ante la Comisión de Bolsa y Valores de EE. UU. (SEC), se menciona que el gobierno de EE. UU. ha adelantado el tiempo efectivo de la prohibición de los cinco chips GPU de NVIDIA, incluidos A100, A800, H100, H800 y L40S, desde finales de noviembre originales para que entre en vigencia de inmediato.

** Los cambios anteriores significan que es probable que los aproximadamente 100.000 chips A800 que BAT ya ha pedido no se entreguen. **

Sin embargo, la infraestructura de potencia de cómputo nacional no parece verse muy afectada. En la actualidad, hay cerca de 30 centros de cómputo inteligente que están en construcción o terminados, de los cuales más del 50% de los proveedores de chips son Huawei Ascend.

Anteriormente, Liu Qingfeng, presidente de iFLYTEK, dijo en la conferencia de prensa que el rendimiento del Huawei Ascend 910B ya se puede comparar con el A100.

**En general, aunque el mayor endurecimiento de las restricciones de Estados Unidos a China ha lastrado el progreso de la iteración de grandes modelos de algunos gigantes de Internet, la infraestructura de potencia informática nacional sigue avanzando de forma constante. **

Y debido a que la dificultad de importar chips seguirá aumentando en el futuro previsible, por consideraciones de seguridad de la cadena de suministro, se espera que los fabricantes nacionales de chips marquen el comienzo de una nueva ola de oportunidades de desarrollo.

02 Avance en el Poder de Computación: Auto-Investigación para Zurdos, Ecología para Diestros

Aunque los únicos fabricantes de GPU que son generalmente reconocidos en el mercado internacional son NVIDIA y AMD, esto no significa que no haya otras opciones que ellos.

** En comparación con los chips ASIC, las GPU tienen la ventaja de una gran versatilidad y son adecuadas para varios campos de investigación. Sin embargo, subdividida en varias empresas, de hecho, hay un exceso general de potencia de cómputo, ** como la capacidad de inferencia de modelos grandes que solo necesita usar la GPU y no necesita su potencia de cómputo de gráficos.

Por lo tanto, muchos fabricantes se han embarcado en el camino de la investigación y el desarrollo independientes de acuerdo con sus propias necesidades. **

Por ejemplo, Alibaba lanzó su chip de desarrollo propio Hanguang 800 en mayo de este año, que se dice que es el de mayor rendimiento en chips de IA en ese momento, con una potencia de cálculo equivalente a 10 CPU; El chip de IA de función completa en la nube de desarrollo propio de Baidu, Kunlun, también se ha iterado a la versión 3.0 y alcanzará la producción en masa en 2024.

Entre las empresas de chips de desarrollo propio, la más ruidosa es, sin duda, la mencionada Huawei.

Recientemente, la máquina todo en uno Spark creada conjuntamente por Huawei e iFLYTEK se ha vuelto a poner en la cúspide.

Según información pública, la máquina todo en uno de Xinghuo se basa en la CPU Kunpeng + GPU Ascend, utilizando almacenamiento y red de Huawei para proporcionar una solución de gabinete completa, con una potencia de cómputo FP16 de 2.5 PFLOPS. Por el contrario, la GPU NVIDIA DGX A100 de 8 pulgadas, que es la más popular en el entrenamiento de modelos grandes, puede generar una potencia de cálculo FP16 de 5 PFLOPS.

"Wisdom" ha informado que en escenarios específicos de modelos grandes como Pangu y Xunfei Xinghuo, el Ascend 910 ha superado ligeramente a la versión PCIe A100 de 80 GB, logrando un reemplazo doméstico. Sin embargo, la versatilidad sigue siendo insuficiente, y otros modelos, como GPT-3, deben optimizarse en profundidad antes de que puedan funcionar sin problemas en la plataforma Huawei.

Además, Moore Thread y Walltech, que se incluyeron recientemente en la lista de entidades en esta ronda de sanciones, también tienen productos de tarjeta única de GPU correspondientes, y algunos indicadores están cerca de NVIDIA.

Además del impacto de las sanciones estadounidenses, los chips de desarrollo propio también pueden debilitar la dependencia excesiva de NVIDIA, mejorar la autonomía estratégica de las empresas y tomar la delantera en la expansión de la escala de potencia informática por delante de los competidores. **

Una prueba es que incluso empresas como Google, OpenAI y Apple que no están sujetas a sanciones han lanzado planes para desarrollar sus propios chips.

Con el fin de dejar de estar sujetos a un único proveedor, algunos fabricantes de servidores también han comenzado a adoptar una arquitectura abierta que es compatible con los chips de innovación independientes nacionales. **

Por ejemplo, Inspur Information, que actualmente representa la mayor cuota de mercado de servidores domésticos, ha lanzado una arquitectura informática abierta, que se dice que tiene las características de una gran potencia informática, una alta interconexión y una fuerte expansión.

Sobre la base de esto, Inspur lanzó tres generaciones de productos de servidor de IA, realizó el aterrizaje de múltiples productos informáticos de IA con más de 10 socios de chips y lanzó la plataforma AIStation, que puede programar de manera eficiente más de 30 chips de IA.

** Objetivamente hablando, los fabricantes de servidores son un eslabón relativamente débil en la cadena de la industria de la potencia informática, el upstream necesita gigantes internacionales con posiciones de monopolio como NVIDIA para comprar chips, y el downstream son los fabricantes de G-end y cloud, que carecen de poder de negociación de arriba a abajo. **

Así que podemos ver que, aunque los ingresos de NVIDIA en un solo trimestre alcanzaron un récord, alcanzando los 13.510 millones de dólares, un aumento interanual del 101%, y el beneficio neto se disparó un 843% interanual hasta los 6.188 millones de dólares, el beneficio neto de Inspur en el primer semestre de este año sigue en números rojos.

** Con el fin de garantizar que puedan sobrevivir hasta el billón de dinero en efectivo, los proveedores de servidores no escatiman esfuerzos para demostrar su valor. En concreto, proporciona soluciones de gestión e implementación de clústeres de servidores de IA para garantizar una alta disponibilidad, un alto rendimiento y una alta eficiencia de los servidores.

Al mismo tiempo, los fabricantes también compiten para lanzar informes, normas y directrices de la industria con la esperanza de hacerse oír.

Con chips de desarrollo propio en la mano izquierda y ecología abierta con la mano derecha, la cadena de la industria nacional de potencia informática se encuentra en una situación compleja sin precedentes, con competencia y cooperación entre ellos.

A largo plazo, el verdadero factor decisivo en el avance de la potencia de cálculo sigue siendo la tecnología, que abarca la ecología, el software y el hardware, etc., que requiere que los actores ascendentes y descendentes hagan un agujero para superar juntos las dificultades.

Pero antes de pasar realmente por el camino independiente del chip, lo más crítico es cómo usar cada centavo de poder de cómputo en la cuchilla, hasta cierto punto, la respuesta a esta pregunta también insinúa el esquema de los jugadores que ganarán el mercado de 100 mil millones en el futuro. **

03 Usar bien la potencia de cómputo es una prioridad

Antes de responder cómo usar bien la potencia de cómputo, debe pensar en otra pregunta: ¿cómo usar la potencia de cómputo para usarla bien?

** El dilema al que se enfrenta la industria nacional de la potencia de cálculo es principalmente triple: **

**En primer lugar, la falta de potencia de cómputo. ** Los recursos de potencia de cómputo de alta calidad son insuficientes y dispersos, los incrementos de GPU son limitados y el stock es seriamente insuficiente, lo que es difícil de respaldar aún más el entrenamiento de modelos grandes y gradualmente se convierte en un nuevo problema de "cuello atascado".

En segundo lugar, la potencia de cálculo es cara. ** La infraestructura de potencia informática es una industria con muchos activos y capital intensivos, con las características de una gran inversión inicial, una rápida iteración de la tecnología y un alto umbral de construcción, y su construcción y operación requieren enormes costos de tiempo y capital, mucho más allá del alcance de las pequeñas y medianas empresas.

En tercer lugar, la demanda de potencia de cálculo está diversificada y fragmentada, y de vez en cuando se producen desajustes entre la oferta y la demanda de recursos de potencia de cálculo. **

El primer dilema se está resolviendo, pero no es un esfuerzo de un día, por lo que en esta etapa, el significado real del uso de la potencia de cómputo debería ser hacer que la potencia de cómputo sea menos costosa y capaz de manejar necesidades diversificadas.

Entonces, ¿qué empresas tienen los movimientos más imaginativos?

** En términos de reducción del consumo y aumento de la eficiencia del centro de cómputo inteligente, vale la pena esperar el concepto de Alibaba de "ecologizar toda la cadena de potencia informática de la industria". **

Como todos sabemos, el coste energético del entrenamiento de modelos grandes es muy alto. Pero en realidad, solo el 20% de esta potencia se utiliza para el cálculo en sí, y el resto se utiliza para mantener el servidor en funcionamiento. El informe medioambiental de Google de 2023 lo confirma desde el lateral. Según el informe, Google consumió casi 5.200 millones de galones de agua en 2022 para enfriar los centros de datos, lo que equivale a 1/4 del agua potable diaria del mundo, y puede llenar un lago y medio del oeste.

Con el fin de lograr un mayor grado de ahorro de energía y efectos de reducción de emisiones en general, Ant Group y la Academia China de Tecnología de la Información y las Comunicaciones (CAICT) publicaron el Libro Blanco sobre la Ecologización Informática para Aplicaciones de Potencia Informática, que presenta el concepto de "computación verde de extremo a extremo".

Específicamente, la computación verde de extremo a extremo debe considerar el costo de consumo de energía durante la operación en la etapa inicial de la construcción, desde la producción de energía, la producción de energía informática (incluidos los constructores de centros de computación inteligentes, los fabricantes de hardware, los proveedores de la nube) hasta las aplicaciones de potencia de cómputo.

Hasta cierto punto, sobre la base de la proporción de uso de energía en el pasado, la reducción de costos aportada por la cadena de la industria ecológica puede ser más rentable que el avance de la tecnología de chips a corto plazo, lo que favorece la actualización de la inteligencia digital de las pequeñas y medianas empresas.

** En términos de mejorar el nivel de programación de la potencia de cómputo, Huawei, Alibaba, Tencent, Baidu y otras empresas han contribuido con su propia fuerza, pero entre ellas, los genes empresariales más compatibles siguen siendo Huawei. **

En la actualidad, el proyecto de programación de potencia informática más importante en China es el proyecto "East Data and West Computing" propuesto por primera vez explícitamente en el "Plan de implementación del centro de potencia informática del sistema de innovación colaborativa del centro de innovación empresarial integrado nacional" en 2021, con el objetivo de construir la tarea del sistema nacional de red de potencia informática.

El almacenamiento y procesamiento de datos en el este y el oeste presenta grandes desafíos tanto en el lado de la oferta como en el de la distribución.

Tomemos como ejemplo el problema común de pérdida de paquetes.

Cuando varios servidores envían un gran número de paquetes a un servidor al mismo tiempo, el número de paquetes supera la capacidad de caché del conmutador y se produce la pérdida de paquetes, lo que a su vez afecta a la eficiencia de la computación y el almacenamiento.

Para resolver este problema, Huawei introdujo algoritmos inteligentes en los conmutadores de red de los centros de datos, recopiló información sobre el estado de la red en tiempo real, como la profundidad de la cola, el rendimiento del ancho de banda, el modelo de tráfico y otras dimensiones, y estableció dinámicamente la canalización de cola ideal a través de algoritmos inteligentes sin pérdidas, logrando finalmente un equilibrio entre la ausencia de pérdida de paquetes, el alto rendimiento y la baja latencia después del entrenamiento de simulación.

Además, Huawei ha innovado en tecnologías como el enrutamiento adaptativo distribuido y los algoritmos inteligentes de mapas de nubes para participar en el diseño y la construcción de nodos centrales nacionales.

A medida que los grandes modelos nacionales se vuelven cada vez más prácticos en el camino hacia el empoderamiento de miles de industrias, la cuestión de "cómo resolver el dilema del poder informático de China" será cada vez más importante. Podemos ver que la cadena de la industria de la potencia informática de China ha producido muchos cambios, como la incorporación de chips de código de desarrollo propio por parte de los gigantes de Internet, la base de potencia de cálculo construida con chips nacionales y la germinación de la ecología del software que no se valoraba en el pasado... Detrás de estos cambios está la perseverancia y la determinación de las empresas chinas para romper las barreras técnicas.

** Objetivamente hablando, en términos de fuerza técnica, los jugadores nacionales todavía tienen cierta distancia de los fabricantes de clase mundial, pero no se puede ignorar que incluso NVIDIA, que está en pleno apogeo, ha estado flotando al borde de la vida y la muerte durante muchos años antes del advenimiento de la era de la IA. **

La noche antes del amanecer es la más oscura, pero los rayos del sol ya están sobre el horizonte.

Recursos:

  • Investigación de la verdad sobre la escasez de servidores de IA: el precio aumentó en 300,000 en dos días, e incluso el "MSG King" ingresó al mercado | Wisdom Stuff *

  • Potencia de cómputo inteligente, nueva infraestructura superpuesta en el extranjero, actualización multimodal, aplicación de potencia de cómputo para cumplir con el catalizador | Valores de Zheshang*

Maestro de la Cadena Tecnológica, Ecosistema Huawei | Valores TF

  • Explosión de la demanda de capacitación "sed de poder de cómputo": cómo resolverlo | Netinfo Jilin*

  • ¡La prohibición de chips en EE. UU. se ha intensificado! NVIDIA, Intel o Limited | Noticias Económicas del Siglo 21*

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Compartir
Comentar
0/400
Sin comentarios
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)