17 жовтня Бюро промисловості та безпеки (BIS) Міністерства торгівлі США видало нову заборону на експорт мікросхем, посиливши обмеження на закупівлю Китаєм важливих мікросхем високого класу.
Обмеження імпорту Китаєм високоякісних чіпів, безсумнівно, стримує розвиток технологічної промисловості Китаю. Попередні дослідження показали, що на кожен 1 пункт збільшення індексу обчислювальної потужності цифрова економіка та ВВП зростатимуть на 3,5 та 1,8 ‰ відповідно.
Однак посилення зовнішніх обмежень не спричинило стагнації комп'ютерної енергетики Китаю, яка перетнула позначку в трильйон доларів. **За даними Китайської академії інформаційно-комунікаційних технологій, до кінця 2021 року масштаби основної обчислювальної енергетики Китаю перевищили 1,5 трлн юанів, а масштаби суміжних галузей перевищили 8 трлн юанів.
За трильйонним ринком підприємства та уряди працюють разом, щоб скористатися ерою штучного інтелекту.
З одного боку, з моменту запуску ChatGPT вітчизняні підприємства та науково-дослідні інститути трохи більше ніж за пів року запустили понад 130 великих моделей, серед яких провідні гравці почали застосовувати великі моделі до конкретних сценаріїв та створювати вибухонебезпечні додатки.
З іншого боку, з метою створення обчислювальної потужної бази органи місцевого самоврядування розпочали будівництво інтелектуальних обчислювальних центрів, закладаючи високошвидкісну інформацію в епоху великих даних, сприяючи промисловим інноваціям та модернізації, а також здешевлюючи підприємства, називаючи науково-технічні досягнення представленими великими моделями.
Зовнішня торгівля мікросхемами поступово охолола, а внутрішній ринок обчислювальної потужності засяяв, і між двома небесами льоду та вогню люди не можуть не цікавитися:
Яке місто захопило проривну битву китайської комп'ютерної енергетики? Як розірвати ланцюжок комп'ютерної енергетики? Які компанії взяли на себе відповідальність за першопрохідців у цьому процесі?
**01 NVIDIA припинила постачання, вплине на геометрію? **
«Якщо велика мовна модель використовується як основа для обробки запитів на висновки 1,4 мільярда людей у Китаї одночасно, обсяг необхідних обчислень перевищує загальну обчислювальну потужність центрів обробки даних Китаю на 3 порядки. "**
На Всесвітній конференції зі штучного інтелекту (WAIC) 2023 року в Шанхаї в липні цього року Ван Юй, професор електронної інженерії в Університеті Цінхуа, розкрив масштаби розриву у вітчизняних обчислювальних потужностях.
Насправді не тільки великі моделі, а й популярність різноманітних додатків у 5G, розумних містах та Інтернеті речей також призвела до постійного прискорення генерації даних.
IDC прогнозує, що масштаб інтелектуальних обчислювальних потужностей Китаю досягне 1271EFLOPS у 2026 році із сукупним річним темпом зростання 69,45%. Станом на кінець 2022 року «Біла книга розвитку інтелектуальних обчислювальних потужностей на 2023 рік», складена New H3C Group та Китайською академією інформаційно-комунікаційних технологій, показує, що загальна внутрішня обчислювальна потужність становить лише 180EFLOPS. (Примітка: FLOPS відноситься до операцій з плаваючою комою в секунду, а 1271EFLOPS означає 1271 екзамасштабну операцію в секунду.) )
** Для того, щоб вирішити поточну ситуацію з дефіцитом обчислювальних потужностей, держава послідовно видала ряд документів, які підтримують і направляють всі населені пункти для прискорення будівництва інфраструктури обчислювальної потужності. **
Серед них у Плані дій з високоякісного розвитку обчислювальної енергетичної інфраструктури, оприлюдненому в жовтні, чітко зазначено, що масштаб обчислювальних потужностей перевищить 300 EFLOPS у 2025 році, з яких частка інтелектуальних обчислювальних потужностей, які можуть бути використані для навчання великих моделей, повинна досягати 35%.
В даний час уряд фінансує близько 31 інтелектуального обчислювального центру, що відповідає загальній обчислювальній потужності 10,13EFLOPS в плані, із загальним обсягом інвестицій майже 47 мільярдів юанів, що все ще далеко від запланованої загальної масштабу інтелектуальних обчислювальних потужностей 105E, 50 інтелектуальних обчислювальних центрів і одноцентрової шкали обчислювальної потужності 2,1EFLOPS.
** Насправді не тільки в Китаї, але і в світі спостерігається дефіцит обчислювальних потужностей. Згідно з даними OpenAI, існує 10 000-кратний розрив між темпами зростання обсягу обчислень моделей і темпами зростання апаратних обчислювальних потужностей штучного інтелекту. **
Дефіцит обчислювальних потужностей спочатку сприяв стрімкому зростанню цін на графічні процесори. З грудня минулого року ціна NVIDIA A100 за 5 місяців зросла майже на 40%. Цьогорічний новий H100 ще більш безцінний.
У зв'язку з напливом замовлень цикл поставки NVIDIA, виробника графічних процесорів з найбільшою часткою ринку, був продовжений з одного місяця до більш ніж трьох місяців, і навіть деякі замовлення можуть бути доставлені не раніше 2024 року. Основна причина полягає в тому, що ланцюжок поставок чіпів довгий і фрагментований, а швидко розширити виробничі потужності неможливо.
**Через обмеження заборони США плани вітчизняних виробників щодо розширення обчислювальних потужностей реалізувати складніше, ніж Google, Meta та OpenAI. **
Перш ніж оголосити про новий раунд заборони, Nvidia адаптувала правила обмеження, поставляючи на китайський ринок «кастровані версії» флагманських обчислювальних чіпів A800 і H800, які дозволили знизити швидкість взаємоз'єднання.
У серпні ЗМІ повідомляли, що такі компанії, як Baidu, Tencent, Alibaba та ByteDance, замовили у Nvidia чіпи на $5 млрд. З цієї суми 1 мільярд доларів було замовлено на A800, який, як очікується, буде поставлений цього року. Решта замовлення на 4 мільярди доларів буде доставлено у 2024 році.
Після оголошення цієї заборони, у зв'язку з щільністю продуктивності як актуальною вимогою для обмеження нового стандарту, чіпи A800 і H800, через перевищення стандарту, також будуть повністю заборонені.
В оновленій заявці NVIDIA 8-K до Комісії з цінних паперів і бірж США (SEC) згадується, що уряд США продовжив термін дії заборони на п'ять чіпів графічних процесорів NVIDIA, включаючи A100, A800, H100, H800 і L40S, з початкового кінця листопада, щоб він набув чинності негайно.
**Наведені вище зміни означають, що приблизно 100 000 чіпів A800, які вже замовила BAT, швидше за все, не будуть доставлені. **
Однак вітчизняна інфраструктура обчислювальної потужності, схоже, не сильно постраждала. В даний час налічується близько 30 інтелектуальних обчислювальних центрів, які будуються або добудовуються, з яких більше 50% постачальників чіпів - Huawei Ascend.
Раніше Лю Цінфен, голова iFLYTEK, заявив на прес-конференції, що продуктивність Huawei Ascend 910B вже можна порівняти з A100.
** В цілому, незважаючи на те, що подальше посилення обмежень США щодо Китаю загальмувало прогрес ітерації великих моделей деяких інтернет-гігантів, вітчизняна інфраструктура обчислювальних потужностей все ще неухильно розвивається. **
І оскільки складність імпорту мікросхем продовжуватиме зростати в осяжному майбутньому, з міркувань безпеки ланцюжка поставок, очікується, що вітчизняні виробники мікросхем відкриють нову хвилю можливостей для розвитку.
Хоча єдиними виробниками графічних процесорів, які загальновизнані на міжнародному ринку, є NVIDIA та AMD, це не означає, що немає інших варіантів, крім них.
**У порівнянні з чіпами ASIC, графічні процесори мають перевагу сильної універсальності та підходять для різних галузей досліджень. Однак, поділяючись на різні підприємства, насправді існує загальна надлишкова обчислювальна потужність, ** наприклад, здатність висновування великої моделі, яка потребує лише використання графічного процесора і не потребує його графічних обчислювальних потужностей.
Тому багато виробників стали на шлях незалежних досліджень і розробок відповідно до власних потреб. **
Наприклад, Alibaba випустила свій власноруч розроблений чіп Hanguang 800 у травні цього року, який, як кажуть, є найвищою продуктивністю серед чіпів штучного інтелекту на той час, з обчислювальною потужністю, еквівалентною 10 процесорам; Власноруч розроблений хмарний повнофункціональний чіп штучного інтелекту Kunlun від Baidu також був ітерований до версії 3.0 і досягне масового виробництва у 2024 році.
Серед компаній, що займаються власною розробкою чіпів, найгучнішою, безсумнівно, є вищезгадана Huawei.
Нещодавно моноблок Spark, створений спільно Huawei та iFLYTEK, знову опинився на порозі.
Згідно з загальнодоступною інформацією, моноблок Xinghuo заснований на процесорі Kunpeng + графічному процесорі Ascend, використовуючи сховище та мережу Huawei, щоб забезпечити повне рішення для шафи, з обчислювальною потужністю FP16 2,5 PFLOPS. На противагу цьому, 8-графічний процесор NVIDIA DGX A100, який є найпопулярнішим у навчанні великих моделей, може видавати обчислювальну потужність 5PFLOPS FP16.
«Wisdom» повідомляє, що в конкретних сценаріях великих моделей, таких як Pangu і Xunfei Xinghuo, Ascend 910 трохи перевершив версію A100 80 ГБ PCIe, досягнувши вітчизняної заміни. Однак універсальність все ще недостатня, і інші моделі, такі як GPT-3, потребують глибокої оптимізації, перш ніж вони зможуть безперебійно працювати на платформі Huawei.
Крім того, Moore Thread і Walltech, які нещодавно були включені до списку організацій у цьому раунді санкцій, також мають відповідні однокарткові продукти GPU, а деякі показники близькі до NVIDIA.
На додаток до впливу санкцій США, чіпи власної розробки також можуть послабити надмірну залежність від NVIDIA, підвищити стратегічну автономію підприємств і взяти на себе лідерство в розширенні масштабів обчислювальних потужностей, випередивши конкурентів. **
Одним із доказів є те, що навіть такі компанії, як Google, OpenAI та Apple, які не підпадають під санкції, запустили плани з розробки власних чіпів.
Для того, щоб більше не підкорятися одному постачальнику, деякі виробники серверів також почали впроваджувати відкриту архітектуру, сумісну з вітчизняними незалежними інноваційними чіпами. **
Наприклад, компанія Inspur Information, на яку в даний час припадає найбільша частка ринку вітчизняних серверів, запустила відкриту обчислювальну архітектуру, яка, як кажуть, має характеристики великої обчислювальної потужності, високого взаємозв'язку та сильного розширення.
Виходячи з цього, Inspur випустила три покоління серверних продуктів штучного інтелекту, реалізувала приземлення кількох обчислювальних продуктів штучного інтелекту з більш ніж 10 партнерами з чіпів і запустила платформу AIStation, яка може ефективно планувати понад 30 чіпів штучного інтелекту.
**Об'єктивно кажучи, виробники серверів є відносно слабкою ланкою в ланцюжку комп'ютерної енергетики, видобувній галузі потрібні міжнародні гіганти з монопольним становищем, такі як NVIDIA, для закупівлі чіпів, а нижче за течією знаходяться G-end і хмарні виробники, яким не вистачає переговорної сили зверху вниз. **
Таким чином, ми бачимо, що хоча виручка NVIDIA за один квартал досягла рекордно високого рівня, досягнувши $13,51 млрд, що на 101% більше, ніж у минулому році, а чистий прибуток зріс на 843% у річному обчисленні до $6,188 млрд, чистий прибуток Inspur у першому півріччі цього року все ще залишається в мінусі.
** Для того, щоб гарантувати, що вони зможуть дожити до трильйона ринкових грошей, постачальники серверів не шкодують зусиль, щоб довести свою цінність. Зокрема, він надає рішення для управління та розгортання кластерів серверів зі штучним інтелектом для забезпечення високої доступності, високої продуктивності та високої ефективності серверів.
У той же час виробники також змагаються за запуск галузевих звітів, стандартів і рекомендацій в надії отримати голос.
З власноруч розробленими чіпами в лівій руці та відкритою екологією правою рукою вітчизняний ланцюг комп'ютерної енергетики перебуває в безпрецедентно складній ситуації, з конкуренцією та співпрацею між ними.
У довгостроковій перспективі реальним вирішальним фактором прориву обчислювальних потужностей залишається технологія, яка охоплює екологію, програмне та апаратне забезпечення тощо, що вимагає від гравців, які займаються висхідним і нижчим потоком, щоб разом подолати труднощі.
Але перш ніж дійсно пройти незалежний шлях чіпа, більш критичним є те, як використовувати кожен цент обчислювальної потужності на блейді, в якійсь мірі, відповідь на це питання також натякає на обриси гравців, які в майбутньому виграють 100-мільярдний ринок. **
03 Правильне використання обчислювальних потужностей є першочерговим завданням
Перш ніж відповісти, як правильно використовувати обчислювальні потужності, потрібно подумати над іншим питанням: як використовувати обчислювальні потужності, щоб їх правильно використовувати?
** Дилема, що стоїть перед вітчизняною комп'ютерною енергетикою, в основному складається з трьох частин: **
** По-перше, нестача обчислювальних потужностей. ** Високоякісні обчислювальні ресурси потужності є недостатніми та розпорошеними, прирости графічного процесора обмежені, а запас серйозно недостатній, що ускладнює подальшу підтримку навчання великих моделей і поступово стає новою проблемою «застряглої шиї».
По-друге, обчислювальні потужності коштують дорого. ** Обчислювальна енергетична інфраструктура є великою та капіталомісткою галуззю, з характеристиками великих початкових інвестицій, швидкої ітерації технологій та високого порогу будівництва, а її будівництво та експлуатація вимагають величезних часових та капітальних витрат, що далеко виходять за рамки малих та середніх підприємств.
** По-третє, попит на обчислювальні потужності є диверсифікованим і фрагментованим, час від часу виникають невідповідності між попитом і пропозицією обчислювальних потужностей. **
Перша дилема вирішується, але це не одноденна робота, тому на даному етапі фактичний сенс використання обчислювальних потужностей повинен полягати в тому, щоб зробити обчислювальні потужності менш дорогими і здатними задовольняти різноманітні потреби.
Отже, які компанії мають найкреативніші кроки?
** З точки зору зниження споживання та підвищення ефективності інтелектуального обчислювального центру, концепція Alibaba «озеленення всього галузевого ланцюжка обчислювальних потужностей» варта того, щоб її з нетерпінням чекати. **
Як ми всі знаємо, енергетичні витрати на навчання великих моделей дуже високі. Але насправді лише 20% цієї потужності використовується для самих обчислень, а решта використовується для підтримки роботи сервера. Екологічний звіт Google за 2023 рік підтверджує це з боку. Згідно зі звітом, у 2022 році Google спожив майже 5,2 мільярда галонів води для охолодження центрів обробки даних, що еквівалентно 1/4 щоденного споживання питної води у світі, і може заповнити півтора Західних озер.
Для того, щоб досягти більшого ступеня загального ефекту енергозбереження та скорочення викидів, Ant Group та Китайська академія інформаційно-комунікаційних технологій (CAICT) випустили Білу книгу з екологізації обчислень для обчислювальних енергетичних додатків, в якій висунуто концепцію «наскрізних зелених обчислень».
Зокрема, наскрізні зелені обчислення повинні враховувати витрати на споживання енергії під час експлуатації на ранній стадії будівництва, від виробництва електроенергії, виробництва обчислювальної потужності (включаючи будівельників інтелектуальних обчислювальних центрів, виробників обладнання, постачальників хмарних технологій) до додатків обчислювальної потужності.
Певною мірою, виходячи з частки споживання енергії в минулому, зниження витрат, принесене ланцюжком екологізації промисловості, може бути більш економічно ефективним, ніж прорив технології мікросхем у короткостроковій перспективі, що сприяє оновленню цифрового інтелекту малих і середніх підприємств.
** З точки зору підвищення рівня планування обчислювальної потужності, Huawei Alibaba, Tencent, Baidu та інші підприємства внесли свої сили, але серед них найбільш сумісними корпоративними генами, як і раніше, є Huawei. **
В даний час найбільш основним проектом планування обчислювальних потужностей в Китаї є проект «East Data and West Computing», вперше прямо запропонований в «Плані впровадження National Integrated Big Data Center Collaborative Innovation System Computing Power Hub Implementation Plan» в 2021 році, спрямований на створення завдання національної системи обчислювальної потужності.
Зберігання та обробка даних на сході на заході пов'язане з великими труднощами як з боку постачання, так і з боку дистрибуції.
Візьмемо для прикладу поширену проблему втрати пакетів.
Коли кілька серверів відправляють на сервер велику кількість пакетів одночасно, кількість пакетів перевищує ємність кеш-пам'яті комутатора і відбувається втрата пакетів, що в свою чергу впливає на ефективність обчислень і зберігання.
Щоб вирішити цю проблему, Huawei впровадила інтелектуальні алгоритми в мережеві комутатори центрів обробки даних, зібрала інформацію про стан мережі в режимі реального часу, таку як глибина черги, пропускна здатність, модель трафіку та інші параметри, і динамічно встановила ідеальний конвеєр черги за допомогою інтелектуальних алгоритмів без втрат, нарешті досягнувши балансу відсутності втрати пакетів, високої продуктивності та низької затримки після симуляційного навчання.
Крім того, Huawei впровадила інноваційні технології, такі як розподілена адаптивна маршрутизація та інтелектуальні алгоритми хмарних карт, для участі в проектуванні та будівництві національних вузлів-хабів.
У міру того, як вітчизняні великі моделі стають все більш практичними на шляху до розширення можливостей тисяч галузей промисловості, питання «як вирішити дилему обчислювальної потужності Китаю» буде ставати все більш і більш важливим. Ми бачимо, що китайський ланцюжок обчислювальної енергетики приніс багато змін, таких як інтернет-гіганти, які додають кодові мікросхеми власної розробки, обчислювальна база, побудована з вітчизняних чіпів, і проростання програмної екології, яка не цінувалася в минулому. За цими змінами стоїть наполегливість і рішучість китайських підприємств пробивати технічні бар'єри.
** Об'єктивно кажучи, в плані технічної міцності вітчизняні гравці все ще мають певну дистанцію від виробників світового рівня, але не можна не враховувати, що навіть NVIDIA, яка йде повним ходом, вже багато років до настання ери ШІ витає на межі життя і смерті. **
Ніч перед світанком найтемніша, але сонячні промені вже за горизонтом.
Ресурси:
Розслідування нестачі серверів штучного інтелекту: ціна зросла на 300 000 за два дні, і навіть «король MSG» вийшов на ринок|Wisdom Stuff
Інтелектуальна обчислювальна потужність, нова інфраструктура, накладена за кордоном, мультимодальне оновлення, застосування обчислювальної потужності для задоволення каталізатора | Цінні папери Zheshang*
Майстер технологічного ланцюжка, екосистема Huawei | Цінні папери TF
Навчання попиту «жага обчислювальних потужностей» як розв'язати | Netinfo Jilin*
Заборона на чіпи в США посилилася! NVIDIA, Intel або Limited | Економічні новини 21-го століття*
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
NVIDIA заздалегідь припинила постачання висококласних чіпів, і обчислювальні потужності китайських компаній прорвалися
Першоджерело: лабораторія на основі кремнію
17 жовтня Бюро промисловості та безпеки (BIS) Міністерства торгівлі США видало нову заборону на експорт мікросхем, посиливши обмеження на закупівлю Китаєм важливих мікросхем високого класу.
Обмеження імпорту Китаєм високоякісних чіпів, безсумнівно, стримує розвиток технологічної промисловості Китаю. Попередні дослідження показали, що на кожен 1 пункт збільшення індексу обчислювальної потужності цифрова економіка та ВВП зростатимуть на 3,5 та 1,8 ‰ відповідно.
Однак посилення зовнішніх обмежень не спричинило стагнації комп'ютерної енергетики Китаю, яка перетнула позначку в трильйон доларів. **За даними Китайської академії інформаційно-комунікаційних технологій, до кінця 2021 року масштаби основної обчислювальної енергетики Китаю перевищили 1,5 трлн юанів, а масштаби суміжних галузей перевищили 8 трлн юанів.
За трильйонним ринком підприємства та уряди працюють разом, щоб скористатися ерою штучного інтелекту.
З одного боку, з моменту запуску ChatGPT вітчизняні підприємства та науково-дослідні інститути трохи більше ніж за пів року запустили понад 130 великих моделей, серед яких провідні гравці почали застосовувати великі моделі до конкретних сценаріїв та створювати вибухонебезпечні додатки.
З іншого боку, з метою створення обчислювальної потужної бази органи місцевого самоврядування розпочали будівництво інтелектуальних обчислювальних центрів, закладаючи високошвидкісну інформацію в епоху великих даних, сприяючи промисловим інноваціям та модернізації, а також здешевлюючи підприємства, називаючи науково-технічні досягнення представленими великими моделями.
Зовнішня торгівля мікросхемами поступово охолола, а внутрішній ринок обчислювальної потужності засяяв, і між двома небесами льоду та вогню люди не можуть не цікавитися:
Яке місто захопило проривну битву китайської комп'ютерної енергетики? Як розірвати ланцюжок комп'ютерної енергетики? Які компанії взяли на себе відповідальність за першопрохідців у цьому процесі?
**01 NVIDIA припинила постачання, вплине на геометрію? **
«Якщо велика мовна модель використовується як основа для обробки запитів на висновки 1,4 мільярда людей у Китаї одночасно, обсяг необхідних обчислень перевищує загальну обчислювальну потужність центрів обробки даних Китаю на 3 порядки. "**
На Всесвітній конференції зі штучного інтелекту (WAIC) 2023 року в Шанхаї в липні цього року Ван Юй, професор електронної інженерії в Університеті Цінхуа, розкрив масштаби розриву у вітчизняних обчислювальних потужностях.
Насправді не тільки великі моделі, а й популярність різноманітних додатків у 5G, розумних містах та Інтернеті речей також призвела до постійного прискорення генерації даних.
IDC прогнозує, що масштаб інтелектуальних обчислювальних потужностей Китаю досягне 1271EFLOPS у 2026 році із сукупним річним темпом зростання 69,45%. Станом на кінець 2022 року «Біла книга розвитку інтелектуальних обчислювальних потужностей на 2023 рік», складена New H3C Group та Китайською академією інформаційно-комунікаційних технологій, показує, що загальна внутрішня обчислювальна потужність становить лише 180EFLOPS. (Примітка: FLOPS відноситься до операцій з плаваючою комою в секунду, а 1271EFLOPS означає 1271 екзамасштабну операцію в секунду.) )
Серед них у Плані дій з високоякісного розвитку обчислювальної енергетичної інфраструктури, оприлюдненому в жовтні, чітко зазначено, що масштаб обчислювальних потужностей перевищить 300 EFLOPS у 2025 році, з яких частка інтелектуальних обчислювальних потужностей, які можуть бути використані для навчання великих моделей, повинна досягати 35%.
В даний час уряд фінансує близько 31 інтелектуального обчислювального центру, що відповідає загальній обчислювальній потужності 10,13EFLOPS в плані, із загальним обсягом інвестицій майже 47 мільярдів юанів, що все ще далеко від запланованої загальної масштабу інтелектуальних обчислювальних потужностей 105E, 50 інтелектуальних обчислювальних центрів і одноцентрової шкали обчислювальної потужності 2,1EFLOPS.
** Насправді не тільки в Китаї, але і в світі спостерігається дефіцит обчислювальних потужностей. Згідно з даними OpenAI, існує 10 000-кратний розрив між темпами зростання обсягу обчислень моделей і темпами зростання апаратних обчислювальних потужностей штучного інтелекту. **
Дефіцит обчислювальних потужностей спочатку сприяв стрімкому зростанню цін на графічні процесори. З грудня минулого року ціна NVIDIA A100 за 5 місяців зросла майже на 40%. Цьогорічний новий H100 ще більш безцінний.
У зв'язку з напливом замовлень цикл поставки NVIDIA, виробника графічних процесорів з найбільшою часткою ринку, був продовжений з одного місяця до більш ніж трьох місяців, і навіть деякі замовлення можуть бути доставлені не раніше 2024 року. Основна причина полягає в тому, що ланцюжок поставок чіпів довгий і фрагментований, а швидко розширити виробничі потужності неможливо.
**Через обмеження заборони США плани вітчизняних виробників щодо розширення обчислювальних потужностей реалізувати складніше, ніж Google, Meta та OpenAI. **
Перш ніж оголосити про новий раунд заборони, Nvidia адаптувала правила обмеження, поставляючи на китайський ринок «кастровані версії» флагманських обчислювальних чіпів A800 і H800, які дозволили знизити швидкість взаємоз'єднання.
У серпні ЗМІ повідомляли, що такі компанії, як Baidu, Tencent, Alibaba та ByteDance, замовили у Nvidia чіпи на $5 млрд. З цієї суми 1 мільярд доларів було замовлено на A800, який, як очікується, буде поставлений цього року. Решта замовлення на 4 мільярди доларів буде доставлено у 2024 році.
В оновленій заявці NVIDIA 8-K до Комісії з цінних паперів і бірж США (SEC) згадується, що уряд США продовжив термін дії заборони на п'ять чіпів графічних процесорів NVIDIA, включаючи A100, A800, H100, H800 і L40S, з початкового кінця листопада, щоб він набув чинності негайно.
**Наведені вище зміни означають, що приблизно 100 000 чіпів A800, які вже замовила BAT, швидше за все, не будуть доставлені. **
Однак вітчизняна інфраструктура обчислювальної потужності, схоже, не сильно постраждала. В даний час налічується близько 30 інтелектуальних обчислювальних центрів, які будуються або добудовуються, з яких більше 50% постачальників чіпів - Huawei Ascend.
Раніше Лю Цінфен, голова iFLYTEK, заявив на прес-конференції, що продуктивність Huawei Ascend 910B вже можна порівняти з A100.
** В цілому, незважаючи на те, що подальше посилення обмежень США щодо Китаю загальмувало прогрес ітерації великих моделей деяких інтернет-гігантів, вітчизняна інфраструктура обчислювальних потужностей все ще неухильно розвивається. **
І оскільки складність імпорту мікросхем продовжуватиме зростати в осяжному майбутньому, з міркувань безпеки ланцюжка поставок, очікується, що вітчизняні виробники мікросхем відкриють нову хвилю можливостей для розвитку.
02 Прорив обчислювальної потужності: лівосторонні самодослідження, правостороння екологія
Хоча єдиними виробниками графічних процесорів, які загальновизнані на міжнародному ринку, є NVIDIA та AMD, це не означає, що немає інших варіантів, крім них.
**У порівнянні з чіпами ASIC, графічні процесори мають перевагу сильної універсальності та підходять для різних галузей досліджень. Однак, поділяючись на різні підприємства, насправді існує загальна надлишкова обчислювальна потужність, ** наприклад, здатність висновування великої моделі, яка потребує лише використання графічного процесора і не потребує його графічних обчислювальних потужностей.
Тому багато виробників стали на шлях незалежних досліджень і розробок відповідно до власних потреб. **
Наприклад, Alibaba випустила свій власноруч розроблений чіп Hanguang 800 у травні цього року, який, як кажуть, є найвищою продуктивністю серед чіпів штучного інтелекту на той час, з обчислювальною потужністю, еквівалентною 10 процесорам; Власноруч розроблений хмарний повнофункціональний чіп штучного інтелекту Kunlun від Baidu також був ітерований до версії 3.0 і досягне масового виробництва у 2024 році.
Серед компаній, що займаються власною розробкою чіпів, найгучнішою, безсумнівно, є вищезгадана Huawei.
Нещодавно моноблок Spark, створений спільно Huawei та iFLYTEK, знову опинився на порозі.
Згідно з загальнодоступною інформацією, моноблок Xinghuo заснований на процесорі Kunpeng + графічному процесорі Ascend, використовуючи сховище та мережу Huawei, щоб забезпечити повне рішення для шафи, з обчислювальною потужністю FP16 2,5 PFLOPS. На противагу цьому, 8-графічний процесор NVIDIA DGX A100, який є найпопулярнішим у навчанні великих моделей, може видавати обчислювальну потужність 5PFLOPS FP16.
Крім того, Moore Thread і Walltech, які нещодавно були включені до списку організацій у цьому раунді санкцій, також мають відповідні однокарткові продукти GPU, а деякі показники близькі до NVIDIA.
На додаток до впливу санкцій США, чіпи власної розробки також можуть послабити надмірну залежність від NVIDIA, підвищити стратегічну автономію підприємств і взяти на себе лідерство в розширенні масштабів обчислювальних потужностей, випередивши конкурентів. **
Одним із доказів є те, що навіть такі компанії, як Google, OpenAI та Apple, які не підпадають під санкції, запустили плани з розробки власних чіпів.
Для того, щоб більше не підкорятися одному постачальнику, деякі виробники серверів також почали впроваджувати відкриту архітектуру, сумісну з вітчизняними незалежними інноваційними чіпами. **
Наприклад, компанія Inspur Information, на яку в даний час припадає найбільша частка ринку вітчизняних серверів, запустила відкриту обчислювальну архітектуру, яка, як кажуть, має характеристики великої обчислювальної потужності, високого взаємозв'язку та сильного розширення.
**Об'єктивно кажучи, виробники серверів є відносно слабкою ланкою в ланцюжку комп'ютерної енергетики, видобувній галузі потрібні міжнародні гіганти з монопольним становищем, такі як NVIDIA, для закупівлі чіпів, а нижче за течією знаходяться G-end і хмарні виробники, яким не вистачає переговорної сили зверху вниз. **
Таким чином, ми бачимо, що хоча виручка NVIDIA за один квартал досягла рекордно високого рівня, досягнувши $13,51 млрд, що на 101% більше, ніж у минулому році, а чистий прибуток зріс на 843% у річному обчисленні до $6,188 млрд, чистий прибуток Inspur у першому півріччі цього року все ще залишається в мінусі.
** Для того, щоб гарантувати, що вони зможуть дожити до трильйона ринкових грошей, постачальники серверів не шкодують зусиль, щоб довести свою цінність. Зокрема, він надає рішення для управління та розгортання кластерів серверів зі штучним інтелектом для забезпечення високої доступності, високої продуктивності та високої ефективності серверів.
У той же час виробники також змагаються за запуск галузевих звітів, стандартів і рекомендацій в надії отримати голос.
З власноруч розробленими чіпами в лівій руці та відкритою екологією правою рукою вітчизняний ланцюг комп'ютерної енергетики перебуває в безпрецедентно складній ситуації, з конкуренцією та співпрацею між ними.
Але перш ніж дійсно пройти незалежний шлях чіпа, більш критичним є те, як використовувати кожен цент обчислювальної потужності на блейді, в якійсь мірі, відповідь на це питання також натякає на обриси гравців, які в майбутньому виграють 100-мільярдний ринок. **
03 Правильне використання обчислювальних потужностей є першочерговим завданням
Перш ніж відповісти, як правильно використовувати обчислювальні потужності, потрібно подумати над іншим питанням: як використовувати обчислювальні потужності, щоб їх правильно використовувати?
** Дилема, що стоїть перед вітчизняною комп'ютерною енергетикою, в основному складається з трьох частин: **
** По-перше, нестача обчислювальних потужностей. ** Високоякісні обчислювальні ресурси потужності є недостатніми та розпорошеними, прирости графічного процесора обмежені, а запас серйозно недостатній, що ускладнює подальшу підтримку навчання великих моделей і поступово стає новою проблемою «застряглої шиї».
По-друге, обчислювальні потужності коштують дорого. ** Обчислювальна енергетична інфраструктура є великою та капіталомісткою галуззю, з характеристиками великих початкових інвестицій, швидкої ітерації технологій та високого порогу будівництва, а її будівництво та експлуатація вимагають величезних часових та капітальних витрат, що далеко виходять за рамки малих та середніх підприємств.
** По-третє, попит на обчислювальні потужності є диверсифікованим і фрагментованим, час від часу виникають невідповідності між попитом і пропозицією обчислювальних потужностей. **
Перша дилема вирішується, але це не одноденна робота, тому на даному етапі фактичний сенс використання обчислювальних потужностей повинен полягати в тому, щоб зробити обчислювальні потужності менш дорогими і здатними задовольняти різноманітні потреби.
Отже, які компанії мають найкреативніші кроки?
** З точки зору зниження споживання та підвищення ефективності інтелектуального обчислювального центру, концепція Alibaba «озеленення всього галузевого ланцюжка обчислювальних потужностей» варта того, щоб її з нетерпінням чекати. **
Як ми всі знаємо, енергетичні витрати на навчання великих моделей дуже високі. Але насправді лише 20% цієї потужності використовується для самих обчислень, а решта використовується для підтримки роботи сервера. Екологічний звіт Google за 2023 рік підтверджує це з боку. Згідно зі звітом, у 2022 році Google спожив майже 5,2 мільярда галонів води для охолодження центрів обробки даних, що еквівалентно 1/4 щоденного споживання питної води у світі, і може заповнити півтора Західних озер.
Для того, щоб досягти більшого ступеня загального ефекту енергозбереження та скорочення викидів, Ant Group та Китайська академія інформаційно-комунікаційних технологій (CAICT) випустили Білу книгу з екологізації обчислень для обчислювальних енергетичних додатків, в якій висунуто концепцію «наскрізних зелених обчислень».
Певною мірою, виходячи з частки споживання енергії в минулому, зниження витрат, принесене ланцюжком екологізації промисловості, може бути більш економічно ефективним, ніж прорив технології мікросхем у короткостроковій перспективі, що сприяє оновленню цифрового інтелекту малих і середніх підприємств.
** З точки зору підвищення рівня планування обчислювальної потужності, Huawei Alibaba, Tencent, Baidu та інші підприємства внесли свої сили, але серед них найбільш сумісними корпоративними генами, як і раніше, є Huawei. **
В даний час найбільш основним проектом планування обчислювальних потужностей в Китаї є проект «East Data and West Computing», вперше прямо запропонований в «Плані впровадження National Integrated Big Data Center Collaborative Innovation System Computing Power Hub Implementation Plan» в 2021 році, спрямований на створення завдання національної системи обчислювальної потужності.
Зберігання та обробка даних на сході на заході пов'язане з великими труднощами як з боку постачання, так і з боку дистрибуції.
Візьмемо для прикладу поширену проблему втрати пакетів.
Коли кілька серверів відправляють на сервер велику кількість пакетів одночасно, кількість пакетів перевищує ємність кеш-пам'яті комутатора і відбувається втрата пакетів, що в свою чергу впливає на ефективність обчислень і зберігання.
Щоб вирішити цю проблему, Huawei впровадила інтелектуальні алгоритми в мережеві комутатори центрів обробки даних, зібрала інформацію про стан мережі в режимі реального часу, таку як глибина черги, пропускна здатність, модель трафіку та інші параметри, і динамічно встановила ідеальний конвеєр черги за допомогою інтелектуальних алгоритмів без втрат, нарешті досягнувши балансу відсутності втрати пакетів, високої продуктивності та низької затримки після симуляційного навчання.
У міру того, як вітчизняні великі моделі стають все більш практичними на шляху до розширення можливостей тисяч галузей промисловості, питання «як вирішити дилему обчислювальної потужності Китаю» буде ставати все більш і більш важливим. Ми бачимо, що китайський ланцюжок обчислювальної енергетики приніс багато змін, таких як інтернет-гіганти, які додають кодові мікросхеми власної розробки, обчислювальна база, побудована з вітчизняних чіпів, і проростання програмної екології, яка не цінувалася в минулому. За цими змінами стоїть наполегливість і рішучість китайських підприємств пробивати технічні бар'єри.
** Об'єктивно кажучи, в плані технічної міцності вітчизняні гравці все ще мають певну дистанцію від виробників світового рівня, але не можна не враховувати, що навіть NVIDIA, яка йде повним ходом, вже багато років до настання ери ШІ витає на межі життя і смерті. **
Ніч перед світанком найтемніша, але сонячні промені вже за горизонтом.
Ресурси:
Розслідування нестачі серверів штучного інтелекту: ціна зросла на 300 000 за два дні, і навіть «король MSG» вийшов на ринок|Wisdom Stuff
Майстер технологічного ланцюжка, екосистема Huawei | Цінні папери TF
Навчання попиту «жага обчислювальних потужностей» як розв'язати | Netinfo Jilin*
Заборона на чіпи в США посилилася! NVIDIA, Intel або Limited | Економічні новини 21-го століття*