Граючи «їжу та траву» війни зі штучним інтелектом, ціна відеокарти Nvidia зі штучним інтелектом стрімко зростає

Оригінальний текст: Shinsei

Джерело зображення: створено Unbounded AI

Від ери майнінгу до ери штучного інтелекту обчислювальна потужність GPU знову вступила в дію. Конкуренція за резерв обчислювальної потужності між вітчизняними та закордонними хмарними постачальниками в розпалі...

Компанія Byte придбала у Nvidia 100 000 карт прискорювачів A100 і H800 на суму понад 1 мільярд доларів США (понад 7 мільярдів юанів). Обсяг закупівель тільки Byte цього року близький до загального обсягу продажів комерційних графічних процесорів, проданих Nvidia в Китаї минулого року. , Інше велике підприємство має вартість замовлення щонайменше понад 1 мільярд юанів.

OpenAI, яка вже використовує близько 25 000 графічних процесорів Nvidia, каже, що графічних процесорів все ще не вистачає. ChatGPT потребує 13,5 EPLOPS обчислювальної потужності на кожні 100 мільйонів активних користувачів, що підтримується приблизно 69 000 серверами NVIDIA DGX A100 80G, а поточна глобальна обчислювальна потужність може підтримувати лише 100 мільйонів середніх щоденних онлайн-користувачів. Збільште.

На ринку розповсюдження цих графічних процесорів високого класу навіть наполовину неспеціаліст хоче спробувати, коли бачить можливість, і його очі повні «золотих цеглинок».

**A800, який спочатку коштував приблизно 74 000 юанів, тепер зріс до понад 85 000 юанів, а версія високого класу зросла приблизно до 100 000 юанів. ** На кінець квітня котирування ф’ючерсів на 8-картковий модуль A800 на ринку все ще складало 900 000 юанів із терміном поставки 2 тижні. Зараз котирування досягло понад 1 мільйона юанів, а термін поставки збільшився продовжено до 7-8 тижнів. У травні A800 навіть звільнили до 100 000 юанів.

«Час доставки для тих, хто в стороні, довше, і ціна дорожча.» Кому не вистачило жодної картки, пішов купувати модулі, а хто не міг купити модулі, потім купив цілий сервер.

Від однієї картки графічного процесора до модуля та сервера зі штучним інтелектом ціна шалено зростає, дефіцит серйозний, а час доставки стає все довшим. Чи дійсно попит на ринку такий високий? Чому GPU Nvidia такий короткий? Крім того, немає гарантованої дати доставки для абсолютно нових оригінальних продуктів, ринок секонд-хенду, сірі канали, депозит не повертається після оплати, і хаос навколо AI-сервера розгортається...

Хаос на ринку відеокарт NVIDIA

«Мені потрібно 1000 чи 3000 квитків за раз, і я не можу їх надати взагалі. Попит тут справжній чи фальшивий?»

«Чи хороший ринок? У мене є спосіб отримати товар, але я боюся, що він буде розбитий».

**У травні графічні процесори Nvidia все ще були відсутні в наявності та зростали в ціні. **

За словами агента, ціна на Nvidia A100 почала зростати в грудні минулого року, станом на першу половину квітня поточного року її кумулятивне зростання ціни за п'ять місяців досягло 37,5%, а кумулятивне зростання ціни на A800 досягло 20,0% за період. той же період.

Терміни виконання розтягнуто з одного місяця до трьох і більше, а деякі нові замовлення «можуть бути доставлені лише в грудні».

Деякі виробники, які мають кількісну перевагу в серверах зі штучним інтелектом, використовують ресурси GPU, затягуючи паски. Корпорація Майкрософт опинилася перед дилемою внутрішнього браку серверного обладнання штучного інтелекту та запровадила механізм «квоти поставок». У червні в протоколі розмови видаленого генерального директора OpenAI Сема Альтмана було згадано, що Open AI також не має графічних процесорів, а брак графічних процесорів відклав багато короткострокових планів клієнтів.

Стоячи на хвилі штучного інтелекту, Nvidia, «продавець лопати», зараз майже монополізувала весь ринок серверних чіпів AI і стала найбільшим виграшем. Нещодавно її ринкова вартість перевищила трильйон юанів, ставши першою компанією чіпів в історії з ринковою вартістю понад 1 трильйон доларів США.

Через заборону в США спотові постачання Nvidia A100 у моїй країні були припинені. У Китаї існує близько 40 000–50 000 A100, які можна використовувати для навчання великих моделей ШІ. Постачання досить обмежене. Внутрішнє використання суворо обмежений.

Однак A800, кастрована версія A100, яка наразі є в звичайних поставках, почала виробництво лише в третьому кварталі минулого року. У поєднанні зі зростанням нового попиту він стикається з дефіцитом пропозиції. На початку травня A800 подорожчав до 100 000 юанів у Китаї.

Загалом, дорогі A800, A100 тощо, про які повідомляють ЗМІ, належать до топової конфігурації цієї серії, тобто пам’ять GPU становить 80 ГБ, а технологія з’єднання підтримує версію NVLink.

Друг із ринку графічних процесорів сказав нам, що ціна A800 на спотовому ринку змінюється щодня, і короткострокові зміни обмінного курсу також вплинуть на ціну. Найнижча пропозиція могла зрости до 86 000».

У міру того як дефіцит і зростання цін посилилися, дедалі більше учасників доставляли та шукали графічні процесори, і почався хаос на ринку графічних процесорів: рої запитів, популярний ф’ючерсний ринок і високі депозити, а також відтік із каналів секонд-хенду. "яма"...

Найбільш прямим враженням є галасливий попит з усіх боків.Багато практиків ринку серверних машин і серверних графічних процесорів повідомили, що останнім часом через популярність штучного інтелекту багато людей прийшли запитати про картки та ціни, але мало хто може насправді зробити угоди.

Я прийшов шукати одиничні карти A800, A100, попит невеликий, і мене цікавить ціна, але попит великий, і потрібні сотні тисяч карт, кажучи, що я допомагаю клієнтам і друзям, і торговцям з Huaqiangbei відправляються. Таке відчуття, що вони встановлюють ціни.

«Коли ви придумали стільки, як ви можете це надати? Запитайте його, чи звертає він увагу на перевагу в ціні чи перевагу в часі доставки, і більше інформації немає.» «Деякі люди майже не платять за товари, і вони зникають після запиту." Легка транзакція покупки.

Наразі існує два основних канали розподілу для постачання графічних процесорів корпоративного рівня, таких як Nvidia: один — оригінальний завод-генеральний агент-дилер-ринок; інший — оригінальний завод-фабрика-виробник OEM (виробник серверів)-дилер- ринок . Ті, які циркулюють на спотовому ринку, в основному займаються розповсюдженням, серверними рішеннями або ринками вживаних товарів.

Такі продукти корпоративного рівня охоплюють наступних клієнтів, таких як підприємства, школи та постачальники серверних рішень. Брат Сюй, який спеціалізується на серверному бізнесі, сказав, що реальний попит з боку Alibaba та інших компаній зазвичай пов’язаний із великим замовленням. Ці великі клієнти мають пріоритет у пошуку генерального агента або OEM-сервера на верхньому рівні, щоб отримати товари, і нижній рівень невеликий. Торгових посередників і постачальників серверних частин важко знайти. ЗМІ також повідомляють, що хмарні постачальники стверджують, що такі великі компанії, як Byte і Ali, здебільшого ведуть переговори безпосередньо з оригінальною фабрикою Nvidia щодо закупівель, а агентам і ринкам секонд-хенду важко задовольнити їхні величезні потреби.

Відсутність реального попиту на спотовому ринку не заважає кожному шукати товар. Якщо спотовий товар розпродано, потрібно бронювати ф'ючерси. Вони повинні нести високі депозити, які не повертаються, і дата доставки може бути далекою геть.

Зрозуміло, що карти A800 все ще є на ринку, карти A100 майже «вимерли», а модулі A800 рідко є в наявності, тому їм доводиться вибирати ф’ючерси. Для прикладу 8-карткового модуля A800 продавець назвав загальну ціну 1,12 мільйона, депозит 50% і термін доставки 7-8 тижнів. Немає гарантії своєчасної доставки (термін доставки було ще 6 тижнів кілька днів тому), а депозит не повертається. Наприкінці квітня ціна 8-карткового модуля A800 іншого продавця все ще була 900 000, із депозитом 30%-50% і терміном доставки 2 тижні.

Більш ніж за місяць можна побачити, що різниця в ціні модуля A800 з 8 картами становить понад 200 000 юанів, термін доставки подовжено, а депозит також може збільшитися.

Продавець, який заявив, що є фабрикою-джерелом, повідомив нам, що модуль із 8 картками є в наявності, і покупці, які бажають його, вже розмістили замовлення на суму 500 мільйонів юанів, і тепер їм залишається лише чекати повідомлення про прибуття.

Виплачуючи депозит, здається, можна завчасно стати в чергу, але високі ризики співіснують. Взявши як приклад 8-картковий модуль A800, зазвичай стягується депозит у розмірі 50%. Топовий модуль 80G NV A800 становить більше 1 мільйона, а депозит становить принаймні 500 000, і після депозиту оплачено, поверненню не підлягає. Покупець в Інтернеті повідомив, що 10 одноразових карток, замовлених у березні та квітні цього року, ще не отримали товар.

Термін доставки, обіцяний багатьма продавцями, не гарантований, базова ціна висока, а коефіцієнт депозиту також високий, тому реальних грошей, які потрібно заплатити, більше. Якщо ви не отримаєте товар, вам залишається тільки чекати, адже гроші сплачені.

**Якщо у вас є в наявності партія A800 і A100, в очах усіх це не звичайні відеокарти, це золоті цеглинки. **

Хтось бачить спеку і хоче займатися GPU бізнесом, але боїться, що товар потрапить до них в руки. Для окремих спекулянтів, які гоняться за прибутком, реальний попит сумнівний. Ціна зависока, не варта свічок.

Уживані продукти з’являються нескінченно, і деякі люди переробляють вживані мікросхеми штучного інтелекту за високими цінами.Не кажучи вже про те, де вони використовуються, гарантія на цей тип GPU є проблемою.

Термінове збільшення виробничих потужностей: передових виробничих процесів не бракує, у чому проблема?

Після того, як ChatGPT став популярним, інтернет-компанії та хмарні постачальники розгорнули великі моделі ШІ, щоб конкурувати за велику обчислювальну потужність графічних процесорів Nvidia.Чого не вистачає не лише A100 та A800, але й вищого класу H100 та H800. Хтось запитав, потужностей для виробництва пластин не бракує, чому не можна поставити GPU?

«Продуктивність графічного процесора зростає в 1000 разів кожні 10 років», «чим більше ви купуєте, тим більше ви заощаджуєте», закон Хуанга замінить закон Мура. Хоча прогресивні виробничі процеси можуть покращити продуктивність графічних процесорів, закону Мура прийшов кінець, і Мета сервера відрізняється від вимогливих вимог до простору чіпів мобільних телефонів. Якщо передове виробництво є першочерговим вибором для графічних процесорів, вдосконалене пакування є вишенькою на торті.

Недостатньо виробляти графічні процесори за допомогою передових виробничих процесів. Це великий крок у покращенні продуктивності графічних процесорів за поточних обмежень процесу виробництва чіпів, зробивши корпус невеликим, з низьким енергоспоживанням і меншою кількістю контактів, а також реалізувавши більш тісний взаємозв’язок між чіпами, чіпси та пакувальні субстрати. За допомогою будь-якої з чотирьох чарівних технологій Bump, RDL, Wafer і TSV передового пакування можна висвітлити нові навички пакування.

Nvidia V100, A100, A800, H100 тощо використовують передову технологію упаковки CoWoS від TSMC, яка вирішує проблему «інтеграції зберігання та обчислення» чіпів на тлі високої обчислювальної потужності ШІ. Проте потужність ливарного виробництва 7-нм пластин у TSMC справді не мала, але цього разу дефіцит усе ще насаджений на TSMC.

**По-перше, основну технологію розширеного пакування CoWoS може зробити лише TSMC, і це неможливо зробити без TSMC. **

Удосконалена пакувальна пластина, якої зараз не вистачає, технологія в ній є патентом TSMC, і Nvidia може знайти лише TSMC для цього.Удосконалений виробничий процес і передове пакування твердо охоплені TSMC. У 2012 році TSMC запустила свою унікальну передову технологію упаковки CoWoS і з того часу надає комплексні послуги від виробництва пластин до упаковки терміналів. Сімейство CoWoS включає CoWoS-S і CoWoS-L/R та інші частини, а клієнти, що відповідають високошвидкісним обчислювальним програмам, включають багатьох виробників першого рівня, таких як NVIDIA. Крім того, більшість серії розширеної упаковки InFO входять до складу Apple.

Ви сказали аутсорсинг? Низькотехнологічний процес — це добре, але базової технології все одно недостатньо без TSMC, а інші пакувальні фабрики можуть їсти лише суп.

Нещодавно, у відповідь на тимчасові потреби, TSMC прийняла метод аутсорсингу та субпідряду для частини ОС (на підкладці), але це не аутсорсинг процесу CoWoS. TSMC все ще зосереджується на найціннішій передовій частині упаковки.

Google TPU, Nvidia GPU і AMD MI300, які є імпортними виробниками генеративних чіпів штучного інтелекту, надали TSMC велику кількість замовлень AIGC, стимулюючи попит на розширення CoWoS.

По-друге, цей тип вдосконаленої упаковки також споживає відповідні виробничі потужності упаковки, яких зараз бракує.

З одного боку, сучасне пакування розвивається в напрямку виробництва пластин, тобто упаковки на рівні пластин, яка вміщує більше штирів у меншій площі упаковки, а з іншого боку, воно розширюється в напрямку нижньої області модулів і розвивається система в пакеті. Нещодавно @手机chip达人 виявив, що процес CoWoS поділяється на проміжний блок процесу передньої пластини та матрицю, укладену на матрицю внутрішньої упаковки. Відсутність виробничих потужностей CoWoS у TSMC пояснюється тим, що відсутність інтерпозера 65 нм.

Проміжний пристрій (interposer) тут використовує технологію Wafer (wafer).Наприклад, рішення технології упаковки CoWoS від TSMC — це технологія упаковки 2.5D, яка упаковує мікросхему в кремнієвий проміжний елемент (interposer) і використовує пластину високої щільності на кремнієвому проміжному елементі. Проводка використовується для з’єднання, а потім монтується на підкладку упаковки.

Тому графічний процесор потребує додаткових пластин у розширеному процесі упаковки, тобто ємності CoWoS. Іноземний капітал Nomura Securities очікує, що річна виробнича потужність CoWoS TSMC зросте з 70 000 до 80 000 пластин до кінця 2022 року до 140 000-150 000 пластин до кінця 2023 року. З постійним розширенням виробничих потужностей, за оцінками, виробничі потужності До кінця 2024 року буде оскаржено 200 000 пластин.

Заповнення прогалини в потужностях упаковки на рівні пластин стало головним пріоритетом. Більше того, із безперервним розвитком технології пластин, площа пластин поступово збільшується.Порівняно з InFO, CoWoS для ринку високого класу має відносно велику кількість підключень та розмір упаковки. За даними @手机chip达人, попит на 65-нм інтерпозер в 1,4 рази вищий, ніж на верхній кристал (H100).

Виробничі потужності передової упаковки CoWoS від TSMC серйозно не вистачають. З минулого року попит на CoWoS від TSMC зріс майже вдвічі, і попит залишатиметься високим наступного року. Розширене пакування може бути зроблено лише на фабриці TSMC у Тайвані, і TSMC безпосередньо розгортає та розширює кожну фабрику, щоб пришвидшити прогрес передового процесу пакування.

«Нестача графічної карти» спалахнула на сервер справжня пожежа чи помилкова пожежа?

Для покупців, яким це дійсно потрібно, використання такої високоякісної відеокарти в основному використовується для серверів штучного інтелекту, без карти, або модуля, або повної машини. ** Але за реальними потребами «БРІК» фактично поступається серверам. **

GPU для штучного інтелекту не витримують підвищення цін, а ціни на сервери з ними ростуть.Ще в квітні повідомлялося, що Inspur підвищить ціни на сервери штучного інтелекту приблизно на 20% після того, як Nvidia припинила постачання його топові чіпи A100 і H100 для Китаю. Інші джерела повідомили, що постачальник серверів збільшив ціну лише на сервери Nvidia AI, а ціни на інші серверні продукти не змінилися.

Згідно з даними Pacific Securities, у 2022 році 8 найпопулярніших серверних витратних матеріалів на китайському ринку серверів ШІ становитимуть 92%, а Inspur очолить список із 37%. Фінансова інформація Inspur показує, що Nvidia була її основним постачальником мікросхем. У 2019 році Intel і Nvidia є двома провідними постачальниками мікросхем Inspur.

Одна карта графічного процесора еквівалентна компоненту сервера. Попит на одну карту залежить більше від ціни. Сервер повинен використовувати кілька модулів графічного процесора, до 8 карт. Навіть версія сервера PCle зараз коштує близько 800 000 юанів , а версія NV становить 100 000 юанів. Мільйонний рівень.

Зараз ціна ф’ючерсу на A800 становить понад 1,2 мільйона юанів, а спотова ціна є відносно невеликою.За словами продавця відомого постачальника комп’ютерних послуг, спотова ціна машини A800 становить 1,68 мільйона юанів, а депозит становить 50%."На кінець липня є 35 одиниць. Замовлено 25 одиниць". Навіть для комерційного використання ціна недешева. Крім того, згідно з ринковими новинами, звичайний термін доставки машини A800 був запланований до кінця жовтня, і навіть багато продавців безпосередньо повідомляли про 24 тижні, а період доставки становить близько 6 місяців.

В очах деяких друзів, які займаються серверним бізнесом, яким би популярним не був графічний процесор, він не настільки близький до реального попиту, як сервер, і на ньому легше вести бізнес. Брат Сюй сказав, що зараз він зосереджується на серверах, і його не цікавлять окремі карти. Продаж серверів полягає в тому, щоб надіслати клієнтам конфігурації, перш ніж виставляти ціну. Карти викликають більше проблем, і це залежить від того, чи сумісний інтерфейс... Коротко , сервер відносно дешевий, чесно кажучи, більше транзакцій і висока плинність. А на картку просто багато запитів, занадто малий обсяг транзакцій, багато просять тільки великі компанії. «Ті, що потребують більше, — це майже всі для всієї машини, а ті, що в невеликих кількостях, — це всі карти».

Серед широкого діапазону потреб клієнтів не всі сервери AI є першокласними, коли вони з’являються, і коли вони з’являються, виникає багато вимог. Незалежно від того, чи це сервер A800 PCIE, сервер NVlinvk або сервер H800 HGX тощо, підприємства обирають конфігурації відповідно до різних потреб. Звичайно, ціна сервера буде більш прозорою, і буде більше можливостей для порівняння цін.

Графічні процесори та жорсткі диски є одним із аксесуарів серверів. Тепер, коли штучний інтелект став популярним у пов’язаних серверах, високоякісні графічні процесори, такі як A800, мають високу вартість і є дефіцитом. Серед готових машин їхня чутливість до ціни теж на передовій.

**Одна лише нестача графічних процесорів обмежує нормальну пропозицію серверів штучного інтелекту, які, здається, є гарячими на ринку, але змішані з більшою кількістю помилкових вимог. **

Ця хвиля лихоманки графічних процесорів нагадує 2020 рік, коли люди гарячково спекулювали на бізнесі пістолетів для температури чола.Тоді ефект розщеплення кола друзів призвів до фальшивого попиту на ринку, який був нескінченно більшим за реальний попит. Як наслідок, пропозиція є дефіцитною, спотова ціна значно вища за ф’ючерсну ціну, період доставки не гарантований, а вартість продавця за замовчуванням низька.

Дні надзвичайного дефіциту мікросхем підійшли до кінця. Хоча потужності для виробництва графічних процесорів високого класу деякий час не будуть доступні, відповідні бар’єри попиту на рівні підприємства є відносно високими, що вимагає офіційної технічної підтримки та післяпродажного обслуговування, а також різке зростання попиту, все це пропонується кожному.Без тривалої наполегливої праці та міцного фундаменту важко отримати частку тренду, покладаючись лише на кон’юнктурні засоби.

Переглянути оригінал
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити