Ставка на атомну енергетику! Microsoft має намір нагодувати великі моделі новими «боєприпасами»!

Джерело丨Стек технологій 51CTO

Автор Юнь Чжао

Корпорація Майкрософт амбітна, і того самого дня, коли Windows 11 повністю підтримує ШІ, стало відомо, що вона зробила нові кроки.

25 вересня за місцевим часом корпорація Майкрософт раптово опублікувала на своєму офіційному веб-сайті оголошення про прийом на роботу «Головного менеджера проекту з ядерних технологій». Неважко помітити, що після Microsoft Cloud Наделла сповнена вогневої міць у роботі з великими моделями.

Але що дивує, так це те, що від доступу до «Family Bucket Office» до GPT4, Azure, що надає хмарні ресурси, до нещодавньої комплексної Windows 11 на основі штучного інтелекту, саме тоді, коли нова Microsoft ось-ось з’явиться, чому Microsoft вирішила також зосередитися на енергетичний сектор З чого почати?

Штучний інтелект і ядерна енергетика, Microsoft не відпустить жодного з них!

На посаду «Головного менеджера програми з ядерних технологій», яку набирає Microsoft, поставлено завдання керувати технологічною оцінкою глобальної інтеграції малих модульних реакторів (SMR) і мікрореакторів для забезпечення живленням центрів обробки даних, де розташовані хмара Microsoft і AI. «Ця посада підтримуватиме чітку та адаптовану дорожню карту технологічної інтеграції, ретельно відбиратиме та керуватиме технологічними партнерами та рішеннями, а також постійно оцінюватиме прогрес і вплив впровадження на бізнес», — йдеться у оголошенні про вакансію.

Джерело: Microsoft

Крім того, Microsoft висуває вимоги до ідеальних кандидатів на цю посаду: вони повинні мати досвід роботи в енергетичній галузі та глибоко розумітися на ядерних технологіях і регуляторних питаннях. Ця посада також відповідатиме за дослідження та розробку інших докомерційних енергетичних технологій.

Велика модель «закінчилася» Tesla!

Ву Цзюнь, відомий галузевий експерт, якось дав метафору для навчання ChatGPT: кожне навчання ChatGPT еквівалентно дозволу 3000 електромобілів Tesla завершити 21-річну подорож за один місяць, і в основному всі вони марні. Цей опис не є перебільшенням.

Відповідно до «Звіту про індекс штучного інтелекту за 2023 рік», опублікованого Стенфордським інститутом штучного інтелекту (HAI), потужності, необхідної для навчання GPT3, достатньо, щоб пересічна американська сім’я прослужила сотні років. Згідно з підрахунками Guosheng Securities, вартість одного навчання GPT-3 сягає 1,4 мільйона доларів США.Для деяких більших LLM (великих мовних моделей) вартість навчання становить від 2 до 12 мільйонів доларів США.

Джерело даних: Luccioni et al.

«60% вартості навчання великої моделі — це електроенергія.» Тянь Ці, головний науковий співробітник відділу штучного інтелекту Huawei, також висловив занепокоєння проблемою живлення, вважаючи, що скорочення витрат і підвищення ефективності електроенергії є терміновими. Якщо великі моделі будуть популяризуватися і сервери швидко запрацюють у всьому світі, я боюся, що це не спалить землю.

Не дивно, що засновник OpenAI сказав на заході в понеділок, що для GPT тепер увага зосереджена на «зниженні витрат і підвищенні надійності», а не на поспішному запуску GPT-5.

Щоб заощадити електроенергію, боси Кремнієвої долини думають масштабно

Давайте спочатку подивимося на Microsoft. В даний час Microsoft націлилася на атомну енергетику. Можливо, ви не знаєте, що Білл Гейтс також має іншу особистість, тобто він є головою ядерної інноваційної компанії TerraPower, яка займається розробкою та просуванням малих модульних реакторів. Однак речник TerraPower сказав: «Наразі немає угоди щодо продажу реакторів Microsoft».

За даними Управління енергетичної інформації США, існуючі ядерні реактори в Сполучених Штатах наразі виробляють близько 18% загальної електроенергії, виробленої в Сполучених Штатах. Надії на технологію ядерних реакторів наступного покоління в основному покладаються на малі ядерні реактори.

Як випливає з назви, малі ядерні реактори менші, ніж традиційні реактори, і їх дешевше та швидше побудувати, оскільки вони сконструйовані з модульною структурою, і не кожну частину реактора потрібно виготовляти на замовлення.

Крім того, Microsoft публічно взяла на себе зобов’язання шукати ядерну енергетику у новаторів у галузі ядерного синтезу. У травні цього року Microsoft оголосила, що підписала угоду про купівлю електроенергії зі стартапом з ядерного синтезу Helion про закупівлю електроенергії у Helion у 2028 році. Як це сталося, генеральний директор OpenAI Сем Альтман також був важливим раннім інвестором Helion.

Крім того, відомий "Залізна людина Кремнієвої долини" Маск також розглядав енергію. У квітні ходили чутки, що Маск і Безос готуються об'єднати зусилля, щоб навчити супервелику модель. Щоб заощадити на охолодженні та енергоспоживанні, двоє фактично запропонували план «космічного центру обробки даних», відправивши SpaceX у космос 50 000 карт H100 NVIDIA та перевіз величезну кількість сонячних панелей, сподіваючись використати силу космосу для вирішення проблеми. Проблема електрики Проблема. Однак деякі експерти проаналізували, що це рішення є ненадійним.Наразі система живлення супутникових сонячних панелей, як правило, має потужність лише 1200 Вт.Потужність і вартість не такі хороші, як наземні рішення.

Звичайно, є інше більш надійне рішення, яке полягає в оптимізації енергоспоживання самого чіпа. Логіка такого типу управління енергоспоживанням полягає в тому, що в центрі обробки даних є кілька чіпів, і кожен чіп містить мільярди або навіть десятки мільярдів транзисторів. Один транзистор еквівалентний одній одиниці споживання електроенергії. З цього можна вивести зробив висновок, що розмір нігтя дорівнює Чіп — це великомасштабна енергетична мережа. Якщо можна оптимізувати енергоспоживання кожного транзистора, кінцева економія енергії може поширюватися на весь центр обробки даних.

Synopsys, провідна у світі компанія EDA, більше досліджує цю сферу. Ще 7 років тому вона запустила проект під назвою «Дизайн енергоефективності», щоб максимізувати енергоефективність чіпа.

Microsoft, просто хочете вирішити проблему споживання енергії?

Корпорація Майкрософт зробила цей крок не лише через ставку на ШІ та джерело потужності центру обробки даних, а й з інших причин.

За даними іноземних ЗМІ theVerge, Білл Гейтс завжди був відданим шанувальником атомної енергетики, оскільки атомна енергетика не створює викидів парникових газів і може відігравати певну роль у боротьбі зі зміною клімату.

Крім того, проблема енергоспоживання великих моделей не така серйозна, як здається. Старший аналітик відверто сказав, що ринку не потрібно надто турбуватися про енергоспоживання великих моделей. «Багато людей ігнорують той факт, що попит на обчислювальну потужність для великих моделей у майбутньому неминуче поступово знижуватиметься, а це означає, що споживання енергії також зменшиться».

Наприклад, відкритий вихідний код DeepSpeed-Chat від Microsoft від 12 квітня повністю ілюструє це.Він може збільшити швидкість навчання більш ніж у 15 разів і значно знизити вартість обчислювальної потужності. Лише один GPU може підтримувати ChatGPT-подібну модель із 13 мільярдами параметрів, а час навчання займає лише 1,25 години.

Нарешті, можна лише сказати, що коли зміни розпочато, їх важко повернути назад. Цього разу інвестиції Microsoft у штучний інтелект перевищують уяву галузі.

Довідкові посилання:

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити