GPU революція: як ми можемо за допомогою zk-SNARKs прискорити Ethereum в 1000 разів

2025-05-29 05:57:02

Ця стаття розгляне ключовий технологічний прорив: за допомогою поєднання високопродуктивних GPU та zk-SNARKs ми покращуємо ефективність роботи Ethereum в сотні, а то й тисячі разів. Це не лише вирішує довгострокові проблеми з продуктивністю Блокчейн, але й надає перспективний технічний шлях для інфраструктури Web3 у майбутньому.

Якщо вам коли-небудь було цікаво: чому Ethereum працює повільно, а витрати на транзакції залишаються високими? Або ви звертаєте увагу на ключові фактори, що впливають на технології наступного покоління Блокчейн? Тоді ця стаття надасть вам чіткі відповіді.

Суть проблеми: Чому Блокчейн схожий на забиті автостради?

Можна уявити Ethereum як高速公路. Сьогодні всі користувачі та додатки змагаються за обмежені ресурси смуг, що призводить до перевантаження мережі, повільної обробки транзакцій та високих витрат на Gas.

Традиційні підходи до вирішення проблеми в основному поділяються на два типи:

Ремонтувати більше смуг – тобто будувати мережу Layer 2 (наприклад, Rollups)
Зробити автомобілі меншими — тобто стиснути дані транзакцій

Але що робити, якщо був спосіб «телепортувати» транспортний засіб замість того, щоб продовжувати бігти по смузі? Це революція парадигми, спричинена доказами з нульовим розголошенням (ZKP). Основна ідея полягає в тому, що автентичність транзакції можна перевірити шляхом створення математичного доказу без необхідності передавати всі дані самої транзакції. Іншими словами, замість того, щоб кожна машина їхала по шосе, ми можемо безпосередньо переконатися, що «ці машини дійсно дійшли до кінця». Це не тільки знижує навантаження на передачу даних, але й робить сумісністю з принципом «висока пропускна здатність + надійна безпека + перевірка без довіри».

The Verge: Наступний крок розвитку Ethereum

Ethereum наразі просуває грандіозний технічний план — The Verge, ви можете сприймати його як "програму схуднення" Ethereum. Мета: значно знизити поріг для запуску вузлів Ethereum, так само просто, як запустити додаток на телефоні. У майбутньому кожен зможе легко приєднатися до мережі Ethereum, не покладаючись на високопродуктивний ігровий комп'ютер.

Але за цією програмою стоїть ключовий технологічний виклик: вона потребує виконання мільйонів складних математичних обчислень за дуже короткий проміжок часу.

Це саме той прорив, на якому зосереджена команда Polyhedra — як використовувати GPU для прискорення масштабних ZK обчислень, значно підвищуючи ефективність виконання при забезпеченні безпеки верифікації.

Технічні виклики: цей набір даних переверне твоє уявлення

Щоб зрозуміти складність, з якою ми стикаємося, наведеним є реальний масштаб поточних операцій на ланцюгу Ethereum:

Підтвердження консенсусу (Consensus Verification): Кожен блок містить приблизно 90 мільйонів обчислень SHA 2-256 хешу та 2048 перевірок цифрового підпису BLS.
Докази переходу стану (State Transition Proofs): Кожен Блок потребує приблизно 500 тисяч виконань хеш-операцій Keccak
Поточне вузьке місце:
Базований на CPU zk-SNARKs (Prover) наразі може обробляти лише близько 2 мільйонів обчислень Poseidon хешу на секунду.

Справжній виклик полягає в тому, що нам потрібно використовувати технологію zk-SNARKs для виконання всіх наведених вище обчислень, що безперечно значно збільшує обчислювальну складність.

Точка прориву: революція обчислювальної потужності GPU

Ні для кого не секрет, що графічні процесори є фаворитом геймерів та інженерів штучного інтелекту. Але насправді ці графічні процесори набагато потужніші, ніж центральні процесори, коли справа доходить до обробки масиву паралельних математичних обчислень, необхідних для доказів з нульовим розголошенням.

У Polyhedra ми провели нативну оптимізацію ZK системи доказів для GPU та досягли вражаючих проривних показників продуктивності:

Продуктивність стрибка, значно перевищує очікування

Прискорення базових математичних операцій (область Мерсенна 31) в 362 рази
Складні криптографічні обчислення (еліптична крива BN 254) прискорені до 2826 разів
Обчислення з нульовим знанням, яке раніше займало 21 хвилину, тепер скорочено до всього 450 мілісекунд.

Інакше кажучи, це еквівалентно тому, що ваш час комутування вранці у піковий час скорочується з 20 хвилин до менш ніж півсекунди. Це не поступова оптимізація, а парадигмальний стрибок у обчисленнях.

Чому цей прорив стосується вас?

Нижчі комісії за транзакції: швидкість генерації доказів зросла, що означає значне зниження загальних витрат на обчислення, а отже, і нижчі витрати на Gas. Вигода для користувачів та мережі.
Сильніша гарантія безпеки: пам'ятаєте, ми згадували, що річний бюджет безпеки Ethereum перевищує 40 мільйонів доларів? Завдяки нашій технології, легкі вузли також можуть легко перевіряти всю консенсус-ланцюг Ethereum, насолоджуючись рівнем безпеки основної мережі без необхідності у великих витратах ресурсів.
Більш популярні вузли можуть працювати, мобільні телефони можуть працювати з Ethereum: Наша постійна оптимізація продуктивності та ефективності робить можливим запуск вузлів Ethereum на звичайних пристроях. У майбутньому для перевірки даних блокчейну може знадобитися лише мобільний телефон.

Технічне ядро: як ми це зробили

1. Дизайн GPU: Оптимізований для CUDA протокол Sumcheck

Наше реалізація Sumcheck, побудована на базі CUDA, повністю використовує переваги паралельних обчислень GPU:

Розробка кастомізованих CUDA-ядер для операцій в полях (додавання, множення, піднесення до степеня)
Використовуючи режим об'єднаного доступу до пам'яті, максимізуйте використання пропускної здатності GPU (реальні вимірювання пропускної здатності RTX 4090 становлять до 1008 ГБ/с)
Використання примітивів рівня warp для реалізації ефективних операцій редукції (Reduction)

Цей рівень глибокої кастомізації дозволяє протоколу Sumcheck більше не бути обмеженим послідовними вузькими місцями CPU.

Пам'ять - це король: оптимізація вузького місця пропускної здатності традиційна думка вважає, що обчислювальний вузол ZK Prover має вузьке місце в обчислювальній потужності, але наші експерименти показують — Sumcheck є типовою проблемою вузького місця пам'яті:

Аналіз пропускної здатності пам'яті: використання смуги пропускання досягає теоретичного максимуму 95% +
Оптимізація структури даних: використання Structure-of-Arrays (SoA) замість традиційної Array-of-Structures (AoS) структури
Підвищення використання SM-одиниць: досягнення оптимального використання апаратних ресурсів шляхом оптимізації конфігурації блоку потоків.

Шляхом вирішення проблеми пропускної здатності пам'яті ми перетворили ZK обчислення на справжнє ефективне потокове завдання.

3. Стратегії оптимізації, адаптовані до різних числових полів

Різні криптографічні області мають різні обчислювальні характеристики, ми розробили оптимізовані шляхи для кожної основної галузі:

Mersenne 31 (M 31): оптимізація 31-розрядних цілих чисел, ефективна структура модульних обчислень
M 31 ext 3: Підтримка розширених полів з урахуванням поліноміального розширення та низьких витрат
BN 254: Спеціалізований множник на основі алгоритму Монтгомері, розроблений для полів великих цілих чисел розміром 254 біти

Ця високоцільова підкладкова оптимізація робить наш ZK Prover одночасно універсальним і надзвичайно ефективним.

Розподіл даних про продуктивність: місця оптимізації

Ми не просто зробили "значно швидше", а підняли продуктивність ZK на небувалі висоти. Ось дані про фактичну продуктивність:

Розкриття технічної архітектури: правда під капотом

GKR протокол стек: прискорене ядро

Наше прискорене оптимізування зосереджене на протоколі GKR (Goldwasser-Kalai-Rothblum), зокрема включає:

Лінійний GKR шар: використовується для обробки додавання та множення
Протокол Sumcheck: вузьке місце в продуктивності, займає майже 50% загального часу обчислень процесора
Етап оцінки поліномів: зменшення часу обчислень на GPU з 8,4 секунд до 9,5 мілісекунд

Детальний опис проектування ядра GPU

Перший етап: оцінка поліномів

Паралельні обчислення на 2 ^n точках
Використання коефіцієнта кешування спільної пам'яті для підвищення швидкості доступу
Завдяки warp shuffle реалізувати ефективні операції редукції
Другий етап: Генерація викликів
Виконання хешування Fiat-Shamir всередині GPU, уникаючи частих перемикань між CPU та GPU
Зменшити затримку зв'язку між CPU та GPU

Оптимізація передачі пам'яті: подолання "остання миля" даних.

Ми також провели системну оптимізацію в області взаємодії CPU-GPU, щоб забезпечити, що пропускна здатність не стане вузьким місцем:

Оптимізація пропускної спроможності PCIe: обробка 2 ^{ 27 } елементів займає лише 737 мілісекунд
Закріплена пам'ять: підтримка "нульового копіювання" передачі даних, зменшення витрат на копіювання
Асинхронне планування операцій: обчислення та зв'язок виконуються паралельно, максимізуючи використання ресурсів

Чесно кажучи: виклики все ще існують

Ми завжди дотримуємося прозорості — прискорення за допомогою GPU не є універсальним рішенням, у процесі реальної реалізації ми також стикалися з чималою кількістю технічних обмежень:

Пропускна здатність пам'яті досягла максимуму

Навіть якщо H100 має пропускну здатність до 3,35 ТБ/с, при високому навантаженні це все ж може стати вузьким місцем продуктивності.
Порівняно: більші області еліптичних кривих (наприклад, BN 254) швидше досягають піку, ніж малі області (наприклад, M 31)

Обсяг пам'яті GPU обмежений

RTX 4090 вичерпала пам'ять під час обробки 2 ^{ 29 } елементів
Для фактичного розгортання потрібна детальна стратегія управління пам'яттю, щоб уникнути ризику переповнення.

Торгівля між розміром домену та продуктивністю

Порівняння "Переваг GPU": з якого часу вони почали перевершувати CPU?

Тестування крос-платформної продуктивності

Ми провели бенчмаркінг на різних рівнях GPU, охоплюючи споживчий та дата-центричний апаратне забезпечення:

споживчий GPU

RTX 3090: Ширина пропускання пам'яті 936 ГБ/с, продуктивність зростає до 951 разу.
RTX 4090: Ширина пам'яті 1008 ГБ/с, підвищення продуктивності до 1565 разів
Центр обробки даних GPU
NVIDIA H100: пропускна здатність до 3.35 ТБ/с, продуктивність підвищена до 2826 разів

Висновок чіткий і зрозумілий: пропускна здатність пам'яті є ключовою змінною для прискорення zk-SNARKs.

Перспективи на майбутнє: наша дорожня карта

Ми ще далеко не зупинилися, наступними кроками будемо продовжувати досягати наступних цілей:

Максимальне прискорення: для певних операцій мета полягає в досягненні підвищення швидкості в 10 000 разів
Ширша апаратна сумісність: повне покриття від високопродуктивних ігрових відеокарт до прискорювачів рівня дата-центрів
Нативна інтеграція Ethereum: Ми співпрацюємо з командою розробників клієнта Ethereum, щоб безпосередньо інтегрувати наш стек GPU ZK доказів у рівень L1.

Приєднуйтесь до цієї хвилі змін!

Це не лише підвищення швидкості, а й повна перетворення доступності Блокчейн. Незалежно від того, хто ви є, ви зможете знайти спосіб взяти участь:

Розробники: ласкаво просимо переглянути наші репозиторії Expander та CUDA, щоб разом будувати майбутнє
Учень: слідкуйте за нашими науковими семінарами та технічними глибокими зануреннями, постійно оновлюючи актуальність.
Усі: поширюйте цю технологію! Чим більше людей розуміють, тим ближче майбутнє Web3.

Огляд основних ідей

Ми знаходимося на захоплюючому технологічному роздоріжжі. Поєднання zk-SNARKs та прискорення GPU – це не просто незначне покращення продуктивності, а революція в парадигмі.

Ми переосмислюємо межі швидкості, вартості та доступності Ethereum.

Огляд ключових технологічних досягнень:

Реалізація ZK доказів для виробничого середовища з прискоренням понад 1000 разів
Використання пропускної здатності пам'яті GPU перевищує 95%
Відкритий код, можна інтегрувати в будь-який час

Майбутнє Web3 не лише децентралізоване, а й надшвидке, і воно буде швидшим, ніж ви собі уявляєте.

Яка з цих досягнень вас найбільше цікавить? Ласкаво просимо залишити коментарі в розділі коментарів або взаємодіяти зі мною в Twitter, ми з радістю поглибимо обговорення цих технічних деталей!

Майбутнє належить швидкості, а також тобі. До зустрічі наступного разу, продовжуй будувати, не обмежуючись лише швидкістю!

ETH-1.47%

Переглянути оригінал

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

Нагородити
подобається
Прокоментувати
Поділіться

Прокоментувати

0/400

Немає коментарів

Тема
BTC Hits New High
56k Популярність
ETH Breaks $3,000
17k Популярність
VIP Exclusive Airdrop Carnival
5k Популярність
4Pump.Fun Debuts on Gate
3k Популярність
5Fed June Meeting Minutes
4k Популярність
6Join Gate VIP to Win MacBook
29k Популярність
7Trump Tariff Hikes
16k Популярність
8Gate xStocks Trading Share
22k Популярність
9HK Stablecoin Rules
12k Популярність
10Truth Social Crypto ETF
2k Популярність

Закріпити

карта сайту