Діалог із Цзі Сіньхуа, генеральним директором Youkede: конкурентоспроможні великі моделі не просто лежать і виграють, якщо у них є карта

2023-08-10 10:04:47

Автор| Хе Сісі

Редагувати | Чжан Цзінь

Джерело зображення: створено Unbounded AI

«Певною мірою заборона обчислювальної потужності в Сполучених Штатах обмежить розробку вітчизняних великомасштабних моделей, тому що неможливо навчати моделі без основної обчислювальної потужності.» Щодо важливості обчислювальної потужності для великих моделей, Цзі Сіньхуа, голова та генеральний директор UKED Скажи так.

З того часу, як велика модель стала популярною в Китаї в лютому цього року, обчислювальна потужність миттєво стала темою, яка найбільше хвилює індустрію, і це також стало перешкодою, яку важко подолати у вітчизняному навчанні великих моделей. Насправді, з іншої точки зору, вибухове зростання обчислювальної потужності також принесло безпрецедентні можливості розвитку вітчизняним постачальникам хмарних обчислень.

З цим погодився і Цзі Сіньхуа. Він сказав, що відключення обчислювальної потужності — це погано і добре.З одного боку, якщо ви хочете вирішити проблему вузьких місць протягом одного-двох років, вам потрібно прискорити дослідження та розробку вітчизняних чіпів, які це непросте завдання; з іншого боку, підприємства приділяють все більше уваги обчислювальній потужності, натомість це сприятиме розвитку вітчизняних мікросхем.

Як нейтральний виробник хмарних обчислень, Youkede вже давно відчуває, що за конкуренцією великих моделей ринок обчислювальної потужності призведе до величезних змін.

«Я вперше познайомився зі Stable Diffusion у листопаді минулого року. Тоді я вважав, що його ефект приголомшливий, тому я почав звертати увагу на велику модель», — пояснив Цзі Сіньхуа Leifeng.com, чому він заплатив У той же час він також розповів, що, оскільки на той час китайські компанії ще не почали звертати увагу на великомасштабні моделі, і вони не знали, яку цінність це може створити, тому вони на той час не вирішили займатися великомасштабним модельним бізнесом.

Справжнє застосування великомасштабних моделей і обслуговування великомасштабних модельних підприємств у Великій Британії розпочнеться в лютому цього року, а це також час для виходу великомасштабних моделей із кола в Китаї.

Leifeng.com дізнався, що UKED спочатку розробив чотири продукти штучного інтелекту для внутрішнього використання на основі великомасштабної моделі, платформи запитань і відповідей на знаннях «Shiwen», платформи помічника коду UCoder, платформи помічника з малювання AI і Платформа управління безпекою великомасштабної моделі Для недорогого центру обробки даних із високою доданою вартістю, створеного власними силами, UKED створив базу обчислювальної потужності AIGC, яка гнучко надає різноманітні ресурси обчислювальної потужності графічного процесора для навчання великих моделей, міркування , і обробка даних.

Одразу після цього UKED запустила приватизовану модель великого комплексу, яка вбудована в повноцінну приватну хмарну платформу UCloudStack, незалежно розроблену UKED, що забезпечує приватизаційні рішення для моделей віртуалізації, зберігання, мережі та MaaS у поєднанні з галузеві вертикальні великомасштабні моделі Підприємства можуть розгортати великі модельні додатки одним клацанням миші.

Щодо позиціонування UKED в епоху великих моделей Цзі Сіньхуа вкотре наголосив на принципі «нейтралітету». Він пояснив, що нейтралітет означає, що Великобританія не тільки не має конкуренції з клієнтами, але й допомагає великим модельним компаніям знаходити клієнтів. З цього приводу Цзі Сіньхуа також публічно дражнила, що в епоху великих моделей Юке має займатися «сватами».

З відповіді Цзі Сіньхуа ми також можемо опосередковано зрозуміти причини внутрішніх досліджень і розробок UKED і застосування великомасштабних моделей продукції. Одна з них полягає в тому, щоб співробітники компанії розуміли великомасштабні моделі та навчилися використовувати великомасштабні моделі. На цій основі вони можуть глибоко розуміти масштабні моделі.Які больові точки та в яких сценаріях це можна реалізувати, щоб краще обслуговувати клієнтів.

Що стосується майбутнього великих моделей, Цзі Сіньхуа сказав, що в майбутньому надто багато невизначеності, але незалежно від того, Інтернет-індустрія чи індустрія штучного інтелекту потребують обчислювальної потужності. Можливості взаємозв’язку обмежені, тому майбутня робота UKEDE зосереджено на створенні великомасштабної бази обчислювальної потужності.

Нижче наведено розмову між Leifeng.com і Цзі Сіньхуа:

Змагальні великі моделі не просто лежать і виграють, якщо у них є карти. Інженерні здібності є вирішальними для підготовки моделей.

**Leifeng.com:**Багато людей кажуть, що лише кілька хмарних постачальників можуть нарешті брати участь у змаганні великомасштабних моделей. Не всі вони мають високошвидкісні мережі. Як ви думаєте, які перешкоди для конкуренції?

Цзі Сіньхуа: Саме так, такі технології, як високошвидкісні мережі, не є основним порогом для конкуруючих великих моделей. У тому числі Youkede та більшість хмарних постачальників здатні це зробити. Зараз мережа має дві структури: перша – це мережа RoCE, яка UKED вже має таку можливість у 2019 році.

По-друге, мережеве рішення IB, яке рекомендує Nvidia. Це відносно просте рішення, яке потребує лише розгортання та підтримки. Тому для хмарних постачальників або особливо великих компаній технології не є головним порогом.

**Leifeng.com:**Насправді кажуть, що багато великих підприємств почали запасатися картками?

Цзі Сіньхуа: Так, особливо деякі великі виробники накопичують картки, зокрема A800, H800 тощо. З одного боку, його власний бізнес зі штучним інтелектом потребує використання карток, і з більшими капіталовкладеннями він придбає велику кількість карт раніше; з іншого боку, у лютому цього року почалася масштабна увага до великих моделей усередині країни, і різні виробники Через важливість це також прискорить швидкість накопичення карток.

Leifeng.com: Чи означає це, що чим більше у вас карток, тим більше ви виграєте? Як інші хмарні постачальники конкурують з великими гравцями?

Цзі Сіньхуа: Я не лежав і не вигравав. Багато компаній, що займаються розробкою великомасштабних моделей штучного інтелекту, зараз використовують наші карти. Це явище дуже поширене.

Причин декілька: по-перше, недостатньо використовувати лише одну картку, а по-друге, чому велика модельна компанія готова співпрацювати з Youkede? Це тому, що вони відчувають, що великі заводи мають обчислювальну потужність, алгоритми, дані та сценарії, і їх турбує конкуренція в бізнесі, коли вони співпрацюють з великими заводами. Як нейтральний і безпечний хмарний постачальник, Ukerd не має конкуренції з великими підприємствами. У той же час UKDE може розробляти обчислювальні потужні платформи, бібліотеки моделей тощо з центру обробки даних і базової архітектури, з глибоким технічним накопиченням і можливостями комплексного обслуговування системної інженерії.

Добре попрацюйте в службі обчислювальної потужності та добре попрацюйте в ролі великої моделі "свати"

**Leifeng.com: **Коли Youkede почав звертати увагу на великі моделі?

**Цзі Сіньхуа: **Найперший контакт був під час Національного дня минулого року. Перше, що я побачив, це стабільна дифузія. Тоді я вважав, що її ефект неймовірний, тому я почав звертати увагу на велику модель, тому ми стежили за ChatGPT раніше.

Leifeng.com: Отже, ви вирішили зробити це під час Національного дня минулого року?

Цзі Сіньхуа: після Національного дня минулого року UKED поставив AIGC як мету на цей рік і випустив зображення платформи малювання AI у листопаді минулого року. У лютому цього року, після спілкування з провідними великими модельними компаніями в Китаї, я зрозумів, що вітчизняний ринок обчислювальної потужності буде мати вибуховий розвиток, тому я вирішив зробити це наприкінці березня.

Leifeng.com: Скільки потенційних клієнтів у цих масштабних зразкових підприємств?

Цзі Сіньхуа: Ми дійшли висновку, що в Китаї є 130 великих модельних компаній, 78 компаній загального призначення та 52 вертикальні компанії. І вона продовжує зростати, більше 30 з них вже є нашими клієнтами.

Leifeng.com: У якому вигляді буде експортовано послугу?

Цзі Сіньхуа: Одне — це наша обчислювальна потужність, а інше — послуги комп’ютерного класу, тому що деякі компанії купують власне обладнання та розміщують його в нашому комп’ютерному класі.

Leifeng.com: Як ви розумієте обслуговування комп’ютерних кімнат? Це тому, що сам замовник не має оперативних можливостей?

Цзі Сіньхуа: Підприємству самому потрібен комп’ютерний зал, де б він не знаходився. Комп’ютерний зал, необхідний для великої моделі, має дві характеристики: одна полягає в тому, що вона споживає багато енергії, а інша – у споживанні енергії машини H100 перевищує 10 кВт.Комп’ютерний зал не може задовольнити цей попит, і центр обробки даних Ulanqab в Youkede особливо підходить. Крім того, багато компаній зараз мають проблему з серверами, але не можуть ними користуватися. Ukerde може допомогти їм побудувати обчислювальну потужну платформу та виконувати подальші роботи з обслуговування.

Leifeng.com: Окрім забезпечення обчислювальної потужності, Youkede також випустив "Shiwen" деякий час тому?

Цзі Сіньхуа: UKED створила чотири внутрішні платформи: платформу запитань і відповідей на знаннях «Shiwen», платформу помічника з коду UCoder, платформу помічника з малювання штучного інтелекту та платформу керування безпекою великих моделей. Насправді, до «знання» перше, що ми зробили, це система керування додатками великомасштабної моделі. Це наш перший продукт, і ми сподіваємося, що кожен зможе використовувати масштабну модель у майбутньому;

По-друге, щоб вирішити питання комерційної безпеки, ми зробили деякі обмеження, включаючи ваші запитання та завантажені файли, ми будемо записувати та фільтрувати їх, щоб запобігти витоку конфіденційної інформації компанії в Інтернеті;

По-третє, система автоматично записуватиме проблеми користувача, включаючи внутрішні проблеми співробітників і зовнішню комунікацію та зворотній зв’язок, щоб компанія могла продовжувати проводити власне модельне навчання на наступному етапі.

Leifeng.com: Чому ви зробили ці чотири продукти? Чи можна вийти на вулицю?

Цзі Сіньхуа: По-перше, щоб співробітники компанії могли розуміти та використовувати масштабні моделі. На цій основі вони могли глибоко зрозуміти, які больові точки великомасштабних модельних компаній і в яких сценаріях вони буде впроваджено, щоб краще обслуговувати клієнтів.Надавати послуги.

Ці чотири продукти наразі використовуються всередині компанії, але якщо це потрібно клієнтам, ми також можемо спілкуватися більше.

Leifeng.com: На якій моделі базуються ці платформи?

**Цзі Сіньхуа: **Спочатку тренуйтеся з GPT 4, проведіть перевірку моделі, а потім поступово використовуйте великі вітчизняні моделі або великі моделі з відкритим кодом для оптимізації. У зв’язку з цим я також згадав концепцію під назвою «точити зброю за кордоном і воювати вдома».

Leifeng.com: Щодо інших сценаріїв у майбутньому ви дивитеся оптимістично?

Цзі Сіньхуа: Якщо це розрізняється відповідно до допустимості неточності вихідного вмісту ChatGPT, ми розділили 10 сценаріїв.

Перший – це переклад і дубляж. Здібності в цій сфері вже дуже високі і можуть повністю замінити людей; другий – NPC гри; третій – соціальна взаємодія; четвертий – вихід контенту електронної комерції; п’ятий це ігровий дизайн; шостий — обслуговування клієнтів; сьомий — допомога в документуванні та програмуванні; восьмий — управління знаннями всередині підприємства; дев’ятий — сценарії навчання та страхування; і останній — допомога юристам і лікарям.

Leifeng.com: Ці 10 сцен будуть створені одночасно? Або крок за кроком?

Цзі Сіньхуа: Ucar не виготовляє великих моделей, ми просто об’єднуємо клієнтів і партнерів, що можна розуміти як роль «сватів». Наприклад, підключіть клієнтів ігор до MiniMax, а клієнтів у сфері електронної комерції та освіти – до Zhipu Huazhang.

Вітчизняним великомасштабним моделям важко наздогнати GPT4, а для компаній-початківців більше можливостей

Leifeng.com: Як ви думаєте, на скільки типів можна поділити вітчизняні великі модельні компанії? Хто є ключовими клієнтами Youkede?

Цзі Сіньхуа: Ми розділені на п'ять категорій. Перша категорія — це гіганти, серед яких Ali, Baidu, Toutiao, Huawei, JD.com тощо. Другу категорію засновують вчені, такі як Zhipu Huazhang; третя категорія — оригінальна компанія ШІ, AI Four Tigers, Daguan, Yunzhisheng, 4Paradigm тощо; четверта категорія — стартапи, такі як MiniMax; п’ята категорія — що початкові компанії, зареєстровані на біржі, перейшли на масштабні моделі, такі як Kunlun, 360, а також включають лідерів підприємництва, таких як Ван Сяочуань і Лі Кайфу.

Перший тип великих виробників не є цільовими клієнтами Youkede, а останні типи є нашими ключовими клієнтами.

Leifeng.com: Тобто великі заводи мають можливість будувати самі себе, але інші компанії не мають здатності будувати самі себе?

Цзі Сіньхуа: Оскільки це пов’язано зі сферою штучного інтелекту, це не лише мережева проблема, а й низка проблем, таких як сховища та комп’ютерні кімнати. Наприклад, компанії-початківці також можуть створювати власні комп’ютери потужність, але цикл буде дуже довгим. Зачекайте, поки він побудує його сам. Після цього змагання закінчено. Конкуренція великих моделей полягає в швидкості, і той, хто має найшвидшу швидкість, може зайняти командні висоти.

Leifeng.com: Скільки етапів і вузлів має велика модель для великого заводу?

Цзі Сіньхуа: Перше – це запуск великої моделі, а друге – перевірка ефекту після запуску. Наразі відомо, що запустили такі компанії, як MiniMax, Zhipu, Baidu, Ali, HKUST Xunfei тощо.

**Leifeng.com:**Який із них кращий, чи залежить це головним чином від того, скільки обчислювальної потужності він використовує?

Цзі Сіньхуа: Я так не думаю. Більше обчислювальної потужності для навчання може не обов’язково створити хорошу модель, але якщо посилання на висновок використовується частіше, це означає, що є велика кількість користувачів і більше відгуків буде отримано. Це сприяє навчанню хорошої моделі.

**Leifeng.com:**Незалежно від підготовки чи міркувань, щоб побудувати велику модель, ви спочатку повинні мати обчислювальну потужність?

Цзі Сіньхуа: Так, перш за все мати картку. Якщо у вас немає картки, ви точно будете позаду. Близько 40-50%. Якщо вищевказані дві проблеми вирішено, це проблема безпеки, і проблема потоку також дуже важлива.

Leifeng.com: Який рівень вітчизняних моделей? Багато людей кажуть, що він наздожене GPT4 до кінця цього року.

Цзі Сіньхуа: Наразі в Китаї немає жодної моделі, яка перевершує GPT3.5. Звичайно, насправді дуже легко перевершити GPT3.5 у певному аспекті. Важко перевершити GPT4. Ключовим є те, що документи до GPT3.5 є публічними, але GPT4 ще не оприлюднено, тому всі не знають, що робити.

Leifeng.com: Хіба ці великі вітчизняні виробники не мають шансу наздогнати?

Цзі Сіньхуа: Я вважаю, що ефект від великих компаній не такий хороший, як від компаній-початківців. Тому що деякі компанії-початківці з переконаннями та ідеалами вже почали це робити, і Dachang фактично розпочав це після того, як побачив популярність ChatGPT.

Leifeng.com: Цілком зрозуміло, що великі виробники накопичили технології, тож хіба вони не мають більше можливостей?

Цзі Сіньхуа: Є багато напрямків розвитку штучного інтелекту. Раніше більшість компаній вважали, що вертикальні великомасштабні моделі мають можливості, але не думали, що широкомасштабні моделі загального призначення мають можливості. Тому в минулому кілька років, це були деякі підприємницькі команди з переконаннями та науково-дослідницькі групи, такі як Zhipu Huazhang, MiniMax, Китайська академія наук тощо.

Для великих виробників більше важливо бачити, що іноземні країни слідкують за цим, і це не піднялося до стратегії компанії, тому вони не мають великого накопичення у великих моделях загального призначення.

Leifeng.com: Проблема обчислювальної потужності рано чи пізно буде вирішена, тож які переваги UKEDe з точки зору великих моделей?

Цзі Сіньхуа: Це можна підсумувати трьома пунктами: по-перше, зберігати нейтралітет і не мати конкурентних відносин з користувачами. По-друге, він має можливість створювати повний набір рішень AIGC для центрів обробки даних, мереж і сховищ даних, що може допомогти малим і середнім компаніям швидко створювати платформи та вирішувати проблему ефективності використання великих моделей; по-третє, він може краще допомагати великим модельним компаніям розширювати кількість клієнтів.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

Нагородити
подобається
Прокоментувати
Поділіться

Прокоментувати

0/400

Немає коментарів

Тема
Gate 2025 Q2 Report Released
12k Популярність
CPI Data Incoming
43k Популярність
Altcoin Season Update
305 Популярність
4Gate Derivatives Volume Hits New High
14k Популярність
5Join Gate VIP to Win MacBook
30k Популярність
6MicroStrategy Buys More Bitcoin
732 Популярність
7BTC Hits New High
90k Популярність
8My Gate Moments
25k Популярність
9VIP Exclusive Airdrop Carnival
26k Популярність
10Fed June Meeting Minutes
7k Популярність

Закріпити

карта сайту