Талантів для великих моделей дуже мало, а «відбір» важливіший за «культивування»｜Розмова з Куньлунь Ваньвей

2023-10-02 06:23:56

Джерело: Qubits

Останнім часом «Битва сотень моделей» загострилася. Під час буму великих моделей «талант» став центром жорсткої конкуренції між великими технологічними компаніями, підприємницькими командами та дослідницькими установами. Однак у сфері AIGC все ще існує велика прогалина в передових талантах.

Які таланти слід залучати, щоб сприяти розвитку моделі?

Де знайти великий модельний талант?

Як розвивати таланти великої моделі R&D?

Щоб відповісти на вищезазначені запитання, Qubit Think Tank спеціально запрошує практиків, експертів і вчених у галузі великих моделей штучного інтелекту поділитися з корпоративними командами можливостями та викликами та перспективами майбутнього розвитку талантів у великих моделях. та шукачі роботи.

Ця стаття є колонкою поглиблених інтерв’ю із серії «Талант великої моделі» аналітичного центру Qubit. Щоб дізнатися більше, зверніть увагу на майбутній «Панорамний звіт про розвиток талантів великої моделі AIGC 2023».

Знайомство з персонажем інтерв'ю

Фан Хан, голова та генеральний директор Kunlun Wanwei, один із засновників китайської Linux, очолив розробку першого вітчизняного P2P-прискорювача завантаження програмного забезпечення DUDU.

** **###### △Фан Хан, голова правління та генеральний директор Kunlun Wanwei

Він приєднався до Kunlun Wanwei у 2008 році та очолював розробку «Трьох королівств» і рольової веб-гри «Бойові мистецтва», отримавши багато нагород.

Чудові краєвиди

Протягом 1-2 років дефіцит алгоритмічних талантів буде значно зменшено.
Я розумію, що інноваційна свідомість таланту стосується того, як інноваційно вирішувати проблеми та покращувати показники з технічної та інженерної точки зору.
«Відбір» важливіше «вирощування», а самостійне навчання важливіше, ніж майстер, який веде підмайстра.
У такій новій галузі, як великі моделі, нещодавно закінчені докторанти можуть стати експертами в галузі після півроку навчання.
З точки зору пропозиції, великі таланти моделей зараз перебувають у стадії дефіциту, і ситуація значно полегшиться через 3-5 років.
З макроекономічної точки зору, порівняно з традиційними галузями промисловості, труднощі в культивуванні великомасштабних модельних талантів полягають у нинішній недостатній обчислювальній потужності університетів.
Компанії, які створюють нові бізнес-моделі на рівні додатків на основі ШІ та великих моделей, отримають найбільші дивіденди.

Запис інтерв'ю

Як визначити талант великої моделі?

**Мозковий центр Qubit: Як Kunlun Wanwei розподіляє великі модельні таланти? **

Фан Хан: Я вважаю, що навчання моделі слід розділити на дві основні частини: навчальний висновок і розробку додатків. Відповідно до зв’язку з навчанням моделі ми поділяємо таланти на таланти з боку алгоритмів, таланти з боку архітектури та таланти з боку розробки додатків**. Основні таланти з алгоритмів далі поділяються на попереднє навчання, обробку даних, оптимізацію висновків для точного налаштування, тощо

**Мозковий центр Qubit: який тип талантів, на вашу думку, є найбільш дефіцитним серед талантів алгоритмів, талантів архітектури та талантів розробки програм? І його, ймовірно, ще довго не вистачатиме. **

Фан Хан: Зараз найбільш дефіцитним талантом є, безперечно, талант у розробці базових алгоритмів, але ситуація з попитом і пропозицією швидко зміниться. Тому що тут є дуже цікаве явище. Зараз обчислювальна потужність різних університетів серйозно недостатня, і напрямок, пов’язаний з великими моделями, зараз є гарячою темою. Є багато талантів, які можуть звернутися до цієї галузі досліджень, наприклад НЛП. Усі таланти НЛП звертаються до великих моделей.

Тому я особисто вважаю, що протягом 1-2 років дефіцит алгоритмічних талантів значно зменшиться.Оскільки є так багато алгоритмічних талантів із високою зарплатою, я вважаю, що Китай все ще дуже ринково орієнтований у плані розподілу талантів.

Елементи компетенції, якими повинні володіти великі моделі талантів

**Мозковий центр Qubit: під час найму талантів, які якості самих талантів важливіші? **

Фан Хан: З точки зору наукових досягнень, практичного досвіду, академічної підготовки та інноваційної обізнаності, про які ви згадали, нашим пріоритетом є практичний досвід і інноваційна обізнаність: перш за все, Навчання великої моделі - це, по суті, інженерна проблема, тому практичний досвід, безумовно, дуже важливий. По-друге, великі моделі – це інноваційні проекти, тому що всі великі модельні компанії конкурують рука об руку, якщо немає відчуття інновацій, то важко буде випередити інших, тому що це абсолютно новий інженерний напрямок.

**Мозковий центр Qubit: Що ви думаєте про це почуття інновацій? **

Фан Хан: Інновації, які я розумію, відрізняються від інновацій, визначених громадськістю. У минулому це були більше алгоритмічні інновації. Що я маю на увазі під інноваціями, це, перш за все, йти в ногу з передовим прогресом великих моделей. У всьому світі багато людей вивчають навчання великих моделей. Цей напрямок розвивається дуже швидко. Щодня публікуються сотні нових робіт. , здійснюючи вдосконалення в різних напрямках і галузях. По-друге, мати можливість використовувати нові методи для вирішення проблем, що виникають у інженерії, на основі реальних потреб.Інновації тут більше зосереджені на тому, як інноваційно вирішувати проблеми та покращувати показники з технічної та інженерної точки зору.

**Мозковий центр Qubit: чи вважаєте ви, що інноваційну свідомість великих талантів можна оцінити за академічними досягненнями, патентними досягненнями тощо? **

Фан Хан: Я вважаю, що нерозумно судити про інноваційну свідомість талантів на основі патентних результатів. **OpenAI не приділяє особливої уваги ефективності талантів під час подання заявок на патенти. Найкраща інновація насправді залежить від внутрішнього накопичення досвіду. Нерозумно судити лише з точки зору патентів.

Однак ** академічні результати можуть бути використані як більш важлива основа для судження. **Наприклад, перші люди, які створили модель Vicuna, і перші, хто створив ControlNet, були докторантами.З цієї точки зору академічні результати можуть використовуватися як певна довідка.

Однак у фактичному робочому процесі, окрім великих інновацій у видавництві газет, існує незліченна кількість маленьких інновацій у техніці, яких потрібно досягти. **Тому інноваційну свідомість все ще потрібно оцінювати на основі швидкості та здатності талантів розв’язувати проблеми на практиці.

#### Як розвинути великі модельні таланти

**Мозковий центр Qubit: коли модель Tiangong буде оновлено з 1.0 до 3.5, на яких сферах талантів буде зосереджено увагу на різних етапах? **

Фан Хан: На ранніх етапах нам дійсно потрібні таланти в області алгоритмів, які краще знайомі з базовою архітектурою великих моделей, CNN і Transformer. Звичайно, це також включає в себе очищення та обробку даних. таланти в галузі обробки даних; коли великі моделі поступово дозрівають і потребуватимуть переходу до мультимодальності, знадобиться група спеціалістів, які займаються комп’ютерним баченням; якщо великі моделі мають бути представлені зовнішньому світу, знадобляться таланти аудит безпеки необхідний.

**Мозковий центр Qubit: як Kunlun Wanwei розвиває власні великі модельні таланти? **

Фан Хань: Куньлунь Ваньвей почав займатися моделюванням великих моделей у 2020 році. У той час на ринку було дуже мало талантів для створення великих моделей. Більше людей вибирали маршрут BERT і менше людей вибирали маршрут GPT , тож ми** у той час ми вирішили самі розвивати великі модельні таланти. **

Метод навчання полягає в тому, щоб дати талантам, які мають досвід роботи з алгоритмами, вивчити напрямок навчання моделі. Тоді під час найму ми повинні розглянути вибір талантів, які знайомі з машинним і глибоким навчанням, мають сильну самостійну силу та швидку швидкість навчання. Таланти, таланти з досвідом роботи з алгоритмами. Спочатку у нас були таланти, які вивчали технічні напрямки, такі як CNN, але тепер вони більше звернуться до навчання GPT.

**Мозковий центр Qubit: що ви думаєте про модель навчання «велика корова веде теля»? **

Фан Хан: Кожна технологічна компанія фактично обере метод навчання «великі корови ведуть молодих корів», але **вибір талантів важливіший, ніж розвиток талантів, а незалежне навчання важливіше, ніж майстри, які ведуть учнів, ** тому під час найму ми також надаємо велике значення здатності талантів до самостійного навчання.

Для традиційних технічних напрямків, таких як Java, потрібно покладатися на багатий досвід, а новим випускникам потрібен більш тривалий період навчання, щоб вирости в експертів у галузі. Проте навчання на основі великої моделі є новою сферою, і накопичення в промисловості не набагато глибше, ніж в академічних колах.**У нас є більше, ніж у академічних колах, — це обчислювальна потужність.**Насправді, на рівні алгоритмів ми не дуже попереду університетів.

**Мозковий центр Qubit: скільки часу знадобиться новим випускникам, щоб стати великими експертами з моделювання? **

Фан Хан: Є велика кількість докторантів, які можуть публікувати дуже сучасні роботи з великими моделями. Також можна побачити, що багато великомасштабних інноваційних робіт публікують докторанти другого та третього курсу. D. студентів. У школі ми знаходимо талантів, які можуть розпочати роботу, щойно вони прийдуть, і за кілька місяців виростуть у експертів у галузі.

Наша ідея полягає в тому, щоб вибрати найкращих талантів із нещодавно закінчених докторантів, які продемонстрували інноваційні здібності та **технічне бачення під час навчання. Ми можемо виростити «теля» за коротший період часу. Може стати тим, що ви називаєте «велика корова».

**Мозковий центр Qubit: за кілька місяців до року такі свіжі докторанти можуть стати «великими коровами» в цій галузі. Я розумію, що «великі корови», про яких ви маєте на увазі, це ті, хто має основні можливості для досліджень і розробок. **

Фан Хан: Так, ми даємо молодим людям багато можливостей. Насправді, ймовірно, лише кілька десятків людей проходять навчання GPT в OpenAI, і велика кількість із них є талантами, які щойно закінчили навчання кілька років тому. Я думаю, що це в основному стосується великих модельних команд у Китаї. Це абсолютно нова сфера, і можливості для новачків особливо великі. **Для щойно закінченого докторанта не проблема стати технічним експертом у цій галузі після приблизно півроку роботи, але йому однозначно бракує управлінських здібностей. **Ця технічна сфера є дуже новою, і всі біжать вперед на одній стартовій лінії. Щойно випускники не обов’язково мають недоліки.

**Мозковий центр Qubit: чи більшість свіжих випускників, про яких ви згадали, займаються обробкою природної мови? На які конкретні сфери він буде розбитий? **

Фан Хан: Це не зовсім природна мовна обробка. Я думаю, що на всьому етапі життя великої моделі, окрім обробки даних, вона повинна покладатися на накопичення інженерів, у *попередньому навчання, RLHF, SFT, оптимізація операторів * та інші аспекти, вони мають відповідні академічні напрямки досліджень, тому я думаю, що вони можуть розробити та навчити 70-80% великих моделей.

Талантам, які вивчають машинне навчання, навчання з підкріпленням і глибоке навчання, дуже легко перейти на великі моделі. І оскільки зараз існує багато моделей з відкритим кодом, і є багато людей в академічних колах, які пишуть дослідницькі роботи на основі моделей з відкритим кодом, я не думаю, що існує абсолютний розрив у розподілі праці між талантами університетів.

#### Розвиток вітчизняного великого ринку модельних талантів

**Мозковий центр Qubit: Що ви думаєте про поточний загальний розвиток ринку великих модельних талантів? **

Фан Хан: Я думаю, що **великі таланти моделей загалом перебувають у стані великого дефіциту, і **буде більше людей, які займатимуться складською роботою. Однак, оскільки стає все більше і більше практиків у великих моделях, розподіл праці ставатиме все більш детальним.Це природний процес диференціації. Процес розробки будь-якої нової технології виглядає так: від перших повних інженерів до керівника команди та лідерів на рівні директорів, диференціація технічного напрямку членів команди стане більш очевидною.

**Мозковий центр Qubit: Чи більшість талантів, яких залучає Kunlun Wanwei, походять з університетів, чи вони більше з цієї галузі? **

Фан Хан: Зараз нам потрібні таланти з практичним накопиченням, тому ми виберемо більше талантів із індустрії, які мають багатий інженерний досвід. Але в резерв набиратимуть і свіжих випускників, тому набір до шкіл більший, співвідношення шкільного набору до соціального майже 1:5.

**Мозковий центр Qubit: Як ви думаєте, на якому етапі зараз знаходиться розвиток талантів цієї великої моделі? **

Фан Хан: Судячи із загальної кількості академічних досягнень талантів, Китай посідає перше місце за кількістю опублікованих у світі робіт зі штучного інтелекту, а Сполучені Штати посідають друге місце. Кількість робіт у Сполучених Штатах більше, ніж у Китаї.

Я думаю, що з точки зору елементів здібностей таланти, таланти з різним досвідом потрібні великим моделям.Цих мають бути всі три, включаючи свіжих випускників, експертів і лідерів. **Але з точки зору пропозиції, зараз вона знаходиться на недостатньому рівні. Ситуація з пропозицією значно полегшиться приблизно через 3-5 років, **оскільки від встановлення предметів до випуску студентів проходить 5 років.

Труднощі в розвитку великих модельних талантів

**Мозковий центр Qubit: у яких аспектах, на вашу думку, можна покращити навчання талантів? **

Фан Хан: Я розповім про це в основному з двох точок зору: корпоративної та макроекономічної.

З перспективи підприємства, таланти розвиватимуться швидше, якщо вони будуть брати участь у інженерних проектах. Це дуже очевидний і практичний спосіб. У великих компаніях, які більш терплячі до талантів, їхні таланти будуть більш професійними в тому, що вони роблять, але в невеликих компаніях таланти великих модельних команд зростатимуть всебічніше, і вони повинні мати всі можливості повного набору великих моделі.

З макроскопічної точки зору, **порівняно з іншими традиційними галузями промисловості, труднощі в культивуванні талантів великомасштабних моделей полягають у поточній недостатній обчислювальній потужності університетів, через що школам важко навчати таланти архітектури, і ці таланти може їздити тільки на підприємства для навчання.навчання. Це дилема, з якою стикаються всі університети в усьому світі. Ми віримо, що після того, як обчислювальна потужність національного рівня буде розділена з університетами, ця ситуація буде полегшена.

**Мозковий центр Qubit: тобто він більше покладається на зв’язок промисловості, академічних кіл, досліджень і політики для розвитку великих талантів. **

Фан Хан: Я думаю, що ми повинні зробити все можливе, щоб забезпечити такі ж апаратні умови в школах, як і на підприємствах, інакше те, що ми вивчаємо в школах, безумовно, буде відносно обмеженим.

#### Майбутні тенденції розвитку великих модельних талантів і компаній ШІ

**Мозковий центр Qubit: з вашої точки зору, яка майбутня тенденція розвитку індустрії великих моделей в цілому? **

Фан Хан: Я думаю, що це не велика модельна індустрія, а вся індустрія штучного інтелекту. Можливості, з якими стикається індустрія штучного інтелекту, мають бути не меншими, ніж ті, що відкриваються в Інтернеті та мобільному Інтернеті. Я дуже оптимістично налаштований щодо тенденції розвитку індустрії штучного інтелекту. Я думаю, що штучний інтелект кардинально змінить весь Інтернет, і все людське життя зазнає значного впливу та змін. Я думаю, що вся галузь зазнає змін у напрямку.

**Мозковий центр Qubit: виходячи з цієї тенденції, які таланти великих моделей, на вашу думку, будуть більш прихильними для підприємств? **

Фан Хан: По-перше, сформувалася ситуація "війни сотень моделей". Усі створюють великі бази моделей. У майбутньому великі бази моделей точно скоротяться до кількох великих виробники та багато іншого. Багато компаній повинні мати можливість використовувати великі моделі для додатків, тому я думаю, що буде все більше талантів, які розроблятимуть додатки на основі великих моделей. **

Таланти, які відповідають за базове навчання, алгоритми оптимізації та архітектуру великих моделей, підуть до великих виробників або великих команд моделей.Однак ми вважаємо, що найбільшими гігантами є не самі великі модельні компанії, а ті, хто створює потужні програми на основі на великих моделях.цих підприємств. Коли ці підприємства виростуть, вони також створюватимуть власні великі моделі.

Ми вважаємо, що «додаток є королем» означає, що компанії, які розробляють нові бізнес-моделі на основі штучного інтелекту та великих моделей у додатках, отримають найбільші дивіденди. **Тоді ми вважаємо, що в наступні десять років обов’язково з’являться нові компанії-гіганти, такі як Byte, Meituan і Didi, і вони повинні вирости від 0 до 100. Компанії, засновані цього року або наступного року, повинні мати таку можливість. можливість.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

Нагородити
подобається
Прокоментувати
Поділіться

Прокоментувати

0/400

Немає коментарів

Тема
1/3
1Gate Launchpad List IKA
51k Популярність
2ETH Back to $3,800
8k Популярність
3Tariff Deal New Update
7k Популярність
4Stablecoin Regulation
658 Популярність
5Gate ETH 10th Anniversary Celebration
24k Популярність

Закріпити

карта сайту