Талантов для крупномасштабных моделей очень мало, и «отбор» важнее «выращивания».|Разговор с Куньлунем Ванвэем

Источник: Кубиты

В последнее время «Битва сотен моделей» обострилась. В период бума больших моделей «таланты» оказались в центре жесткой конкуренции между крупными технологическими компаниями, командами предпринимателей и исследовательскими институтами. Однако в области AIGC по-прежнему существует большой дефицит передовых специалистов.

Какие таланты следует привлечь для облегчения разработки моделей?

Где нанять талантливую модель?

Как развивать таланты в области исследований и разработок крупных моделей?

Чтобы ответить на вышеперечисленные вопросы, Qubit Think Tank специально приглашает практиков, экспертов и ученых в области больших моделей искусственного интеллекта, чтобы поделиться с корпоративными командами возможностями и проблемами, а также перспективами будущего развития талантов крупных моделей. и соискатели работы.

Эта статья представляет собой колонку углубленных интервью из серии «Большие модельные таланты» аналитического центра Qubit. Для получения дополнительной информации обратите внимание на предстоящий «Панорамный отчет AIGC по развитию талантов для крупных моделей за 2023 год».

Представление персонажа из интервью

Фан Хань, председатель и генеральный директор Kunlun Wanwei, один из основателей китайской Linux, возглавил разработку первого отечественного ускорителя программного обеспечения для загрузки P2P DUDU.

** **###### Фан Хан, председатель и генеральный директор Kunlun Wanwei

Он присоединился к Kunlun Wanwei в 2008 году и возглавил разработку «Трех королевств» и ролевой веб-игры «Боевые искусства», за что получил множество наград.

Прекрасные виды

  • В течение 1-2 лет нехватка алгоритмических талантов значительно сократится.
  • Инновационное сознание талантов, как я понимаю, относится к тому, как инновационно решать проблемы и улучшать показатели с технической и инженерной точки зрения.
  • «Отбор» важнее «выращивания», а самостоятельное обучение важнее, чем мастер, ведущий ученика.
  • В новой области, такой как большие модели, недавно окончившие докторантуру могут стать экспертами в предметной области после полугода обучения.
  • С точки зрения предложения, талантливые модели в настоящее время испытывают дефицит, и ситуация значительно улучшится через 3-5 лет.
  • С макроэкономической точки зрения, по сравнению с традиционными отраслями, трудность в развитии талантов крупномасштабных моделей заключается в нынешней недостаточной вычислительной мощности университетов.
  • Компании, которые создают новые бизнес-модели на уровне приложений на основе ИИ и крупных моделей, получат самые большие дивиденды.

Запись интервью

**Как определить талант крупной модели? **

** Аналитический центр Qubit: Как Куньлунь Ванвэй разделяет таланты крупных моделей? **

Фан Хан: Я считаю, что обучение моделям следует разделить на две основные части: обучение вывода и разработку приложений. В соответствии с процессом обучения модели мы делим таланты на таланты в области алгоритмов, таланты в области архитектуры и таланты в области разработки приложений. Таланты в области основных алгоритмов далее подразделяются на предварительное обучение, обработку данных, тонкую настройку оптимизации вывода и т. д.

** Аналитический центр Qubit: Какого типа таланты, по вашему мнению, наиболее дефицитны среди специалистов по алгоритмам, архитектуре и разработке приложений? И, вероятно, еще долгое время его будет не хватать. **

Фан Хан: В настоящее время самым дефицитным талантом, безусловно, являются специалисты по основным алгоритмам, но ситуация со спросом и предложением будет быстро улучшена. Потому что здесь есть очень интересное явление.В настоящее время вычислительных мощностей различных университетов серьезно недостаточно, и направление, связанное с большими моделями, в настоящее время является горячей темой.Есть много талантов, которые могут обратиться к этой области исследований, например, НЛП. Все таланты НЛП обращаются к большим моделям.

Поэтому мое личное мнение таково, что в течение 1-2 лет нехватка алгоритмических талантов будет значительно уменьшена. Поскольку существует так много алгоритмических талантов с высокими зарплатами, я думаю, что Китай все еще очень ориентирован на рынок с точки зрения распределения талантов.

Элементы компетенций, которыми должны обладать талантливые модели

** Аналитический центр Qubit: Какие качества самих талантов важнее при наборе талантов? **

Фан Хан: Что касается академических достижений, практического опыта, академического образования и осведомленности об инновациях, о которых вы упомянули, нашим приоритетом является практический опыт и осведомленность об инновациях: Прежде всего, Обучение больших моделей — это, по сути, инженерная проблема, поэтому практический опыт определенно очень важен. Во-вторых, большие модели – это инновационные проекты, потому что все крупные модельные компании конкурируют рука об руку, и если не будет чувства инноваций, то будет сложно оставаться впереди других, потому что это совершенно новое инженерное направление.

** Аналитический центр Qubit: Что вы думаете об этом смысле инноваций? **

Фан Хан: Насколько я понимаю, инновация отличается от инновации, определяемой общественностью. Раньше это были скорее алгоритмические инновации. Под инновациями я подразумеваю, прежде всего, стремление идти в ногу с передовым прогрессом в области больших моделей. Во всем мире много людей изучают обучение большим моделям. Это направление развивается очень быстро. Каждый день публикуются сотни новых статей. , внося улучшения в различных направлениях и областях. Второе — уметь использовать новые методы решения возникающих в инженерном деле проблем на основе реальных потребностей.Инновации здесь больше ориентированы на то, как инновационно решать проблемы и улучшать показатели с технической и инженерной точки зрения.

** Аналитический центр Qubit: Считаете ли вы, что об инновационном сознании крупных талантов можно судить по академическим достижениям, патентным достижениям и т. д.? **

Фан Хан: Я думаю, что неразумно судить об инновационном сознании талантов на основе результатов патентов. **OpenAI не уделяет особого внимания эффективности талантов при подаче заявок на патенты. Лучшие инновации фактически основаны на накоплении внутреннего опыта. Неразумно судить только с точки зрения патентов.

Однако ** академические результаты могут использоваться в качестве более важной основы для суждений. **Например, первыми, кто создал модель Vicuna, и первыми, кто создал ControlNet, были аспиранты. С этой точки зрения академические результаты можно использовать в качестве определенного ориентира.

Однако в реальном процессе работы, помимо крупных инноваций в области публикации статей, необходимо достичь бесчисленного множества мелких инженерных инноваций. **Поэтому осведомленность об инновациях по-прежнему следует оценивать по скорости и способности талантов решать практические проблемы.

#### Как развивать таланты крупных моделей

** Аналитический центр Qubit: Когда модель Тяньгун будет обновлена с 1.0 до 3.5, на каких областях талантов будет сосредоточено внимание на разных этапах? **

Фан Хан: На ранних этапах нам действительно нужны таланты в области алгоритмов, которые лучше знакомы с базовой архитектурой больших моделей, CNN и Transformer. Конечно, это также включает в себя таланты в области очистки и обработки данных. когда большие модели постепенно созреют и им нужно будет перейти к мультимодальности, потребуется группа специалистов, занимающихся компьютерным зрением; если большие модели будут выпущены для внешнего мира, потребуются таланты аудита безопасности нужный.

** Аналитический центр Qubit: Как Kunlun Wanwei развивает свои собственные таланты крупных моделей? **

Фан Хан: Куньлунь Ванвэй начал проводить обучение крупным моделям в 2020 году. В то время на рынке было очень мало талантов для создания больших моделей. Было больше людей, выбравших маршрут BERT, и меньше людей, выбравших маршрут GPT. , поэтому мы ** В то время мы решили сами развивать таланты крупных моделей. **

Метод обучения заключается в том, чтобы позволить талантам с опытом работы в области алгоритмов изучить направление обучения моделей.Затем при наборе персонала мы должны рассмотреть возможность выбора талантов, которые знакомы с машинным обучением и глубоким обучением, а также обладают сильной самостоятельностью и быстрой скоростью обучения. Таланты, таланты с опытом работы в области алгоритмов. Изначально у нас были таланты, которые изучали технические направления, такие как CNN, но теперь они больше обратятся к обучению GPT.

** Аналитический центр Qubit: Что вы думаете об этой модели обучения «большая корова ведет теленка»? **

Фан Хань: Каждая технологическая компания на самом деле выберет метод обучения «большие коровы ведут молодых коров», но **отбор талантов важнее, чем их взращивание, а независимое обучение важнее, чем мастера, ведущие учеников, ** Итак, при приеме на работу мы также придаем большое значение способности талантов к самостоятельному обучению.

Для традиционных технических направлений, таких как Java, нужно полагаться на богатый опыт, а молодым выпускникам требуется более длительный период обучения, чтобы вырасти в экспертов в предметной области. Однако обучение больших моделей — это новая область, и накопление в промышленности не намного глубже, чем в научных кругах. **Что у нас есть больше, чем в академических кругах, так это вычислительная мощность. **На самом деле, на уровне алгоритмов мы не так уж и велики. впереди университетов.

**Аналитический центр Qubit: Сколько времени понадобится выпускникам, чтобы стать крупными экспертами по моделированию? **

Фан Хан: Есть большое количество докторантов, которые могут публиковать очень передовые статьи по крупным моделям. Д. студенты. В школе мы находим таланты, которые могут начать работу сразу же, как только приедут, и за несколько месяцев они могут вырасти в экспертов в предметной области.

Наша идея состоит в том, чтобы отобрать лучшие таланты из только что окончивших докторантов, которые продемонстрировали инновационные способности и **техническое видение во время учебы в школе. Мы можем вырастить "теленка" за более короткий период времени. Могут стать тем, что вы называете «большая корова».

** Аналитический центр Qubit: Через несколько месяцев или год такие новые аспиранты могут стать «большими коровами» в этой области. Я понимаю, что «большие коровы», о которых вы говорите, — это те, у кого есть основные возможности для исследований и разработок. **

Фан Хан: Да, мы даем молодым людям много возможностей. На самом деле, вероятно, всего несколько десятков человек проходят обучение GPT в OpenAI, и большая часть из них — талантливые люди, окончившие обучение всего несколько лет назад. Я думаю, что в основном это относится к крупным модельным командам в Китае: это совершенно новая область, и возможности для новичков особенно велики. **Для недавно окончившего докторанта не составляет проблемы стать техническим специалистом в этой области, проработав около полугода, но ему явно не хватает управленческих способностей. **Эта техническая область очень новая, и все бегут вперед по одной и той же стартовой линии. Недавно выпускники не обязательно оказываются в невыгодном положении.

**Аналитический центр Qubit: Большинство упомянутых вами выпускников специализируются на обработке естественного языка? На какие конкретные области оно будет разбито? **

Фан Хан: Это не совсем обработка естественного языка. Я думаю, что на протяжении всей жизненной стадии большой модели, помимо обработки данных, ей необходимо полагаться на инженерные накопления, *предварительные обучение, RLHF, SFT, оптимизация операторов * и другие аспекты, у них есть соответствующие академические направления исследований, поэтому я думаю, что они способны разрабатывать и обучать 70-80% больших моделей.

Талантливым специалистам, изучающим машинное обучение, обучение с подкреплением и глубокое обучение, очень легко переключиться на большие модели. И поскольку сейчас существует множество моделей с открытым исходным кодом, и в академических кругах много людей, выполняющих исследовательские работы на основе моделей с открытым исходным кодом, я не думаю, что существует абсолютный разрыв в разделении труда среди университетских талантов.

#### Развитие внутреннего рынка талантов крупных моделей

** Аналитический центр Qubit: Что вы думаете о текущем общем развитии рынка талантов для крупных моделей? **

Фан Хан: Я думаю, что **крупные модельные таланты в целом находятся в состоянии высокого дефицита, и **будет больше людей, занимающихся биржевой работой. Однако по мере того, как в крупных моделях появляется все больше и больше практиков, разделение труда становится все более детальным. Это естественный процесс дифференциации. Процесс разработки любой новой технологии выглядит следующим образом: от ранних инженеров полного стека до руководителей групп и руководителей уровня директора, дифференциация членов команды по техническому направлению станет более очевидной.

** Аналитический центр Qubit: Большинство талантов, набранных в Куньлунь Ванвэй, приходят из университетов или больше из этой отрасли? **

Фан Хан: В настоящее время нам нужны таланты с практическим накоплением, поэтому мы будем выбирать больше талантов из промышленности, имеющих богатый инженерный опыт. Однако в качестве резерва будут набираться и свежие выпускники, поэтому набор в школы будет больше.Соотношение набора в школы и социального набора составляет почти 1:5.

**Аналитический центр Qubit: Как вы думаете, на каком этапе сейчас находится развитие талантов в этой большой модели? **

Фан Хань: Судя по общему количеству научных достижений талантливых людей, Китай занимает первое место в мире по количеству опубликованных статей по искусственному интеллекту, а США — второе. в Китае.

Я думаю, что с точки зрения элементов способностей и талантов, для крупных моделей нужны таланты с разным опытом, должны быть все три из них, включая недавних выпускников, экспертов в этой области и лидеров. **Но с точки зрения предложения сейчас оно находится на недостаточном этапе. Ситуация с обеспечением значительно улучшится примерно через 3-5 лет, **потому что от постановки предметов до выпуска студентов проходит 5 лет.

Трудности в развитии талантов крупных моделей

** Аналитический центр Qubit: Как вы думаете, в каких аспектах можно улучшить обучение талантов? **

Фан Хан: Я поделюсь этим в основном с двух точек зрения: корпоративной и макроэкономической.

С точки зрения предприятия, таланты будут расти быстрее, если они будут участвовать в инженерных проектах. Это очень очевидный и практичный путь. В крупных компаниях, которые более терпеливы к талантам, их таланты будут более профессиональными в том, что они делают, но в небольших компаниях таланты больших модельных команд будут расти более комплексно, и они должны обладать всеми возможностями полного стека крупных команд. модели.

С макроскопической точки зрения, **по сравнению с другими традиционными отраслями, трудность в развитии талантов крупномасштабного моделирования заключается в нынешней недостаточной вычислительной мощности университетов, что затрудняет в школах подготовку талантов в области архитектуры, а эти таланты могут ездить на предприятия только для обучения. Это дилемма, с которой сталкиваются все университеты по всему миру.

** Аналитический центр Qubit: То есть он больше полагается на взаимодействие промышленности, научных кругов, исследований и политики для развития крупномасштабных талантов. **

Фан Хан: Я думаю, мы должны сделать все возможное, чтобы обеспечить в школах такое же оборудование, как и на предприятиях, иначе то, чему мы учимся в школах, определенно будет относительно ограниченным.

#### Будущие тенденции развития крупных модельных компаний и компаний, занимающихся искусственным интеллектом

** Аналитический центр Qubit: С вашей точки зрения, какова будущая тенденция развития индустрии крупных моделей в целом? **

Фан Хан: Я думаю, что ее следует называть не большой модельной индустрией, а всей индустрией искусственного интеллекта. Возможности, с которыми сталкивается индустрия искусственного интеллекта, должны быть не меньшими, чем возможности Интернета и мобильного Интернета. Я очень оптимистичен в отношении тенденций развития индустрии искусственного интеллекта. Я думаю, что искусственный интеллект глубоко изменит весь Интернет, и вся человеческая жизнь будет сильно затронута и изменена. Я думаю, что вся отрасль претерпит направленные изменения.

** Аналитический центр Qubit: Учитывая эту тенденцию, какие таланты крупных моделей, по вашему мнению, будут более предпочтительными для предприятий? **

Фан Хан: Прежде всего, сформировалась "Битва сотен моделей". Все создают большие базы моделей. В будущем базы больших моделей определенно сократятся до нескольких крупных производителей. и многое другое. Многие компании должны иметь возможность использовать большие модели для приложений, поэтому я думаю, что будет все больше и больше талантов, разрабатывающих приложения на основе больших моделей. **

Таланты, отвечающие за базовое обучение, алгоритмы оптимизации и архитектуру больших моделей, перейдут к крупным производителям или большим модельным группам. на крупных моделях этих предприятий. Когда эти предприятия вырастут, они также начнут создавать свои собственные большие модели.

Мы считаем, что «приложения – это король» означает, что компании, которые разрабатывают новые бизнес-модели на основе искусственного интеллекта и крупных моделей в приложениях, получат наибольшие дивиденды. **Тогда мы считаем, что в ближайшие десять лет обязательно появятся новые компании-гиганты, такие как Byte, Meituan и Didi, и их число должно вырасти от 0 до 100. Такую возможность должны иметь компании, основанные в этом или следующем году. возможность.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить