大型モデルの人材は希少性が高く、「育成」よりも「選抜」が重要|崑崙万偉さんとの会話

出典: 量子ビット

最近、「数百機種の戦い」が激化しています。大型モデルのブームの中で、大手テクノロジー企業、起業家チーム、研究機関の間で「人材」が熾烈な競争の焦点となっている。しかし、AIGC分野における最先端の人材には依然として大きなギャップがあります。

モデル開発を促進するには、どのようなタイプの人材を採用する必要がありますか?

大物モデルのタレントをどこで募集するか?

大型モデルの研究開発人材を育成するにはどうすればよいでしょうか?

上記の質問に答えるために、Qubit Think Tank は、AI 大規模モデルの分野の実践者、専門家、学者を特別に招待し、大規模モデルの人材の機会と課題将来の開発見通しを企業チームと共有します。そして求職者も。

本記事はQubit Think Tankの「大型モデル人材」シリーズの徹底インタビューコラムです、詳しくは近日公開予定の「2023 AIGC大型モデル人材育成パノラマレポート」にご注目ください

インタビューキャラクター紹介

中国 Linux の創設者の 1 人である Kunlun Wanwei の会長兼 CEO である Fang Han 氏は、初の国産 P2P ダウンロード ソフトウェア DUDU アクセラレータの開発を主導しました。

** **###### Fang Han、Kunlun Wanwei 会長兼 CEO

2008 年に Kunlun Wanwei に入社し、「Three Kingdoms」および RPG Web ゲーム「Martial Arts」の開発を主導し、多くの賞を受賞しました。

素晴らしい景色

  • 1 ~ 2 年以内に、アルゴリズムの人材不足は大幅に緩和されるでしょう。 ※私が理解している人材イノベーション意識とは、技術的・工学的観点から革新的に問題を解決し、指標を改善する方法を指します。 ※「育成」より「選択」が大切、師匠が弟子を導くよりも自主学習が大切。 ※大型モデルなどの新しい分野では、新卒博士課程の学生でも半年間の研修を経てドメインエキスパートになれます。 ※供給の観点から見ると、現在大型モデルタレントは不足段階にありますが、3~5年以内に状況は大幅に緩和されると思われます。 ※マクロ的に見ると、従来型産業と比較して、大規模なモデル人材の育成が難しいのは、現状では大学の計算能力が不足しているためである。
  • AI と大規模モデルに基づいてアプリケーション レベルで新しいビジネス モデルを作成する企業が最大の利益を得るでしょう。

インタビュー記録

**大規模なモデルタレントを定義するには? **

**Qubit シンクタンク: Kunlun Wanwei は大規模なモデルの人材をどのように分けていますか? **

Fang Han: モデルのトレーニングは、トレーニング推論アプリケーション開発という 2 つの主要な部分に分けられるべきだと思います。モデルのトレーニング プロセスに応じて、人材をアルゴリズム側の人材、アーキテクチャ側の人材、アプリケーション開発側の人材に分類し、コア アルゴリズム 人材はさらに事前トレーニング、データ処理、推論最適化の微調整などに細分化されます。

**Qubit Think Tank: アルゴリズムの人材、アーキテクチャの人材、アプリケーション開発の人材の中で、どのタイプの人材が最も不足していると思いますか?そして今後もしばらくは品薄になる可能性が高いです。 **

ファン・ハン: 現在、最も不足している人材は間違いなくコアアルゴリズムの人材ですが、需要と供給の状況はすぐに緩和されるでしょう。なぜなら、ここには非常に興味深い現象があるからです。現在、各大学の計算能力は深刻に不足しており、大規模モデルに関連する方向性が現在話題になっています。NLPなどのこの研究分野に転向できる人材はたくさんいます。 . すべての NLP タレントがビッグ モデルに注目しています。

したがって、私の個人的な意見は、アルゴリズム人材の不足は 1 ~ 2 年以内に大幅に緩和されるだろうということであり、高給与のアルゴリズム人材が非常に多いため、中国は人材の配分に関しては依然として非常に市場志向であると考えています。

大型モデルタレントが持つべきコンピテンシー要素

**Qubit Think Tank: 人材を採用する際、人材自体のどの資質がより重要ですか? **

Fang Han: あなたがおっしゃった学業成績、実務経験、学歴、イノベーションへの意識に関して、私たちの優先事項は実務経験イノベーションへの意識です。 : まず第一に、大規模モデルのトレーニングは本質的にエンジニアリングの問題であるため、実践的な経験は間違いなく非常に重要です。第二に、大型モデルは革新的なプロジェクトです。なぜなら、すべての大手モデル会社が手を携えて競争しているからです。これは全く新しいエンジニアリングの方向性であるため、イノベーションの感覚がなければ、他社の先を行くことは困難です。

**Qubit シンクタンク: この革新性についてどう思いますか? **

ファン・ハン: 私が理解しているイノベーションは、一般に定義されているイノベーションとは異なります。以前は、よりアルゴリズム的なイノベーションでした。私がイノベーションという意味で言っているのは、まず第一に、大規模モデルの最先端の進歩に追いつくことです。世界中で大規模モデルのトレーニングを研究している人がたくさんいます。この方向性は非常に急速に進んでいます。毎日何百もの新しい論文が出版されています。 、さまざまな方向と分野で改善を行っています。 2 つ目は、新しい手法を使用して実際のニーズに基づいてエンジニアリングで遭遇する問題を解決できるようになることです。ここでのイノベーションは、技術的およびエンジニアリングの観点から問題を革新的に解決し、指標を改善する方法に重点を置いています

**Qubit シンクタンク: 大規模な人材の革新的な意識は、学術業績や特許業績などによって判断できると思いますか? **

ファン・ハン: 特許の実績に基づいて人材のイノベーション意識を判断するのは不合理だと思います。 **OpenAIは、特許出願において人材のパフォーマンスをあまり重視していません。実際、最高のイノベーションは社内の経験の蓄積に依存しており、特許の観点だけで判断するのは無理があります。

ただし、** 学業成績は、より重要な判断材料として使用できます。 **例えば、ビクーニャモデルを最初に作った人も、ControlNetを最初に作った人も博士課程の学生だったという点で、学術的な成果は一定の参考になると言えます。

しかし、実際の業務プロセスでは、論文発表という大きなイノベーションだけでなく、エンジニアリング上の小さなイノベーションも無数にあります。 **したがって、イノベーションへの意識は依然として、実際に問題を解決する人材のスピードと実行能力に基づいて判断される必要があります。

#### 大型モデルタレントの育成方法

**Qubit シンクタンク: Tiangong モデルが 1.0 から 3.5 にアップグレードされるとき、さまざまな段階でどの分野の人材に焦点が当てられますか? **

Fang Han: 初期段階では、大規模モデル、CNN、Transformer の基礎となるアーキテクチャに精通したアルゴリズムの人材が本当に必要です。もちろん、これにはデータ クリーニングやデータ処理も含まれます。データ サイエンスの人材。大規模なモデルが徐々に成熟し、マルチモダリティに移行する必要がある場合、コンピュータ ビジョンを行う人材のグループが必要になります。大規模なモデルが外部に公開される場合は、セキュリティ監査の人材が必要になります。必要です。

**Qubit シンクタンク: Kunlun Wanwei は自社の大規模なモデルの人材をどのように育成していますか? **

Fang Han: Kunlun Wanwei は 2020 年に大規模モデルのトレーニングを開始しました。当時、市場には大規模モデルを担当できる人材がほとんどいませんでした。BERT ルートを取る人が増え、GPT ルートを取る人は減りました。 , そこで私たちは** 当時、私たちは大型モデルのタレントを自分たちで育成することを選択しました。 **

育成方法としては、アルゴリズムのバックグラウンドを持った人材にモデルトレーニングの方向性を学んでもらい、採用の際には機械学習やディープラーニングに精通し、自走力が強く学習速度が速い人材を選抜することを考慮する必要があります。タレント、アルゴリズムのバックグラウンドを持つタレント: もともと CNN などの技術的な方向性を勉強しているタレントが何人かいましたが、今後は GPT トレーニングに重点を置く予定です。

**Qubit シンクタンク: 「大きな牛が子牛を導く」というこのトレーニング モデルについてどう思いますか? **

Fang Han: テクノロジー主導の企業は実際、「大きな牛が若い牛を率いる」という訓練方法を選択するでしょう。しかし、**才能を育てるよりも人材を選ぶことが重要であり、マスターが見習いを率いるよりも自主的に学習することが重要です。 ** 採用にあたっては、人材の自主学習能力も重視しています。

Java などの従来の技術的な方向性の場合、豊富な経験に頼る必要があり、新卒者がドメインの専門家に成長するにはより長いトレーニング期間が必要です。ただし、大規模モデルのトレーニングは新興分野であり、産業界での蓄積は学術界ほど深いわけではありません。**私たちが学術界よりも優れているのは計算能力です。**実際、アルゴリズム レベルでは、私たちはそれほど多くはありません。大学より先に。

**Qubit シンクタンク: 新卒者が大規模なモデルの専門家に成長するまでにどれくらい時間がかかりますか? **

方漢: 博士課程の学生には、非常に最先端の大規模論文を発表できる人がたくさんいますし、博士課程 2 年目、3 年目でも革新的な大規模論文が多く出版されていることがわかります。 D. 生徒たち。私たちは、入学後すぐに仕事を始められ、数か月で専門分野の専門家に成長できる才能のある人材を学校で見つけます。

私たちは、在学中から革新的な能力と**技術的ビジョンを発揮した新卒博士課程学生の中から優秀な人材を選抜することで、より短期間で「子牛」を育成します。 「大きな牛」。

**Qubit Think Tank: このような新鮮な博士課程の学生は、数カ月から 1 年後には、この分野の「大きな牛」になる可能性があります。あなたの言う「大きな牛」とは、中核となる研究開発能力を備えた人材だと理解しています。 **

ファン・ハン: はい、私たちは若者に多くの機会を与えています。実際、OpenAI で GPT トレーニングを行っている人はおそらく数十人しかおらず、その多くは数年前に卒業したばかりの人材です。これは基本的に中国の大規模モデルチームに当てはまると思いますが、これはまったく新しい分野であり、新規参入者にとっては特に大きなチャンスです。 **新卒博士課程の学生が半年程度働いてその分野の技術者になるのは問題ないが、マネジメント能力が決定的に不足している。 **この技術分野は非常に新しい分野であり、全員が同じスタートラインで走り続けており、新卒者が必ずしも不利なわけではありません。

**Qubit シンクタンク: あなたが言及した新卒者のほとんどは自然言語処理を専攻していますか?具体的にはどのような分野に分類されるのでしょうか? **

Fang Han: それは正確には 自然言語処理ではありません。大規模モデルのライフステージ全体において、データ処理に加えて、*事前段階でのエンジニアリングの蓄積に依存する必要があると思います。トレーニング、RLHF、SFT、オペレーター最適化 * など、対応する学術研究の方向性を持っているため、大規模モデルの 70 ~ 80% を開発およびトレーニングできる能力があると思います。

機械学習、強化学習、深層学習を研究している人材は、大規模なモデルに切り替えるのが非常に簡単です。そして、現在は多くのオープンソース モデルがあり、学界にはオープンソース モデルに基づいて研究論文を執筆している人がたくさんいるため、大学の人材間の分業に絶対的な格差があるとは思えません。

#### 国内大型モデルタレント市場の発展

**Qubit シンクタンク: 現在の大規模なモデル人材市場の全体的な発展についてどう思いますか? **

ファン・ハン: **大型モデルのタレントは全体的に希少性が高い状態にあり、**ストックの仕事をする人が増えると思います。しかし、大型モデルでは実践者が増えれば増えるほど分業が細かくなり、これは当然の差別化プロセスです。新しいテクノロジーの開発プロセスはこのようなもので、初期のフルスタック エンジニアからチーム リーダー、ディレクター レベルのリーダーに至るまで、チーム メンバーの技術的な方向性の差別化がより明確になります。

**Qubit シンクタンク: Kunlun Wanwei が採用した人材のほとんどは大学出身ですか、それともこの業界からの出身者が多いですか? **

Fang Han: 現在、実践的な蓄積のある人材を必要としているため、業界から豊富なエンジニアリング経験を持つ人材をさらに選出する予定です。ただし、新卒者も予備採用となるため学校採用が多くなり、学校採用と社会採用の比率はほぼ1:5となっています。

**Qubit シンクタンク: この大規模モデルの人材育成は現在どの段階にあると思いますか? **

ファン・ハン: 人材の学業成績全体から判断すると、AI論文の発表数は世界第1位は中国、第2位はアメリカで、論文数はアメリカの方が多いです。中国で。

人材の能力要素としては、大手モデルにはさまざまな経験を積んだ人材が必要であり、新卒、現場の専門家、リーダーの3つが揃っていなければならないと考えています。 **ただし、供給面で見ると、現時点では供給不足の段階にあり、**科目設置から卒業までに5年かかるため、供給状況は3~5年程度で大幅に緩和されると考えられます。

大物モデルの人材育成の難しさ

**Qubit シンクタンク: 人材育成はどのような点で改善できると思いますか? **

ファン・ハン:主に企業の視点とマクロの視点の2つの視点からお話しします。

企業の観点から見ると人材がエンジニアリング プロジェクトに参加すると、より早く成長します。これは非常に明白で実践的な方法です。人材に対してより忍耐強い大企業の場合、その人材はその仕事においてよりプロフェッショナルになりますが、中小企業では、大規模なモデル チームの人材がより包括的に成長し、大企業のフルスタックのすべての能力を備えている必要があります。モデル。

巨視的な視点で見ると、**他の伝統産業と比較して、大規模なモデル人材の育成が難しいのは、現状では大学の計算能力が不十分であるため、学校が建築人材を育成することが困難であり、これらの人材が研修のためにのみ企業に行くことができます。これは世界中のすべての大学が直面しているジレンマですが、国家レベルのコンピューティング能力が大学で共有されれば、この状況は緩和されると私たちは考えています。

**Qubit シンクタンク: つまり、大規模な人材を育成するために、産学、研究、政策の連携にさらに依存しています。 **

Fang Han: 学校でも企業と同じハードウェア条件を提供できるように最善を尽くすべきだと思います。そうしないと、学校で学ぶ内容は間違いなく比較的限られたものになってしまいます。

#### 大手モデルタレントとAI企業の今後の発展動向

**Qubit Think Tank: あなたの観点から、大型モデル業界全体の将来の発展傾向は何ですか? **

ファン・ハン: ビッグモデル業界というよりも、AI 業界全体と呼ぶべきだと思いますが、AI 業界が遭遇するチャンスはインターネットやモバイル インターネットに劣らないはずです。私は AI 業界の発展傾向について非常に楽観的であり、AI はインターネット全体を大きく変え、人間の生活全体に大きな影響を与え、変化させると考えており、業界全体の方向性が変化すると考えています。

**Qubit Think Tank: この傾向に基づいて、どのような大規模なモデルの人材が企業からより好まれると思いますか? **

ファン・ハン: まず第一に、**「数百モデルの戦い」**が形成されました。皆が大規模なモデルベースを作っています。将来的には、大規模なモデルベースは間違いなく少数の大手メーカーに縮小されるでしょう。 , など 多くの企業はアプリケーションに大規模なモデルを使用する立場にあるはずです。そのため、大規模なモデルに基づいてアプリケーションを開発する人材は今後ますます増えると思います。 **

大規模モデルの基礎となるトレーニング、最適化アルゴリズム、アーキテクチャを担当する人材は、大手メーカーや大規模モデル チームに移ることになりますが、最大の巨人は必ずしも大規模モデル企業そのものではなく、強力なアプリケーション ベースを作成する企業であると私たちは考えています。大型モデルのこれらの企業。これらの企業が成長すると、独自の大規模モデルも構築するでしょう。

私たちは、「アプリケーションは王様」とは、AI やアプリケーションの大規模モデルに基づいて新しいビジネス モデルを開発する企業が最大の利益を得ることができることを意味すると考えています。 **そして、今後10年以内にByte、Meituan、Didiのような新たな巨大企業が必ず出現し、それらは0から100まで成長しなければならないと考えており、今年または来年設立された企業にはその可能性があるはずです。機会。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
  • ピン
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)