多くの人が巨大な波を嘆いているとき、熱心な船乗りたちはすでに新大陸を求めて出発しています。最近、Tesla の AI ディレクターであり、つい最近 OpenAI に復帰した AI トップストリーマーである Karpathy 氏は、AI の発展についていくことがフルタイムの仕事になったと考え、Latent Space ポッドキャストの最新エピソードをリツイートしました。そしてその需要は今日の機械学習アルゴリズムエンジニアをはるかに超えるでしょう。今回も引き続き、今後必要とされるAI人材の能力像について、さらに分析していきます。
私たちは、基礎となるモデルの新たな機能とオープンソース/API の可用性によって推進される、世代を超えた応用 AI の「右シフト」を観察しています。研究チームが 5 年をかけて 2013 年に完了した一連の人工知能のタスクは、現在では API ドキュメントと余った午後だけで完了できるようになりました。
API はユニバーサルです。AI エンジニアは左に進んでモデルの最適化/ホストを行うことができ、研究エンジニアは右に進んで API 上にアプリケーションを構築できますが、相対的な強みと技術的基盤は明らかです。
ほとんどの人は依然として AI エンジニアリングを機械学習またはデータ エンジニアリングの一形態として捉えているため、同じ技術スタックを推奨しています。しかし、上記で言及した非常に有能な AI エンジニアの中に、Andrew Ng Coursera コースに相当する仕事をした人は一人もおらず、PyTorch のことも知らず、データ レイクとデータ ウェアハウスの違いもわかっていないことは間違いありません。
**間もなく、フォード モデル T の図面を読んで運転を学ぶようになるのと同じように、『注意が必要なのはすべてです』を読んで AI エンジニアリングを始めようと提案する人は誰もいなくなるでしょう。もちろん、基礎と歴史を理解することは常に役立ち、まだ一般の意識に入っていない革新や効率/能力の向上を見つけるのに非常に役立ちます。しかし、製品を直接使用して、経験を通じて製品の品質を知ることもできます。
確かに、AI エンジニアと ML エンジニアの逆転は一夜にして起こるわけではありません。人々は当然、自分の履歴書を具体化し、市場マップを埋め、より権威のある詳細なトピックを引用して目立ちたいと考えます。とはいえ、迅速なエンジニアリングや AI エンジニアリングは、データ サイエンスや機械学習の確かな背景を持つ人々よりも長い間不利に感じられるでしょう。しかし、最終的には需要と供給の経済が勝利し、AI エンジニアの需要は ML エンジニアの需要をはるかに超えるでしょう。
もちろん、これは人間が書いたコードだけではありません。数多くのプロジェクト (smol-developer、より広範には gpt-engineer、そして Codium AI、Codegen.ai、Morph/Rift などの他のコード生成エージェントの冒険) の物語は、それらが AI の一部となることがますます増えていくことを示唆しています。エンジニアのツールキット。人間のエンジニアが AI の活用を学ぶにつれて、AI はエンジニアリングにますます関与するようになるでしょう。
遠い将来、私たちが見上げると、両者の違いがわからなくなる日が来るでしょう。
参考文献
原文表示
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
_ エンジニアは時代遅れ? AI の大御所が推進する新しいキャリアが誕生
出典: センスAI
センス思考
記事の内容に基づいて、より多様な推論と深い思考を提案するように努めます。交換を歓迎します。
**モデル技術と製品の上陸: **ほとんどの人が巨大な波を嘆いている一方で、熱心な船乗りたちは新大陸を求めて出発しました。羅針盤を発明し船を建造した職人たちが時代を担い、次に船員や労働者が領土を拡大しました。
**ソフトウェア 3.0 時代:**SenseAI は再びエージェント ネットワークを強調します。今度はマシンが私たちのところに来て、自然言語が開発ニーズのほとんどを完了する言語パッケージとなり、人間の想像力をさらに解放します。エージェントはインタラクション密度とネットワークコラボレーションを使用して実行を解決します。人間がしなければならないことは、ボトムレベルの想像力を提案し、破壊し、再構築することです。
この記事は合計 3255 ワードあり、じっくり読むのに約 9 分かかります
01. 新しい仕事: AI エンジニア
私たちは、基礎となるモデルの新たな機能とオープンソース/API の可用性によって推進される、世代を超えた応用 AI の「右シフト」を観察しています。研究チームが 5 年をかけて 2013 年に完了した一連の人工知能のタスクは、現在では API ドキュメントと余った午後だけで完了できるようになりました。
ただし、最も困難な作業は具体的な実装の詳細であり、現時点では、LLM の評価、適用、製品化の成功に関しては、次のような課題がまだあります。
**1. モデル:**最大の GPT-4 および Claude モデルの評価から、最小のオープンソースの Huggingface、LLaMA、およびその他のモデルの評価まで。
2. ツール: LangChain、LlamaIndex、Pinecone などの最も一般的なリンク、取得、ベクトル検索ツールから、Auto-GPT や BabyAGT などの新興分野のプロキシ ツールまで。
3. ニュース: 毎日公開される論文、モデル、技術の数は、注目と資本によって指数関数的に増加しており、これらすべての最先端の開発を嗅ぎ続けることがほぼフルタイムの仕事になっているほどです。 。
LLM はフルタイムの仕事を作成します。 **ソフトウェア エンジニアリングは、「サイト信頼性エンジニア」、「開発運用保守エンジニア」、「データ エンジニア」、新進気鋭の「分析エンジニア」。
**AI エンジニアは、この種の役割を担うようになるでしょう。 **
ほぼすべてのスタートアップには、何らかの形式の AI ディスカッション グループがあります。 Amplitude、Replit、Notion がすでに行っているように、これらのグループは非公式のグループから正式なチームに移行します。 AI API や OSS モデルの製品化に取り組む何千人ものソフトウェア エンジニアは、勤務中であろうと夜間や週末であろうと、企業の Slack やスタンドアロンの Discord を使用して専門化され、AI エンジニアという 1 つの肩書きの下に集められます。これは、今後 10 年間で最も需要の高いエンジニアリングの仕事となる可能性があります。
Microsoft や Google などの大手企業から、Figma (Diagram が買収)、Vercel (RoomGPT による Hassan El Mghari)、Notion (Notion AI による Ivan Zhao と Simon Last) などの最先端のスタートアップ、そして Simon Willison のような独立系ハッカーまで、 Pieter Levels (写真/InteriorAI)、Riley Goodside (現在は Scale AI)。彼らは、Anthropic でヒント エンジニアリングを行って年間 30 万ドルを稼ぎ、OpenAI でソフトウェアを構築することで 90 万ドルを稼いでいます。彼らは自由な週末を AGI House でアイデアに取り組み、/r/LocalLLaMA2 でヒントを共有して過ごします。これらすべてに共通しているのは、人工知能の進歩を、ほぼ一夜にして数百万人が使用する実際の製品に変えているということです。
**博士号を持っている人はいません。 AI 製品をリリースするには、研究者ではなくエンジニアが必要です。 **
02、AI エンジニアが ML エンジニアに取って代わります
AIエンジニアの需要は今後急速に高まるでしょう。現在、Indeed では ML エンジニアの雇用機会は AI エンジニアの 10 倍ですが、AI の成長率が高いため、この比率は 5 年以内に逆転すると考えられています。
どの役職も一方的なものですが、役立つものもあります。私たちは、AI と ML の間の終わりのない意味論的な議論に警戒し、うんざりしていますが、従来の「ソフトウェア エンジニア」の役割が AI ソフトウェアを構築できることを十分に認識しています。しかし、AI エンジニアリングに参入する方法についての Ask HN の最近の質問から、市場にまだ存在する基本的な認識が明らかになりました。
ほとんどの人は依然として AI エンジニアリングを機械学習またはデータ エンジニアリングの一形態として捉えているため、同じ技術スタックを推奨しています。しかし、上記で言及した非常に有能な AI エンジニアの中に、Andrew Ng Coursera コースに相当する仕事をした人は一人もおらず、PyTorch のことも知らず、データ レイクとデータ ウェアハウスの違いもわかっていないことは間違いありません。
**間もなく、フォード モデル T の図面を読んで運転を学ぶようになるのと同じように、『注意が必要なのはすべてです』を読んで AI エンジニアリングを始めようと提案する人は誰もいなくなるでしょう。もちろん、基礎と歴史を理解することは常に役立ち、まだ一般の意識に入っていない革新や効率/能力の向上を見つけるのに非常に役立ちます。しかし、製品を直接使用して、経験を通じて製品の品質を知ることもできます。
確かに、AI エンジニアと ML エンジニアの逆転は一夜にして起こるわけではありません。人々は当然、自分の履歴書を具体化し、市場マップを埋め、より権威のある詳細なトピックを引用して目立ちたいと考えます。とはいえ、迅速なエンジニアリングや AI エンジニアリングは、データ サイエンスや機械学習の確かな背景を持つ人々よりも長い間不利に感じられるでしょう。しかし、最終的には需要と供給の経済が勝利し、AI エンジニアの需要は ML エンジニアの需要をはるかに超えるでしょう。
**03. なぜ今? **
基本モデルは「少数ショット学習器」であり、コンテキスト内でゼロショット転送さえも学習する能力を示します。これは、モデル トレーナーの本来の意図を超えています。言い換えれば、これらのモデルを作成した人は、そのモデルに何ができるのかを完全には理解していませんでした。 LLM 研究者ではない人でも、より多くの時間をかけてモデルを操作し、それを過小評価されている研究分野 (コピーライティングへの Jasper の応用など) に適用するだけで、これらの機能を発見して活用できます。
Microsoft、Google、Meta、および大規模な基礎モデル研究所は、希少な研究人材を独占し、本質的に「サービスとしての AI 研究」API を提供しています。彼らを雇用することはできませんが、彼らと協力する方法を知っているソフトウェア エンジニアがチームにいる場合は、レンタルすることはできます。 **世界中に約 5,000 人の LLM 研究者がいますが、約 5,000 万人のソフトウェア エンジニアがいます。供給の制約により、市場の需要を満たす「ハブ」AI エンジニアが出現することが決まります。 **
**3. GPU リザーブ。 **もちろん、この取り組みを最初に行ったのは OpenAI/Microsoft ですが、Stability AI は 4000 GPU クラスターを強調することで、スタートアップ企業間の GPU 軍拡競争を引き起こしました。
**4 製品から直接アジャイルアクション。 **ドメイン固有のモデルをトレーニングして実稼働環境に導入する前に、データ サイエンティストや ML エンジニアに大量のデータ収集作業を要求する代わりに、プロダクト マネージャーやソフトウェア エンジニアは、最初に LLM に指示を出し、製品アイデアを構築/検証してから、次に、微調整用の特定のデータを取得します。
**5. Python → Java。 **データ/AI は伝統的に Python に大きく依存しており、LangChain、LlamaIndex、Guardrails などの最初の AI エンジニアリング ツールも同じコミュニティから生まれました。しかし、現在では Python 開発者と同じくらい多くの Java 開発者が存在するため、LangChain.js や Transformers.js から Vercel の新しい AI SDK に至るまで、この拡大したユーザー ベースに対応するツールがますます増えています。市場拡大のチャンスは非常に大きいです。
**6. 生成 AI と分類子 ML。 ** 「生成 AI」という用語は時代遅れになり、「推論エンジン」などの他のカテゴリに取って代わられていますが、既存の MLOps ツールと機械学習実践者の違いと、LLM の使用に最適なものを簡潔に説明しています。テキストから画像へのジェネレーターの新しくて明確な役割を検討する場合には、依然として非常に役立ちます。既存の機械学習の研究は、不正リスク、レコメンダー システム、異常検出、特徴ストレージなどに焦点を当てている可能性がありますが、AI エンジニアは、ライティング アプリ、パーソナライズされた学習ツール、自然言語スプレッドシート、および Factorio のようなビジュアル プログラミング言語を構築しています。
まったく異なる背景を持ち、異なる言語を話し、まったく異なる製品を生産し、まったく異なるツールを使用するサブグループがある場合、最終的には別々のグループに分かれます。
04、1+2=3: ソフトウェア 3.0 時代のプログラミング
6 年前、Andrej Karpathy 氏は、ロジックを正確にモデル化する従来の手書きプログラミング言語の「古典的なスタック」と、ロジックを近似する新しい「機械学習」ニューラル ネットワークを対比して、ソフトウェア 2.0 について説明する非常に影響力のある記事を書きました。人間がモデル化できるよりも多くの問題をソフトウェアが解決できるようになります。今年、彼はフォローアップ記事で 最も注目されている新しいプログラミング言語は英語 であると指摘し、元の記事でマークしなかった灰色の領域をついに埋めました。
しかし、2023 年の最大のテーマの 1 つは、2 億ドルを超える Langchain から Nvidia 支援の Voyager まで、LLM 機能の調整と置き換えにおける人間が作成したコードの役割を再確立することであり、コードの生成と再利用の重要性が明らかに示されています。 。エンジニアリングは過大評価され、今後も定着しますが、ソフトウェア 3.0 アプリケーションにおけるソフトウェア 1.0 パラダイムの再出現は、大きなチャンスであると同時に混乱の領域でもあり、多くのスタートアップにとってホワイトスペースが生じています。
もちろん、これは人間が書いたコードだけではありません。数多くのプロジェクト (smol-developer、より広範には gpt-engineer、そして Codium AI、Codegen.ai、Morph/Rift などの他のコード生成エージェントの冒険) の物語は、それらが AI の一部となることがますます増えていくことを示唆しています。エンジニアのツールキット。人間のエンジニアが AI の活用を学ぶにつれて、AI はエンジニアリングにますます関与するようになるでしょう。
遠い将来、私たちが見上げると、両者の違いがわからなくなる日が来るでしょう。
参考文献