サム・アルトマンは、20歳以下の2人の小さな起業家に投資しました

出典: Silicon Rabbit Race

画像ソース: Unbounded AIによって生成

サム・アルトマンが再び攻撃。 今回は、わずか5人のRPAアーリーステージチームであるInduced AIに投資し、2人の共同創業者であるAryan Sharma氏とAyush Pathak氏(1人は18人、もう1人は19人)を擁しました。

Sam Altman氏だけでなく、SignalFire、Peak XV、SV Angelなども、Induced AIの230万ドルのシードラウンドの資金調達に参加した。 技術アクセラレーターのAI Grantの創設者であるNat Friedman氏とDaniel Gross氏も、Induced AIチームに加わった。 この2人はテクノロジーの世界でよく知られており、NatはGithubのCEOであり、Danielが設立した検索エンジン会社であるCueはAppleに買収されました。

このチームとその製品の何がそんなに特別なのか、そしてなぜそれが多くの大物のオリーブの枝を惹きつけることができるのか?

01 RPA 3.0: ブラウザを開いてAIにすべての作業を任せる

Induced AI の創設者である Aryan と Ayush の 2 人は、若い年齢にもかかわらず、起業経験が豊富です。 2人の若いプログラマーは、ヘルスケア、広告、教育、ブロックチェーン、Web3などの分野で起業家としての経歴を持ち、起業家コミュニティやインキュベーターのような組織を立ち上げたこともあります。

誘導AIは、企業の従業員の生産性を解き放つ「RPA3.0」です。 ユーザーはワークフローや画面録画を簡単な英語で入力するだけで、誘導AIはそれらをリアルタイムで擬似コードに変換し、さまざまな関連ツールを呼び出して多数の反復タスクを実行できます。

2人の創業者|出典:Linkedln

RPA(ロボティック・プロセス・オートメーション)は新しい概念ではなく、エクセルの「マクロ」や、多くの人がコンサートのチケットを掴むために使うガジェット「キーウィザード」など、RPAの前身とも言える、庶民の日常生活のいたるところに見られます。 従来のRPAの定義では、マウスのクリック、キーボード入力、フォルダを開く、メールを送信するなどの人間の操作をソフトウェアが記録し、これらの操作を修正してルールやルーチンを形成し、バッチで自動的に実行されるため、人々の時間を節約し、作業効率を向上させます。 AI技術の進歩により、機械の画像認識能力、言語理解能力、論理的思考能力は継続的に向上しており、これらの技術もRPAと組み合わせることで、より大きなエネルギーを放出しています。

これまで市場に出回っているRPAツールでは、RPAという概念が示すように、明確なルールを手作業で作成する必要があり、複雑な業務のルールは手間がかかります。 誘導AIは、大規模言語モデルの力を利用して、論理的に推論し、判断を下す能力をツールに与えます。 ユーザーは「Jiraのチケットを作成してください」や「履歴書の波をふるいにかけ、候補者に面接の招待状を送るのを手伝ってください」など、必要なことを言うだけで、誘導AIがリアルタイムで判断し、何をすべきかを分解し、関連するツールを自動的に呼び出してプロセス全体を完了することができます。

履歴書のスクリーニングのタスクを例にとると、通常の手動操作プロセスには、LinkedInアカウントへのログイン、履歴書の検索、履歴書の評価、履歴書のダウンロード、招待状の送信などが含まれます。 LinkedInが公式APIを提供していない場合、これまでのRPAはログインステップで立ち往生する可能性が高く、悪質なボットと判断される可能性さえあります。 誘導AIは、Chromium上に独自のメモリ、ファイルシステム、認証資格情報(電子メール、電話番号)を備えたブラウザ環境を構築して複雑なプロセスを実行するため、ログイン、キャプチャの入力、ファイルのダウンロード、データの保存と再利用などのアクションを自動化でき、オープンAPIのないソフトウェアでは誘導AIを停止できません。

02 AIエージェントの波がやってくる

道具、特に知的な道具を人間のために働かせることは、私たちの祖先からの夢です。 Wooden OxからSiriまで、人々は常にこれらの「アシスタント」がまだ少し不足していると感じてきました。 ChatGPTやAutoGPTが登場するまでは、AIエージェントが可能になるところだったようです。

OpenAIの研究者であるLilian Weng氏は、大規模言語モデル、メモリ、タスク計画、ツールの使用など、大規模言語モデルに基づいてAIエージェントを定義する記事を書いています。 誘導AIチームは自らを「RPA3.0」と位置付けていますが、その製品機能に関しては、AIエージェントに近いため、サム・アルトマン氏のようなAIの大物は、この若いチームについて満場一致で楽観的です。

現在のAIブームにおいて、Induced AIは最初でも最後でもないAIエージェントチームです。

チケットやテイクアウトを注文する小さくて美しいエージェントや、AutoGPTやHuggingGPTなどの有名なプロジェクトは言うまでもなく、Induced AIと同じAI従業員を育成するという野心を持っているチームはたくさんあります。

例えば、今年3月に3億5,000万ドルのシリーズB資金調達ラウンドを完了したAdeptは、コンピュータ上でアクションを実行するように設計されたACT-1モデルをトレーニングしました。 既存のすべてのソフトウェアツール、API、およびWebサイトを使用できます。 ACT-1はブラウザベースでも動作し、ユーザーはSalesforceでリードを作成したり、GoogleSheetでデータを計算したりするなど、AIとのチャットボックスに独自のコマンドを入力できます。

アデプトのACT-1 |

偶然にも、テクノロジー企業であるRabbitは、独自の大型モデルLAM(Large Action Model)を開発し、それに基づく「パーソナルオペレーティングシステムRabbit OS」ソリューションの完全なセットを立ち上げました。 LAMは、人間とコンピュータの相互作用のインターフェースを観察し、ユーザーの自然言語による指示が不明瞭な場合に、根底にある人間の意図を理解して実装するための「概念的な青写真」を形成することができます。 LAMに基づいて、Rabbitは、エージェントがよりユーザーフレンドリーな方法でタスクを完了できるように、一連のソフトウェアプラットフォームを特別に設計しました。 今年10月、RabbitはKhosla Venturesが主導し、既存株主がそれに続き、2000万ドルの資金を調達した。

**03 未来はもうここにあるのか? **

もちろん、起業家チームに加えて、従来のRPA、ローコード、ノーコード、その他の企業のほとんどが、大規模言語モデルとAIエージェントを採用しています。

今年の初めから、AI Agent のいくつかの人気のあるアプリケーションと、何度か輪から外れたことで、人工知能への要求が何度も最高潮に達しました。 しかし、未来はすでにここにあるのでしょうか? 目の前のワクワク感は変化なのか、それともバブルなのか。

自動運転を例えると、私たちがよく知っているCopilotやMidjourneyのような製品は、L3自動運転に似ており、機械は人間の「アシスタント」と「副操縦士」であり、エージェントは自動運転のL4レベルに対応し、人間は目標を設定し、結果を監督するだけでよく、機械は自分で意思決定と実行を完了します。 現在、L3レベルのAI副操縦士はまだ適用の初期段階にあり、技術力や商品価値の面でまだ検討すべき課題が多く、十分に推進されていません。

この観点から見ると、L4 AIエージェントの大規模な適用はさらに遠いかもしれません。 では、現在のAIブームは、ネギを切る誇大広告の別の波なのでしょうか? それは、数年前のブロックチェーン、VR、メタバースのように、一瞬の出来事に過ぎないのでしょうか?

確かに、ジェネレーティブAIや関連概念の人気は衰えつつある。 **

メディアの注目と市場の反応の両方が、暗黙のうちにこれを裏付けています。 ガートナー社が今年発表したテクノロジーの成熟度曲線では、ジェネレーティブAIとAIを活用したソフトウェアエンジニアリングはどちらも肥大化期にあり、自動運転や前述の過去のテクノロジーコンセプトと同様に、今後2〜5年でどちらのテクノロジーも幻滅の時期を迎えようとしています。 しかし、熱が衰え、騒音が静かになる幻滅の時期にこそ、より有意義な経験と知識が沈殿し、次の悟りの期間の基礎が築かれます。

革新的なテクノロジーの進化においては、すべての山と谷が重要です。

チューリングマシンからIBMのスーパーコンピューターDeep Blueまで、機械学習からニューラルネットワークまで、AlphaGoからChatGPTまで、すべてのマイルストーンは失望、疑い、そして地平線を広げる寒い冬に満ちており、人類は今日の場所にたどり着くまでに長い道のりを歩んできました。 バブルがあろうとなかろうと、未来は常に楽観主義者と実行者によって創造されます。

リソース:

  1. Sam Altman、ブラウザネイティブのワークフローを自動化する10代のAIスタートアップを支援(TechCrunch)
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)