a16z が OpenAI CTO に語る: AI テクノロジーは将来のイノベーションをどのように推進するのでしょうか?

セント・ポールによって書かれた

OpenAIが2022年末にChatGPTをリリースして以来、人工知能分野に対する投資分野の理解は深まり続けている。人工知能産業チェーンは、コア技術プロバイダー、人工知能システム、人工知能ユーザーに大別できます。世界の投資家の一般的な認識から判断すると、30 年前のコンピューターや 20 年前のインターネットと同様に、人工知能が将来長期にわたって投資対象となる可能性が高いことは、今や誰もが認識しています。そして将来的には、アプリケーションはすでに現実のものとなっています。

細分化された分野への投資を理解するには、常に業界の投資家から学ぶ必要があります。著名なベンチャーキャピタリスト A16Z は、人工知能の分野で大きな賭けを続けています。最近、彼らは OpenAI の CTO である Mira Murati と会話しました。彼女は、ChatGPT の背後にあるストーリーと、人工知能と人間とコンピューターのインタラクションの未来について語りました。

# まとめ

※ ChatGPT は、強化学習に人間のフィードバックを使用する安全な人工知能システムを作成する方法を考えることから始まりました。

  • OpenAI は、人々がデジタル情報と対話する方法を再定義し、パートナーのようなアシスタントとなり、人工知能システムの一貫性とセキュリティを継続的に強化しています。製品化の状況を通じて、実際のユーザーからフィードバックを得るのは、単に研究室に座っているだけではありません。 ※ChatGPTはテキストをベースに画像や動画などを追加しています。これにより、モデルは、私たちが世界を理解し観察する方法と同様に、私たちの周囲の世界のより完全な全体像を提供できるようになります。
  • 将来的に世界を支配する単一のモデルは存在しませんが、人々は最終的には自分のニーズに最も適したツールを探すようになるためです。

#ミラ・ムラティの背景

ミラは共産主義が終わった直後のアルバニアで生まれました。当時のアルバニアは現在の北朝鮮によく似ていました。絶え間ない変化と不確実性の時代において、教育はすべての鍵を握っています。さらに、当時は本以外に娯楽はほとんどありませんでした。当時、ミラは本の中に答えを探していました。ミラは、安定していて深く研究できる科学の真実を好みます。そして、歴史は常に変化しているため、歴史や社会学などの人文科学の科目の出典には疑問があります。そのため、ミラは科学と数学に対する直感的かつ自然な傾向を持って育ちました。基本的に、ミラは今も Open AI で数学に従事しています。

優れた学業成績により、ミラは奨学金を受け取り、カナダで高校最後の 2 年間を修了しました。

ミラは、知識を現実世界の問題に適用する最良の方法であると信じていたため、大学で機械工学を学びました。当時、ミラは持続可能な交通手段と持続可能なエネルギーを世界にもたらす方法に非常に興味を持っていました。当時の彼女の卒業プロジェクトは、スーパーキャパシタを使用したハイブリッド レースカーを構築することでした。

その後すぐに、ミラはテスラに入社し、モデル S デュアルモーターの開発に参加しました。彼女は Model X の初期設計から協力し、最終的にはプロジェクト全体の立ち上げを主導しました。

テスラで働いていたこともあり、ミラは人工知能の応用、特に自動運転に強い興味を持ちました。 AI とコンピューター ビジョンを使用して旅行に革命を起こすことができるからです。彼女は人工知能のさまざまな応用についてさらに考え始めました。そこでミラは、AI とそれが世界にもたらす可能性のある変化にますます興味を持つようになりました。

具体的には、AI が人間とコンピューターの相互作用にどのような影響を与えるか、また一般に人々が情報と対話する方法に非常に興味があり、空間コンピューティングにも非常に興味を持っています。その後、ブラックテクノロジー企業である Leap Motion に製品およびエンジニアリング担当副社長として入社しました。この経験が彼女の製品化能力をさらに強化しました。

(ちなみに、Leap Motion の創設者である David Holz は、Leap Motion を販売した後、別の人気人工知能アプリケーション Midjourney を設立しました)。

2018 年に、ミラは OpenAI に加わりました。そのとき、彼女は多用途性だけに焦点を当てたらどうなるかについてさらに考え始めました。

さらに、研究方法に関するミラの議論からは、不確実な環境における技術革新に対する彼女の探究心を見ることができます。

  • 時々、昼寝をして目が覚めると新しいアイデアが浮かんでくることがあります。数日または数週間かけて、最終的な解決策に到達します。すぐに戻るわけではありませんし、反復的な場合もあります。
  • それはまるで別の考え方のようなもので、直観力を養っているだけでなく、問題に取り組み、自分自身を信頼して問題を解決するための規律も身につけています。時間が経つにつれて、本当に解決する必要がある問題は何かについての直観が養われるでしょう。

会話の要約

著名なベンチャーキャピタリストの A16Z は、人工知能の分野で大きな賭けをしました。以下の抜粋は、A16Z のファンドマネージャーであるマーティンとミラとの会話の抜粋です。ミラは、ChatGPT の背後にあるストーリーと、人工知能と人間とコンピューターの相互作用の未来を共有しました。プロダクトマネージャーとしての経歴を持つミラ氏が、製品の適用可能性について非常に懸念していることもわかります。

マーティン: 現時点ではシステムの問題だと思いますか、それともエンジニアリングの問題だと思いますか?

ミラ:両方ですよ。システムとエンジニアリングの問題は膨大であり、私たちはこれらのテクノロジーを導入し、拡張し、効率を高め、アクセスしやすくしようとしています。これは、ML を使用するために ML の複雑さを理解する必要がないことを意味します。

実際、API を介してこれらのモデルを提供することと、ChatGPT を介してテクノロジーを提供することの間には対照があることがわかります。これは基本的に同じテクノロジーですが、例外が 1 つあります。ChatGPT には強化学習機能とヒューマン フィードバック機能があります。これが意味するのは、人々の想像力を捉え、このテクノロジーを日常的に使用できるようにする反応と能力がまったく異なるということです。

自然言語インターフェース

Martin: ChatGPT API も非常に興味深いものだと思います。これらのモデルをプログラムで使用するときはいつも、スーパーコンピューターをそろばんで包んでいるような気分になります。時々、「モデルにキーボードとマウスを与えてプログラミングをやらせましょう」と言うことがありますが、API は英語であり、私がモデルに何をすべきかを指示すると、すべてのプログラミングをモデルが実行します。興味があるのですが、ChatGPT のようなものを設計するとき、時間が経てば実際のインターフェイスは自然言語になると思いますか、それともプログラムがまだ大きな役割を担っていると思いますか?

ミラ: ChatGPT ではプログラミングの抽象度が低くなり、高帯域幅で自然言語を使用してコンピューターと会話できるようになります。しかし、おそらく別のベクトルは、このテクノロジーがプログラムではなく実際にそれを操作する方法を理解するのに役立っているということです。自然言語でプログラミングできるため、プログラミング層はますます簡単かつアクセスしやすくなっています。しかし、ChatGPT で見ているもう 1 つの側面は、実際にパートナーや同僚のようにモデルを操作できることです。

マーティン: 時間の経過とともに何が起こるかを見るのは興味深いでしょう。あなたは ChatGTP に API を導入することに決めましたが、同僚としては API を持っていません。あなたは同僚と話しています。時間が経つにつれて、これらは自然言語を話すように進化する可能性があります。それとも、システムには常に有限状態マシンまたは従来のコンピューターであるコンポーネントが必要だと思いますか?

ミラ: 現在、私たちはデジタル情報との関わり方を再定義する転換点にあり、それを実現しているのが人工知能システムの形です。おそらく、いくつかの AI システムがあり、それらはすべて異なる機能を備えているかもしれません。おそらく私たちは、どこにでもついて来て、私の経歴、今日何をしたか、人生や仕事の目標を知っていて、困難な時期に私を助け、導いてくれる普遍的なシステムを持っているのかもしれません。ご想像のとおり、これは非常に強力です。

今、私たちはそれを再定義する転換点にいます。未来がどうなるかは私たちにもわかりません。私たちは、これらのツールやテクニックを他の多くの人が利用できるようにして、彼らが実験して何が起こるかを確認できるように懸命に取り組んでいます。これが私たちが最初から採用してきた戦略です。

前週の ChatGPT では、十分ではないのではないかと心配しました。私たちは皆、何が起こったのかを見ました。私たちはそれを公開しましたが、人々はそれが新しい症例を見つけるのに非常に良い仕事をしたと言ってくれました。これらのものをアクセスしやすく使いやすくし、誰もが簡単に使えるようにすると、こういうことが起こります。

OpenAI 開発ロードマップ

マーティン: 人工知能に関して言えば、人々はまだ考え方を知りません。何らかのガイダンスが必要であり、いくつかの選択をしなければなりません。あなたは OpenAI にいるので、次に何をするかを決める必要があります。この意思決定プロセスを実際に体験できるとしたら、何をするか、何に焦点を当てるか、何を手放すか、どのように自分の位置を決めるかをどのように決めますか?

ミラ: ChatGPT がどのように生まれたかを考えると、それは私たちが発売したいと思った製品ではありませんでした。実際、その本当のルーツは 5 年以上前に遡ります。当時、私たちは安全な人工知能システムを作る方法を考えていました。複雑な目的関数を代わりの人にやらせたくなかったり、非常に危険な可能性があるため間違いを犯したくないため、必ずしも人間が実際に目的関数を作成する必要はありません。

ここで人間のフィードバックを使用した強化学習が登場します。私たちが本当に達成しようとしているのは、AI システムを人間の価値観に合わせて人間のフィードバックを受け入れられるようにすることです。人間のフィードバックに基づいて、正しいことを行う可能性が高く、やりたくないことを行う可能性は低くなります。その後、GPT-3 を開発し、API 上でリリースした後、セキュリティ研究を実際に現実世界に適用するのは初めてでした。これは、指示従うモデルによって実現されます。

私たちはこのアプローチを使用して、API を使用して顧客からヒントを取得し、請負業者にモデルの学習用フィードバックを生成させます。このデータに基づいてモデルを微調整し、指示に従ってモデルを構築しました。ユーザーの意図に従い、実際に実行してほしいことを実行する可能性が高くなります。 AI の安全性は、そこに座って話すだけの理論的な概念ではないため、これは非常に強力です。実際には、「私たちは今、人工知能セキュリティ システムの時代を迎えています。それを現実世界にどのように統合しますか?」ということになります。

明らかに、大規模な言語モデルでは、概念や現実世界のアイデアが見事に表現されています。しかし、アウトプットに関しては多くの問題があります。最大の問題の 1 つは明らかに幻覚です。私たちは幻想と真実性の問題に取り組んできました。これらのモデルで不確実性を表現するにはどうすればよいでしょうか?

ChatGPT の前身は、実際には WebGPT と呼ばれる別のプロジェクトで、情報の取得とソースの引用に検索を使用していました。私たちは会話が特別だと考えたため、このプロジェクトは最終的に ChatGPT になりました。これにより、質問したり、相手を正したり、不確実性を表明したりすることができます。

マーティン: 対話しているため、エラーは常に発見されます...

ミラ: はい、このようなやり取りをすることで、より深い真実を理解することができます。私たちはこの方向に進み始め、当時は GPT-3 と GPT-3.5 でこれを行っていました。セキュリティの観点から、私たちはこれに非常に興奮しています。しかし、人々が忘れていることの 1 つは、現時点では GPT-4 をトレーニングしているということです。 OpenAI 内では GPT-4 に非常に興奮しており、バックミラーには ChatGPT が映っています。そこで私たちは、「GPT-4 の調整と安全性に集中して 6 か月間過ごすつもりだ」と気づき、何ができるかを考え始めました。主なことの 1 つは、実際に ChatGPT を研究者の手に渡すことです。この会話モデルができたので、研究者はフィードバックを提供してくれるようになります。当初の目的は、研究者からフィードバックを得て、それを利用して GPT-4 の一貫性、安全性、堅牢性、信頼性を高めることです。

MARTIN: 一貫性とセキュリティと言うとき、それは必要なことはすべて実行するということを含めるのは正しいですか?それとも安全、実際に何らかの危害から身を守るという意味でしょうか?

ミラ: 一貫性とは、通常、ユーザーの意図と一致し、ユーザーが望んでいることを正確に実行することを意味します。ただし、セキュリティには、ユーザーが意図的にモデルを使用して有害な出力を生成しようとする悪用など、他のものも含まれます。 ChatGPT では、実際に、モデルが意図したとおりに動作する可能性を高め、モデルの一貫性を高めようとしています。私たちは幻覚の問題も解明したいと考えていましたが、これは明らかに非常に難しい問題です。

強化学習に人間のフィードバックを使用するこのアプローチは、それを実行しようとする場合、おそらくそれが必要なことだと思います。

マーティン: それで、壮大な計画はないんですか? AGIを達成するには何をする必要がありますか?一度に一歩ずつ進めていくだけです。

ミラ:はい。そして、その過程であなたが下すすべての小さな決断。おそらく、私たちは数年前にこの製品を追求するという戦略的決定を下したので、それが起こる可能性が高いのかもしれません。私たちがこれを行うのは、実世界のユーザーからのフィードバックなしに、単にラボに座って孤立した状態でこれらのものを開発することは不可能であると信じているからです。それが仮定です。これは、最終的に ChatGPT のようなものをデプロイできるように、これらの決定を下し、基礎となるインフラストラクチャを構築するのに役立つと思います。

比例の法則

マーティン: 比例の法則を繰り返すことができます。これは誰もが抱える大きな問題だと思います。進歩のスピードは驚くべきものです。しかし、人工知能の歴史は、ある時点で利益が逓減するというもののようであり、それはパラメトリックではありません。それは一種の先細りです。あなたの観点 (これはおそらく業界全体で最も賢明な観点です) から見ると、拡大の法則は今後も維持され、進歩が続くと思いますか、それとも利益逓減に向かっていると思いますか?

ミラ: データ軸と計算軸全体にモデルを拡張し続けても、より優れた、より強力なモデルが得られないという証拠はありません。それがAGI(汎用人工知能)にまで発展するかどうかは別の問題だ。このプロセスでは、他の画期的な進歩や進歩が必要になる場合があります。これらの大規模なモデルから実際に多くのメリットを得るには、スケーリングの法則を達成するまでにはまだ長い道のりがあります。

マーティン: AGI をどのように定義しますか?

ミラ: 私たちの OpenAI 憲章では。私たちはこれを、ほとんどの知的作業を自律的に完了できるコンピューター システムと定義します。

Martin: 私は昼食をとっていましたが、Anyscale のロバート西原がそこにいました。彼は私がロバート西原質問と呼ぶものを尋ねました。実際、それはかなり良い特徴付けだと思います。彼は、「コンピュータとアインシュタインの間には連続体がある。コンピュータから猫へ、猫から普通の人へ、そして普通の人からアインシュタインへと進む。」そして、「私たちは連続体の上にいます。」という質問をした。どのような問題が解決されるのでしょうか?」

私たちは猫から人間になる方法を知っているということには誰もが同意します。コンピューターから猫への移行方法はわかりません。それは認識に関する普遍的な問題だからです。私たちはそれに近づいていますが、まだそこまで到達しておらず、アインシュタインのやり方も実際にはわかりません。それが既定の推論です。

ミラ: 微調整することで多くのことを得ることができますが、全体的に見て、ほとんどのミッションでは、現時点ではインターンのレベルにあると思います。問題は信頼性です。システムに常に実行してもらいたいことを完全に依存することはできません。多くのタスクではそれができません。時間の経過とともに信頼性を向上させ、これらのモデルが実行できる新しい機能を拡張するにはどうすればよいでしょうか?

たとえ信頼性が非常に低いとしても、これらの新たな機能に注意を払うことが重要だと思います。特に、現在会社を立ち上げている人にとっては、「今日何が可能になるのか? 今日は何が見えてくるのか?」を真剣に考えたいと思うでしょう。これらのモデルはすぐに信頼できるものになります。

**単一のモデルで世界を征服できるでしょうか? **

マーティン: すぐに質問します、未来がどうなるかを予測してください。しかし、私が勝手に尋ねる前に、この経済学はどのように展開すると思いますか。それが私に何を思い出させたかを話します。これを聞くとシリコン産業を思い出します。 90 年代にコンピューターを購入したとき、奇妙な書き込みプロセッサがたくさんあったことを覚えています。 「これは文字列照合、これは浮動小数点、これは暗号化」とすべてが CPU を消費します。

多用途性は非常に強力であるため、Intel と AMD の両方がプレーヤーとなるある種の経済を生み出すことがわかりました。もちろん、これらのチップを製造するには多額の費用がかかります。

つまり、2 つの未来を想像することができます。将来的には、汎用性が非常に高まるため、時間の経過とともに大型モデルが基本的にすべての機能を吸収するようになるでしょう。そして、デザイン空間にさまざまなモデル、あらゆる種類の部品、さまざまなポイントが存在する別の未来があります。 OpenAI は独特ですか、それともモデルがたくさんありますか?

ミラ:それはあなたが何をしたいかによるよ。明らかに、現在の軌道は、私たちが行っている仕事の多くをこれらの人工知能システムが行うことになります。彼らは自律的に活動できるようになりますが、私たちは指示、指導、監視を提供する必要があります。しかし、毎日やらなければならない繰り返しの作業はやりたくありません。他のことに集中したいです。もしかしたら、1 日に 10 時間、12 時間働く必要はなく、労働時間を減らして生産性を高めることができるかもしれません。それが私が願っていることです。プラットフォームの仕組みに関して言えば、現在でも、非常に小さなモデルから最先端のモデルまで、API を通じて利用できる多くのモデルが用意されていることがわかります。

常に最も強力で有能なモデルを使用する必要はありません。場合によっては、特定のユースケースに本当に適合するモデルが必要なだけで、その方がはるかに経済的です。範囲はあるだろうと思います。しかし、私たちがプラットフォーム ゲームをどのように想像するかという点では、私たちは人々が私たちのモデルに基づいて構築することを間違いなく望んでおり、それを簡単にし、より多くのアクセスと適切なコントロールを提供するためのツールを提供したいと考えています。データを持ち込んで、これらのモデルをカスタマイズできます。モデルの外側のレイヤーに実際に焦点を当てて製品を定義することができますが、これは実際には非常に困難です。現在、より多くのモデルを構築することに重点が置かれていますが、これらのモデルに基づいて優れた製品を構築することは非常に困難です。

今後 5~10 年

マーティン: 3 年後、5 年後、または 10 年後にはどうなると思われるかを予測してもらいたいのですが。

ミラ: 今日の基本モデルは、テキスト内の世界をうまく表現していると思います。画像、ビデオ、その他あらゆる種類のモデルを追加しているため、これらのモデルは、私たちが世界を理解し観察する方法と同様に、私たちの周囲の世界のより完全な全体像を提供できるようにします。世界は言葉だけではなくイメージでも存在します。私たちは間違いなくその方向に進んでおり、事前トレーニング作業でこれらすべてのパターンを採用するこれらのより大きなモデルを用意するつもりです。私たちは、これらの事前トレーニング済みモデルが私たちと同じように世界を理解できることを本当に望んでいます。

モデルの出力部分では、人間のフィードバックによる強化学習を導入します。私たちは、モデルに私たちが要求したことを実際に実行してもらい、それが信頼できるものであることを望んでいます。これには多大な労力が必要であり、おそらく新しい情報を取得、参照し、幻覚を解決できるようにブラウジングを導入する必要があります。それは不可能だと思います。これは達成可能だと思います。

製品側では、これらすべてを製品のコレクションにまとめて人々が使用できるようにし、人々がその上に構築できるプラットフォームを提供したいと考えています。本当に外に出ようとするなら、これらのモデルは非常に強力です。それに伴い、これらの非常に強力なモデルが私たちの意図と矛盾しているのではないかという懸念も当然生じます。大きな課題はスーパーアライメントであり、これは技術的に難しい課題です。 OpenAI にはチーム全体がこの問題に焦点を当てています。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
  • ピン
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)