Zhihui氏との会話: 体現された知性の窓は一瞬であり、挑戦はアイドルのマスクに向けられている

出典: 量子ビット

作者: 恒宇

原題:「Zhihui氏との対話:知的起業家精神を体現する窓は一瞬であり、挑戦はアイドルのマスクに向けられている」

マスクは私のアイドルであり、このトラックで彼と競う機会を持つことができて大変光栄です。

これを言った Zhihui Jun さんは、ファーウェイを辞めて起業した後、自分が何をしたいのかをよく知っていました。

ベンチマークのマスク氏は、汎用ロボットと競合製品のオプティマスプライムを製造しており、スターに対抗するだけでなく、商業化を急いでおり、製品の最終価格は20万元を超えません。

最も一般的な言葉で言えば、彼は大型モデルとロボットを組み合わせた身体化された知能を作成しています。

このアイデアは学生時代の彼の探求から始まりました。

ステーション B のオーナーになる前の 2015 年の時点で、学生だった Zhihuijun 氏は、コンテストを通じて知り合った友人グループの組織化に参加し、「個人になる」準備をしていました。

当時、一般の人々のAI体験はまだ顔認識や美容などの応用であり、大型モデルの概念も生まれていなかった時代であり、「ロボットに人間と同じように考え、行動する能力を持たせる」という命題は、まさに「人間と同じように考え、行動する能力をロボットに持たせる」という命題にあったようです。実現には少し遠すぎます。手の届かないところにあります。

そのため、卒業後もロボットのみの開発に取り組むのではなく、AIの道へ進むことを選択し、大手メーカーでAIアルゴリズムエンジニアとなり、数社のソフトウェアアルゴリズムの分野で働いてきました。年。

ChatGPT が基礎を打ち破り、大規模なモデル インテリジェンスが登場するまで、OpenAI は、活発なスタッキングが実際に質的な変化を生み出すことができることを証明しました。

Zhihui Jun さんはロボットの夢を振り返り、この道の実現可能性を認識しました。

それでチュチャンを出て自分のビジネスを始めました。

そこで彼は半年でチームを率いて、見栄えの良い一連のプロトタイプを考案しました。

8月の記者会見で、Zhihui氏が誇らしげにステージに招待した当社のロボットは安定したペースで、その歩行効果は昨年のマスク氏のオプティマスプライムのデビューに匹敵した。

このような取り組みのおかげで、彼の新興企業 Zhiyuan Robot は、投資家が落ち着いているものの市場が熱くなっているこの時期に、VC や大手メーカーから多額の投資を受ける数少ないターゲットの 1 つとなりました。

記者会見後にキュービットと面会した後、同氏は記者会見、チーム、全体的な進歩に非常に満足していると述べ、今後もこの道を進む自信を表明した。

彼はまた、デスクトップの壁紙が長い間変更されてきたことをワークステーションの前で私たちに語った。

人型ロボット事業の立ち上げに専念した彼は、自社の高い評価をどう思うだろうか。 Zhiyuanの次の計画は何ですか?商品化の着地点はどこになるのでしょうか?起業後、上位100アップオーナーのBステーションアカウントはどうすればいいですか?

量子ビットが尋ねると、Zhihui Junは、すべてがこの対話の中にあると答えます。

遅ければ起業しなくても済むかも

Zhihui 氏は、この環境変化の波を認識し、それを実践した最初のグループでした。

外部から見ると、彼が昨年末にスタートアップを発表したとき、特に ChatGPT がデビューしたばかりの頃は、ロボットや大型モデルがテクノロジー分野でホットな話題であり、その暴力的な美学で誰もが衝撃を受けました。

当時、トラックは現在よりもはるかに混雑していませんでした。テクノロジーの専門家がこの傾向を利用しているのは驚くべきことではありません。

しかし、Zhihui Jun氏は初めて、当時の心境を次のように明かした。

**もし私がそれを後で行うことを選択していたら、おそらくこれを行うためにビジネスを始める必要はなかったでしょう。 **

この文を説明するために、彼は競合製品である Tesla Optimus Prime のタイムラインを描きました。

昨年9月に試作機が公開され、今年5月には周囲の環境を認識し、記憶を記憶し、物体の取り扱いを正確に制御する能力を実証し、7月には10台が生産されたとのこと。 11月に歩行テストを実施し、来年テスラ自社工場で実用化される予定だ。

アクションは非常に速く、実際の効果は驚くべきものです。

ルールを決して守らないマスク氏は、ロボット分野への参入を表明して以来、ロケットのようなスピードで大量生産を進めており、将来的にはロボットの数が人間を超えるだろうと述べている。

これらすべてを見て、Zhihui-junは圧倒されました。

同時に、彼はロボットと大型モデルを組み合わせる可能性にも注目しました。

Microsoft の ChatGPT for Robotics、Google の Palm-E、RT-1、RT-2、VoxPoser、RoboCat、その他多くの作品は、大規模画像言語モデルの能力と知識をロボットの分野に移そうとしています。

中でも最もセンセーショナルな Google RT (Robot Transformer) シリーズは、論文やデモ ビデオで、キャプチャの分野で優れた汎用化機能を実証しています。

これを行うのは簡単ではありませんが、核となる閾値はデータにあります。

トレーニングするだけで、Google は 17 か月を費やして 13 台のロボットから 130,000 個の実際のロボット データを収集しました。これはおそらく、RT モデルをオープンソースにし、データを一時的にクローズするための小さなトリックです。

Zhihui Jun 氏は、当初から独自のアクション タスク データ セットを準備してきたものの、自社製品のトレーニングに使用できるデータは現在「わずか数千」であることを認めました。

比較してみるとその差は歴然。

数字の直感的なギャップは、Zhihui 氏が Qubits について語った「現在のノードで、Yuanzheng A1 を改善するために最も重要なことは、データによってもたらされる AI の汎化能力です。」を説明するのに十分です。これは「比較的長期的な開発になるだろう。」レイアウト」。

また、ロボットがリリースされたときに表示時間が短く、表示能力が想像ほどクールではないという生放送室のネチズンの疑問も部分的に説明できます。

「理想的な実用効果を達成するには、依然として大量の実際のシーンデータが必要だと思います。私たちの時間は短すぎますし、この点に関しては十分な蓄積がありません。」と Zhihui Jun 氏は述べました。

競合他社はあなたに息つく暇を与えません。このため、Zhihui 氏は、チームの作業の次の焦点の 1 つは、独自のデータセンター** を構築することであると述べました。

今後数カ月以内に臨港に着陸する予定で、主な目的はシーンとシミュレーションのプラットフォームを構築し、モーションデータを入力し、汎化機能を向上させることだ。

データはどのように生成されるのでしょうか? Zhihui Jun は 3 つの結論を出しました。

  • **教師付き学習データ。 **人に頼ってデモンストレーションを行い、ロボットを制御して仕分けなどのさまざまな作業を行い、その過程で実際のデータを収集します。
  • **シミュレーションデータ。 **より優れたレンダリング エンジン、物理エンジン、より優れた人間とコンピューターの対話プロセス デバイスを備えた独自のシミュレーション プラットフォームを構築する必要があります。
  • **AIGC がデータを生成します。 **これは主に実データの補足的な拡張であり、低コストのデータ強化の重要な手段です。

データセンターの構築も重要なポイントですが、ロボットの動作性能を高めるためにハードウェア構造を繰り返し再構築することも重要なポイントです。 **

Zhihui 氏によると、チームはアジャイル ソフトウェア開発のスピードと効率を利用してハードウェアを反復する予定です。

これは非常に破壊的で挑戦的なことです。

ここでちょっとしたゴシップです。

今年4月、ウィズダム・アーミーはステーションBから自作の二足歩行ロボットNezhaを提出し、ビデオの最後に「何も起こらなければ、Nezhaは記者会見でイースターエッグになるだろう」と述べた。

もちろん、古典的なプロットによれば、事故がなければ事故は起こります。D、Nezha は記者会見を行いませんでした。

以上です↓

Qubit は、その理由が、Nezha が使用したいくつかのモーターがサプライヤーによって拒否され、3 月に発注した注文が 7 月まで受け取られなかったため、開発時間が不十分だったことであることを突き止めるのに役立ちました。

Zhihui 氏は、「後で時間があるときにこのプロジェクトを完了し続けます。エース ピジョンはあらゆる落とし穴を埋めなければなりません。」と述べました。

半年でユニコーンになる、その裏にはもう一つの事業化の伏線がある

これを読むと、Zhiyuan ヒューマノイド ロボット プロジェクトのロボット本体にはまだ数回の反復が必要であること、および AI の能力は現在のトレーニング データの不足によって制限されており、蓄積にも時間がかかることがおわかりいただけると思います。

全体として、この製品の上陸はまだ遠いようです。

しかし、このようなスタートアッププロジェクトの場合、半年で評価額は10億ドルを超えました。

これは合理的ですか? ? ?

この質問に対し、志恵氏は「価値があるかどうか」については直接答えず、「実は当初は資金調達のアイデアが固まっていなかった。期間中、多くの業界の提案を参考にした」とだけ答えた。リーダーや先輩たち。

チームの最初のアイデアは非常にシンプルで、最初にデモを作成し、その後自然に評価を高めるというものでした。

「しかし、ビジネスを始めるのは明らかに簡単な問題ではありません。一般的な経済環境が繁栄していない状況では、リソースを統合し、才能ある人材を引き付けるためには、資本の承認が必要です。」と Zhihui Jun 氏は述べました**。悪いことだ。」**

効率的かつ効果的に働き、アイデアや戦略を迅速に調整し、結果重視のアプローチで物事を進める、これが Zhihui 氏の仕事のスタイルです。

彼のスタイルは最終的に Zhiyuan、少なくとも Zhiyuan の研究開発チームの仕事のスタイルを決定します。

技術チームの初期メンバー全員が彼によって個人的に面接を受け、30数名のほとんどが自己申告であったため、1日5、6時間睡眠していたZhihui氏は深く感動したという。

以前は私が時間管理の達人だと誰もが思っていましたが、今では恥ずかしながら私と同じくらい怠け者が社内にたくさんいると言えます...

Qubit はコミュニケーション プロセス全体を通じて、「コスト削減」と「アプリケーション シナリオ」 という 2 つのキーワードを重視していることに気づきました。

これら 2 つは、現時点でトラック全体に共通する問題点です。チームが問題点をどのように解決するかが、Hillhouse、CDH、Matrix Partners、Gaorong、Lanchi、BV Baidu Ventures などのトップ投資家から多額の賭けを獲得するための鍵となるのは間違いありません。

志恵さんの意見を聞いてみましょう——

まずコストの削減についてお話しましょう。

現在、Zhiyuan のスローガンは、人型ロボットの価格を 20 万元以内に抑えることです。

これはマスク氏が発表した価格7万ドルとほぼ同じで、国内の同様の人型ロボットの価格水準が50万元程度であるのに対し、誰もが憧れるボストン・ダイナミクス・アトラスの価格は200万ドルである。

Zhihui Jun氏は「20万元を達成したいわけではないが、20万元に到達できなければ商用化は不可能だ」と率直に語った。

なぜ20万元なのかについて同氏は、新エネルギー自動車製造業を例に挙げ、20万元のロボットが一部の手動ポジションを置き換えれば、1~2年の投資回収期間が達成できると述べた。

Zhihui 氏は、Zhiyuan の量産コスト管理方法についても簡単に説明しました**。

** 1 つは、コストを削減し効率を高めるために、可能な限り自己研究のルートを取ることです。

関節モーターや器用なハンドなどのコンポーネントはハードウェア コストの半分以上を占めており、市場にある既存の供給品には機能の不一致がまだありますが、コア コンポーネントを独自に研究開発することで、コストを半分以上削減できます。

2 つ目は、テスラが自動車の製造に使用したものと同様のアイデアを採用し、ソフトウェアとアルゴリズムを使用してハードウェアの精度要件を補い、ハードウェアのコストを削減することです。

高調波減速機を放棄して遊星減速機を選択したり、器用な手に使用される視覚的な閉ループ ソリューションなどです。

ランディング アプリケーション シナリオについて話しましょう。

Zhihui氏は、「来年下半期には実用化される予定だ。まずは工業製造分野に適用され、家庭などのサービス指向の適用シナリオは後列に置かれるだろう」と述べた。ステージでは、「シーンは比較的単純で、タスクは比較的複雑である」ことが強調されます。

このルートは歩きながら見つけたものですか、それとも最初から決めていた目標ですか? 「チームが 10 人未満だった初期の段階で、私たちは基本的にこの着陸計画を完成させました。」

同時にこうも述べられた

多くの人が私たちのロボットやテスラのロボットをボストン ダイナミクスと比較しますが、これは実際には不適切です。 商用化を達成するには、アプリケーション シナリオの機能要件とパフォーマンス要件を満たすことを前提として、可能な限り低コストでソリューションを実装するのが最も正しいロジックである必要があります。 ** したがって、歩いて物を移動できるシナリオでは、バク転できるようにする必要はありません。

半年前に設定されたこの路線が最終的に実現する兆しが今、ますます明らかになりつつある。

最新の産業・商業ニュースによると、BYDが知源の子会社の株主となったほか、Qubitは知源から同社がすでに国内の大手スマートカーメーカーや3Cメーカーと緊密に交渉していることを知った。

このことから、正式発表前に私たちは、元正 A1 が工業製造分野で最初に稼働した場所は、当然のことながら BYD 自動車工場であると推測していました。

コストと実装シナリオの 2 つのポイントに加えて、チームが身体化されたインテリジェンスについての理解を深めていく中で、Zhiyuan は他にもいくつかの差別化されたカードを手にしています。

たとえば、Qubits は Zhihui 氏から同社の事業化への隠された手がかりを掘り出しました——

汎用人型ロボットが中長期計画であり、商品化の最終ビジョンであるとすれば、その終点に向かう過程で、チームは「途中で卵を産む」製品形態もいくつか持つことになるだろう。

具体的な形式は何ですか?志惠氏は相変わらず口調が厳しく、秘密にしていたが、それでも明かしたことがある。

なぜロボットを人間の形にしなければならないのか、他の特殊な形状(機械の腕や車輪付き)と比較して、それがありがたくないのかという質問が数多く聞かれました。

この問題に対して、Zhihui 氏は 2 つの考慮事項を持っています。

一方で、これは長期的な投資プロセスとなるため、短期的な価値を過大評価したり、長期的な価値を過小評価したりしないでください**。

人型はChiyuanの究極の姿への第一歩であり、目的を念頭に置いてスタートする第一歩であることから、このロボットは「Expedition」と名付けられています。

一方で、このこと(人間の姿)をすることを選択するのは、それが簡単だからではなく、むしろ難しいからです。

ユニバーサルヒューマノイドロボットは、最も包括的なロボット技術スタックを必要とし、その実現の過程で、さまざまな最先端技術(ビジュアルサーボ、MPC、SLAM、LLM/VLM、ミドルウェアなどの各種技術の自社開発と最適化)が組み込まれています。 )は途中で卵を産み、多くの革新的で特殊なロボット製品**を生み出すことができ、「将来、誰もがこれらの成果を次々と見ることになるでしょう」。

「Bilibili アカウントが企業固有のマーケティング アカウントになることはないので、ネチズンは安心してください。」

優れたテクノロジー、美しい履歴書、大企業のオーラ、何百万人ものファン、そしてそれは大型モデル、身体化されたインテリジェンス、AIGC などの新テクノロジーの爆発的なサイクルと一致しています...起業後、彼はチームの CTO を務めました半年後には社員数が 100 名近くに達し、市場評価額は 10 億ドルを超えました。

後光のある一連の話がやって来て、この時、見物人は志恵氏を再検討せずにはいられませんでした。

彼は今、自分自身をどのように定義するでしょうか? Qubit はこの質問を Zhihui Jun 自身に投げかけました。

Zhihui氏は何の躊躇も見せなかったが、自分自身の位置付けはあまり変わっていないと語った。

**私は第一にエンジニアであり、第二に起業家です。 **

私は典型的な起業家に属しているかもしれません。これらのことをする動機は個人的な興味に基づいています。また、いくつかの小さな成果を達成できたことも幸運です。初期の頃、大きな工場で輝き、いくつかの光輪を獲得し、ネットで大金を手に入れ、人気を得たが、突然お金がなくなってビジネスを始めた。周りの人も最初はびっくりしていました。 私は常に自分自身を楽観主義者だと考えてきました。

もう一つの文があります、と彼はためらうことなく言った——

「人生で後悔する可能性はありません。ならば、これまでに行ったすべてのステップが、私が行った最も正しい選択であると信じてください。」

「あらゆるステップは正しい選択だ」これには、多くの人がファーウェイを去り、「天才」のタグから離れることも含まれる可能性がある。

量子ビットを前に、彼はファーウェイで働ける光栄に感謝の気持ちを隠さず、次のようにも言及した。

古いクラブはいくつかの素晴らしいことを行っていますが、ロボット工学などのより未来の分野の探求は、小規模な革新的なチームで行う方が適しているかもしれません。 >『空は満天』の良き伝統を引き継いでいけたらと思います。

そして、いつものように、自分は天才でも十代でもないことを改めて強調した。

Zhihui 氏は、外の世界が特定のタグから自分がやりたいことに関心を移すことを望んでいるのが感じられます。 **

興味深いことに、彼は全員に、あまりにも早くビジネスを始めないようアドバイスしました。 「学生の場合は、社会や会社の仕組みを理解する前に、数年間働いて社会からの叩きを受け入れることをお勧めします(笑)」

当時の記者会見で同氏は次のようにも意見を述べた:テクノロジー企業の価値を試す最も効果的な方法の一つは、それが商業化できるかどうかである。

そうしないと、どんなに優れた技術でも自己満足に陥りやすくなります。

この話を終えた後、志惠氏は、本格的に事業を始めた以上、個人の思いつきや気まぐれでプロジェクトを進めることはできない、との考えを述べた。

人材を組織し、資金を集めた後は、「社内の非常に多くの兄弟姉妹に対して責任を負う」という会社の戦略的発展の方向性についてさらに考える必要があります。

しかし明らかに、彼には自分自身を楽しむための場所があります。ステーション B です。 **

「個人アカウント?最近忙しすぎて(更新していない)」とジフイ・ジュンさんは説明し、穴を掘って逃げるつもりはまったくなかったと述べ、「後で更新したら更新する」と述べた。少し自由な時間を持ってください。」

ステーション B へのその後の投稿に関しては、依然としてオリジナルのスタイルのままであり、オリジナルの風味が起業家的な日常生活と時々混合される可能性があります。

しかし同氏は、それが同社の純粋なマーケティング窓口にはならないと約束した。

(結局のところ、Zhiyuan には別の公式アカウントがあるので、誰でもフォローしてください~)

「私もマスク氏から学んでいます。彼は会社の管理と運営と個人アカウントの運営の間で良い仕事をしてくれました。」

## もう一つ

エースピジョンに、ステーション B の次のビデオ更新はいつになるのかを尋ねないわけにはいきません。

「必ず今年、年末までに必ず。」

内容は何に関係しているのでしょうか?

それはまだロボットです、以前に掘られたある穴です、これは次のビデオです。」

さて、私の許可を得て、ここに彼の言葉を載せておきます。

ググググ。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)