對話稚暉君:具身智能創業窗口轉瞬即逝,打擂瞄準偶像馬斯克

來源:量子位

作者:衡宇

原標題:《對話稚暉君:具身智能創業窗口轉瞬即逝,打擂瞄準偶像馬斯克》

馬斯克是我偶像,很榮幸能有機會在這個賽道和他同台競技。

說出這話的稚暉君,十分清楚他離開華為創業要做什麼:

對標馬斯克,做通用機器人,競品擎天柱,既面向星辰大海也奔著商用落地,產品目標最終定價不超過20萬人民幣。

換成最流行的說法,他在做大模型和機器人結合的具身智能

想法始於他學生時期的探索。

早在他還沒成B站up主的2015年,學生身份的稚暉君就參與組織了一群打比賽認識的小伙伴,準備“做個人吧”:

當時,普通人對AI的切身感受還是人臉識別或美顏這類應用,大模型概念還沒誕生,“要讓機器人具備像人一樣的思考和行動能力”這個命題,似乎離實現還有點過於遙不可及。

因此,畢業後的稚暉君沒繼續只在機器人身上折騰,而是選擇進入AI賽道,成為大廠的AI算法工程師,在軟件算法領域乾了好幾年。

直到ChatGPT石破天驚,大模型智能湧現,OpenAI證明大力堆疊真的可以產生質變。

回看自己的機器人夢想,稚暉君又看到了這條路的可行性。

所以,離開菊廠,投身創業。

於是半年時間,他帶著團隊拿出了一套有模有樣的原型機。

8月發布會上,被稚暉君自豪請上台的自家機器人步伐穩健,行走效果可以比肩去年馬斯克擎天柱Optimus的初亮相。

就是憑藉這樣一款作品,他的初創公司智元機器人,在投資者冷靜但賽道又火爆的當下,成為了少數幾個拿到VC和大廠戰投重金押注的標的。

發布會結束後和量子位的會面,他表露出對發布會、團隊和整體進展的還算滿意,也表露出沿著這條路往未來走的信心。

還在他的工位前告訴我們,他的桌面壁紙已經換了很久了:

全身心投入人形機器人創業,他會怎麼看待自己公司的高估值?智元的下一步規劃是什麼?商業化落地場景將在何方?創業過後這個百大up主的B站賬號咋辦?

量子位問,稚暉君答,一切都在這次對話中。

再晚點,也許就不用出來創業了

稚暉君算是最早感知到這一波大環境變化,並且付諸實踐的那撥人。

外界看來,他去年年底宣布創業時,機器人和大模型都是科技領域的大熱議題,尤其是ChatGPT剛出道,帶給大家暴力美學的震撼。

那個時間節點,賽道遠沒有今天擁擠。技術從業者聞風而動,不算意外。

但稚暉君第一次透露了他當時的心態:

**要是選擇再晚一點,也許就沒必要出來創業做這事了。 **

為了解釋這句話,他給競品特斯拉擎天柱拉出一條時間線:

去年9月展示原型機,今年5月展示識別周圍環境存儲記憶和準確控制物品拿放的能力,7月表示已經生產10台,預計11月進行行走測試,明年在特斯拉自己的工廠進行實用性測試。

動作很快,實際效果也哇噻。

馬斯克,一個從不按套路出牌的男人,自從宣布入局機器人賽道,就用火箭般的速度推進量產節奏,在他的口中,未來機器人的數量會超過人類。

稚暉君看到這一切,心潮澎湃。

與此同時,他也觀察到機器人和大模型結合的潛力。

微軟的ChatGPT for Robotics,谷歌的Palm-E、RT-1、RT-2,還有VoxPoser、RoboCat等眾多工作,都在嘗試把圖像語言大模型的能力和知識遷移到機器人領域。

其中轟動最大的谷歌RT(Robot Transformer)系列,在論文闡述和demo視頻中,都展示出抓取領域非常優秀的泛化能力。

要做到這一點並不容易,核心門檻,在於數據

光是訓練它,谷歌就花了17個月,收集13台機器人的13萬條機器人真實數據——這大概也是RT模型開源而數據暫時閉源的一個小小心機。

稚暉君坦言,雖然也從一開始就在準備自家的動作任務數據集,但目前能用來訓練自家產品的數據,“只有上千”。

一對比,差距之大,顯而易見。

數字上的直觀差距,足以解釋稚暉君對量子位說的,“當前節點,遠征A1最需要提升的地方,是數據帶來的AI泛化能力”,足以解釋這為什麼“會是一個相對長期的佈局”。

也能部分解釋發布機器人時,直播間網友對展示時間較短、展示能力不如想像炫酷的疑問。

“我覺得要想達到真正理想的實用效果,還是需要大量的真實場景數據。我們時間太短了,這方面還沒有做夠積累。”稚暉君如是說。

競爭對手不會給你多留喘息的機會。正因如此,稚暉君表示團隊接下來的工作重心之一,是建立自己的數據中心

計劃未來幾個月內落地臨港,主要目的是搭建場景和仿真平台,填補運動數據,提高泛化能力。

數據是如何生成的?稚暉君的總結有三:

  • **監督學習數據。 **靠人做示範,控制機器人做分揀等各種操作,在過程中採集真實數據。
  • **仿真數據。 **需要自己搭建仿真平台,有一個比較好的渲染引擎、物理引擎,以及比較好的人機交互流程裝置。
  • **AIGC生成數據。 **主要是真實數據的補充擴充,是低成本數據增強的一個重要手段。

建數據中心是工作重點之一,**另一個重點則是對硬件結構進行迭代重構,加強機器人本體運動性能。 **

按稚暉君的說法,團隊會用做軟件敏捷開發的速度和效率去迭代硬件。

這是非常顛覆並且有挑戰性的一件事情。

此處送上小八卦一則。

今年4月,智慧軍在投稿B站的自製雙足機器人哪吒,並在視頻結尾表示,“如果不出意外的話,哪吒會成為發布會的彩蛋”。

當然了,按照經典劇情,不出意外的話果然就出意外了:D,哪吒並沒有上發布會。

就是它↓

量子位幫大家打聽到,原因是哪吒上面用到的幾個電機被供應商鴿了,3月下的訂單7月才收到貨,導致開發時間不夠。

稚暉君說道:“後面有空還是會繼續完成這個項目的,鴿王有坑必填。”

半年成獨角獸,背後還有另一條商業化隱線

讀到這里大概能察覺,智元人形機器人項目的機器人本體,還需要迭代幾版;而AI能力受限於當前訓練數據不足,也還需要積累一段時間。

總體來說,產品離落地似乎還有一段距離的樣子。

然而就是這樣一個創業項目,半年估值直奔10億美元開外。

這合理嗎? ? ?

聽到這個問題,稚暉君並沒有直接回答到底“值或不值”,只是回答道,其實融資思路也不是一開始就定型的,期間參考了很多行業大佬和前輩的建議。

團隊最初的設想很單純,就是先做出Demo,然後順其自然地提高估值。

“但創業顯然不是那麼單純的事情,大經濟環境不算景氣的背景下,要整合資源、吸引人才,無一不需資本的背書。”稚暉君表示,“這並不是一件壞事。”

高效實幹,快速調整思路和策略,以結果導向推進事情,這是稚暉君的行事風格。

他的風格最終也決定了智元,至少是智元研發團隊的工作風格。

技術團隊每個早期成員都是他親自面進公司的,30多號人基本都是自來卷,卷得一天睡五、六個小時的稚暉君都心生感慨:

之前大家都覺得我是時間管理大師,現在我可以很慚愧地講,我們公司像我這麼肝的,還有一堆……

整個交流過程中,量子位關注到他強調了兩個關鍵詞,“壓成本”和“應用場景”

這倆是目前整個賽道的普遍痛點。團隊如何解決痛點,必然是他們獲得高瓴、鼎暉、經緯、高榕、藍馳、BV百度風投等頭部資方重金押注的關鍵。

來聽聽稚暉君的看法——

先說壓低成本

現在智元對外喊出的口號是,人形機器人落地控價20萬元內。

這約與馬斯克放話的7萬美元售價持平,而國內類似人形機器人的售價水平在50萬RMB上下,大家喜聞樂見的波士頓動力Atlas,成本則在200萬美元。

稚暉君直言不諱:“不是我們希望做到20萬元,而是如果做不到20萬元的價格,就根本沒辦法實現商業落地。”

至於為什麼是20萬,他表示,以新能源汽車製造業為例,20萬的機器人替代部分人工崗位的話,可以做到1~2年的投資回報期。

稚暉君也大致描述了一下智元為量產控製成本的方法

一是盡最大可能採取自研路線,降本增效。

如關節電機和靈巧手等部件佔硬件成本一半以上,而且市場現有供應還存在特性不匹配的情況,自主研發核心部件能讓成本降低一半以上。

二是採用類似特斯拉造車的部分思路,用軟件和算法補硬件方面的精度要求,降低硬件成本。

如放棄諧波減速器而選擇行星減速器,靈巧手上面使用的視覺閉環方案等等。

再說落地應用場景

稚暉君表示,預計明年下半年商業化落地,先應用在工業製造領域,家庭等服務型應用場景都往後排,現階段突出一個“場景相對簡單,任務相對複雜”。

“這條路線是邊走邊摸索出來的,還是最初就定下的目標?” “團隊還不到10個人時候的最早期,我們就基本敲定了這條落地方案。”

同時表示,

很多人會拿我們或者特斯拉的機器人去跟波士頓動力對比,其實是不合適的。 奔著商業化落地去做,**正確的邏輯應該是:在滿足應用場景功能和性能需求的前提下,以盡量最低的成本去實現方案。 ** 所以能走著去搬東西的場景下,就沒有必要非得讓它有能力後空翻。

現在,這條半年前定下的路線,最終落地跡象愈發明晰。

最新工商動態顯示,比亞迪入股了智元下屬公司,加上此前量子位從智元方面獲悉,公司已與國產頭部智能汽車廠商和3C廠商等密切洽談。

由此在官宣前推測一波,遠征A1在工業製造領域的首發打工地點,不出意外,就是比亞迪汽車工廠。

除成本和落地場景這兩點外,隨著團隊對具身智能的愈發深入,智元手裡還握了些其它差異化的牌。

比如,量子位就從稚暉君口中挖到公司商業化的一條隱線——

如果說通用人形機器人是商業落地的中長期計劃和最終願景,那麼在邁向這個終點的過程中,團隊也會有一些“沿途下蛋”的產品形態。

具體是什麼形態呢?稚暉君一如既往地口風很嚴,賣了個關子,但還是有所透露。

他聽到過很多次疑問,問為什麼要把機器人做成人類形態,相比於其他專用形態(機械臂、輪式),是不是費力不討好?

針對這個問題,稚暉君有兩方面思考。

一方面,這會是一個長期投入的過程,大家不要高估短期的價值,也不要低估長期的價值

人形是智元以終為始、面向終極形態邁出的第一步,這也是為什麼給這款機器人取名叫“遠征”。

另一方面,選擇做這件事情(人形)並不是因為它容易,反而是因為它很困難。

通用人形機器人牽涉到最全面的機器人技術棧,它的實現過程中各種前沿技術(視覺伺服、MPC、SLAM、LLM/VLM、中間件等各種技術的自研和優化)的沿途下蛋,可以催生很多創新性專用形態的機器人產品,“大家未來會陸續看到這些成果的”。

“網友們放心,B站賬號不會變成公司專用營銷號”

過人的技術,漂亮的簡歷,大廠的光環,百萬計的粉絲,又恰逢新技術爆發週期:大模型、具身智能、AIGC……攢局創業後,出任團隊CTO,帶領公司迅速壯大,半年時間,公司人數近百,市場估值超10億美元。

一系列附帶光環的故事砸過來,圍觀者不由得在這個時候,重新審視稚暉君。

他又會怎樣定義現在的自己?量子位把這個問題拋給了稚暉君本人。

稚暉君倒沒表現出什麼遲疑,只是說,他給自己的定位並沒有太大變化。

**首先是個工程師,其次才是創業者。 **

我可能屬於一個非典型創業者,做這些事情的動力都是基於個人興趣,也很幸運取得了一些小成就:早期在大廠裡發光發熱,頂了一些光環,又在網上獲得了不小的知名度,然後又突然跑出來創業。一開始身邊的人都覺得挺震驚的。 我一直認為自己是一個樂觀主義者。

還有句話,他說得毫不猶豫——

“既然人生沒有後悔的機會,那麼就堅持相信自己到現在的每一步,都是我做的最正確的選擇。”

“每一步都是正確的選擇”,可能也包括不少人為之唏噓的離開華為,脫離“天才”tag。

在量子位面前,他沒有掩飾曾經在華為工作取得榮譽的感激,也提到,

老東家在做一些很偉大的事情,但是像機器人這樣面向更未來領域的探索,可能更適合在小的創新團隊中去做。 希望自己能繼承'散是滿天星'的優良傳統吧“。

然後,又像他常常做的那樣,再次強調自己既不是天才,也不再是少年。

能感受到,稚暉君**更希望外界把對他的關注從一個具體的tag,轉移到他想做的事情本身。 **

有趣的是,他又勸大夥兒不要太早創業。 “對於學生來說,建議還是要先工作幾年,接受一下社會的毒打,才對社會、公司運作的方式有一個清晰的了解哈哈。”

當時在發布會上,他也表達了自己的觀點:檢驗一家科技公司價值最有效的方式之一,就看它能否實現商用落地。

不然技術做得再好也容易陷入自嗨。

聊到這兒,稚暉君表露心跡,既然正兒八經創業了,項目也不能單純按照個人的奇思妙想隨意自嗨了。

組了人、拿了錢,就需要在公司戰略發展方向上多做考慮,“要為公司這麼多兄弟姐妹們負責”。

但顯然,他自有自嗨處:**B站。 **

“個人號啊?這陣子太忙了(所以沒更新)。”稚暉君解釋到,稱自己絕對沒有挖坑就跑的意思,“後面稍微閒下來一點,還是會更新的。”

至於之後的B站投稿,還會是原來的風格,原來的味道,可能偶爾夾雜一些創業日常。

但他保證,不會變成純粹公司的營銷窗口。

(他暗示,畢竟智元有單獨的官方賬號,歡迎大家關注~)

“也是向馬斯克學習嘛,他在公司管理運營和個人賬號運作之間,就做得很好。”

## 還有一件事

話趕話聊到這兒,怎麼能不追問鴿王,下次B站視頻更新,在啥時候?

“今年一定,年底之前一定。”

內容與什麼相關?

還是機器人吧,之前挖過的某個坑,下個視頻就是這個。”

好的,經本人授權,我們替他把話放在這兒了。

咕咕咕。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)