宇樹科技創(chuàng)始人王興興:機器人AI還沒突破臨界點,是當前最大瓶頸
來源:每日經濟新聞作者:孔澤思2025-01-02 09:22

近兩年,隨著新一代人工智能出世,以及資本市場加強對未來產業(yè)的投入,人形機器人開始逐漸從科幻走向現實。從資本市場近期表現看,人形機器人概念持續(xù)火熱,部分公司漲停連板。花旗分析師指出,預計未來25年,人形機器人市場規(guī)模將達到驚人的7萬億美元。

與此同時,人形機器人部分產品也已開始出售交付,大有批量“進廠打工”趨勢。如2024年5月,特斯拉研發(fā)的二代Optimus人形機器人已進廠實訓,計劃2025年年底前量產銷售。在國內,如宇樹科技、達闥科技等廠商均已在人形機器人領域有所布局。

除了工業(yè)領域,人形機器人離我們的生活還有多遙遠,何時能“飛入尋常百姓家”?當前行業(yè)發(fā)展難點又有哪些?

近日,杭州宇樹科技有限公司創(chuàng)始人兼CEO王興興接受了《每日經濟新聞》記者(以下簡稱NBD)采訪。

5年內將有終端產品

NBD:2023年,國內很多人形機器人開始“進廠打工”,您怎么看這個現象?宇樹人形機器人的落地現狀和未來規(guī)劃是怎樣的?

王興興:我覺得這是一個趨勢。我們過去幾個月與蔚來的汽車工廠有合作,就現場部署了人形機器人做搬運。這個領域目前基本處于試點階段,大家覺得這個方向有價值,就共同推進落地部署,不過目前還沒有到真正的商業(yè)閉環(huán)階段。

我們公司主要是賣本體,如果是做科研教育、AI公司或者個人買來玩,我們完全歡迎。

此外,工業(yè)領域也在推進,比如我們希望去工廠幫忙做一些簡單的生產裝配,或者一些簡單的搬運工作,蔚來汽車工廠就是典型例子。我們其實沒有給自己定目標或者逼迫那么緊,還是尊重整個市場的反應,等技術、產品和大家接觸到一定程度,已經展現出更好的商業(yè)勢頭了,我們再大規(guī)模去推廣。

NBD:在人形機器人技術迅速發(fā)展的當下,面臨的最大瓶頸是什么?目前人形機器人應用領域中,哪些方面有可能實現突破性進展?

王興興:當下的最大瓶頸,包括人形機器人、四足機器人等,是基層AI在全球范圍內都沒有達到一個像初代GPT或者初代通用AI的能力,這也是目前整個行業(yè)最大的問題。

目前機器人本身,比如雙臂機器人或者工業(yè)機器人,如果加了AI以后產生的能效比人低,如速度比較慢、精度比較差、能干的活比較少,其實很難替代人在工業(yè)領域的價值,整個商業(yè)閉環(huán)沒法跑通。如果機器人AI的能力能突破一個臨界點,使得工廠的基本工序能夠高效運轉,同時成本也相對較低,那么就可以實現商業(yè)閉環(huán)并大規(guī)模推廣,我認為這將是非常有價值的。

當然,目前硬件方面也存在一些挑戰(zhàn),例如機械臂的負載能力不足、精度不夠以及成本較高,但這些都屬于工程技術層面的問題。所以,最大的問題還是整個機器人AI沒有突破一個臨界點,目前在具身智能或者機器人AI這個領域,當下大家還覺得機器人有點笨拙,只能干一些固定的活,但我個人比較樂觀。再過三四年,不會超過五年,比如在工業(yè)或服務業(yè),能有終端產品出現。

機器人需要更高級功能

NBD:近期人形機器人火熱至極,但公司早期也不看好人形機器人,請問宇樹是怎樣調整發(fā)展戰(zhàn)略的?

王興興:2020年以前就有很多投資人問我,你們做不做人形機器人,我非常斬釘截鐵地說不做,但為什么2023年初又開始做人形機器人了?其實最早在2009年和2010年,我自己做過小的仿生人形機器人,當時遠沒有達到我的預期,最大原因是當時全球人形機器人的控制技術不是特別理想,性能上不去,沒辦法看到實用價值,當時我就堅持不做人形機器人。

到了2021年、2022年,全球科技對人形機器人非常關注,并且在2022年底大語言模型出來以后,AI技術產生了質變,已經看到AI賦能機器人帶來的潛力。大家可能想象不到,2022年底,我們還沒做人形機器人,但已經有一些客戶找上我們想買人形機器人。我覺得社會的共識、熱度,客戶對它的期待程度,已經足夠了,所以我們2023年開始正式做人形機器人。

我們一直希望公司的商業(yè)化進程能夠保持積極正向,確保我們的產品受到市場的歡迎和社會的認可。當年選擇做四足機器人,是因為行業(yè)已經初現端倪,而現在選擇進軍人形機器人領域也是基于相似的市場洞察。

NBD:從目前人形機器人的研發(fā)來看,大模型可重點解決哪些技術問題?主要應用在哪些方向?大模型和人工智能的應用有望降低研發(fā)成本嗎?

王興興:目前大家說大模型,一般在說大語言模型或者多模態(tài)模型,實際上這部分是可以給機器人用的,2023年我們就結合了OpenAI的大語言模型接口,但實際上大語言模型本身是機器人模型的一部分,并不是全部。

比如跟機器人溝通的時候,肯定需要語言部分,但實際上我個人認為機器人的AI模型,本質上和語言模型還是有很大區(qū)別。舉個最直觀的例子,在工廠里工作的機器人,其實并不需要具備語音功能。只要它能夠完成任務,進行工作就足夠了。

機器人具身智能的核心在于其執(zhí)行任務的能力,而不僅僅是對話。手機已經可以完成簡單的對話任務,因此機器人需要更高級的功能。然而,這部分的訓練其實與大語言模型關系不大,更多地依賴于模仿學習。此外,該模型的結構與大語言模型的結構也存在較大差異。這是目前大家已經看到的方向了,但是整個體系沒有大語言模型那么成熟。

在機器人具身智能領域,每家公司的想法都不太一樣,技術路線和共性都不太一樣,這就導致了其實很難評價發(fā)展路徑,是正確還是錯誤。舉個最簡單的例子,在大語言模型圈,ChatGPT模型出來以前,就有非常多語言模型結構,但大家現在已經忘了,因為發(fā)現GPT模型的架構更有價值?,F在人形機器人具生智能有點像ChatGPT出來的前一兩年,大家已經發(fā)現了這個方向,要往這個方向做,但還沒有哪家敢說自己的方向絕對正確。

責任編輯: 陳勇洲
聲明:證券時報力求信息真實、準確,文章提及內容僅供參考,不構成實質性投資建議,據此操作風險自擔
下載“證券時報”官方APP,或關注官方微信公眾號,即可隨時了解股市動態(tài),洞察政策信息,把握財富機會。
網友評論
登錄后可以發(fā)言
發(fā)送
網友評論僅供其表達個人看法,并不表明證券時報立場
暫無評論
為你推薦
時報熱榜
換一換
    熱點視頻
    換一換