一個(gè)能夠意識(shí)到失敗的機(jī)器人,或許比一個(gè)永不出錯(cuò)的機(jī)器,更接近AGI(Artificial General Intelligence,通用人工智能)。
在過去的幾天中,第一財(cái)經(jīng)記者近距離看到了多次“失誤”:機(jī)器人鋪床時(shí)意外卡殼、運(yùn)動(dòng)時(shí)突然中斷“抽搐”、操作中出現(xiàn)延遲……但部分機(jī)器人能夠在任務(wù)失敗后,不斷嘗試新的解法——這種由數(shù)據(jù)驅(qū)動(dòng)的閉環(huán)大模型帶來的感知與反復(fù)嘗試能力,恰恰是行業(yè)追逐的技術(shù)亮點(diǎn)。
但圍繞機(jī)器人大模型的分歧也在不斷加劇。有人堅(jiān)持“統(tǒng)一模型直出”,有人選擇分層設(shè)計(jì),算力消耗、延遲表現(xiàn)與落地場(chǎng)景成為博弈焦點(diǎn)。另一方面,機(jī)器人企業(yè)也不斷推出靈活度更高、更便宜的本體或自研核心零部件產(chǎn)品來搶占市場(chǎng)。
現(xiàn)階段,共識(shí)或許并非必須。在模型或本體的局部競(jìng)爭(zhēng)之外,行業(yè)領(lǐng)先者們正搶奪更重要的話語權(quán):誰來制定統(tǒng)一的性能測(cè)評(píng)標(biāo)準(zhǔn)?誰能掌握核心數(shù)據(jù)集的開放權(quán)與主導(dǎo)權(quán)?這些問題的答案或許將直接決定未來的行業(yè)競(jìng)爭(zhēng)格局。
機(jī)器人失敗了,也會(huì)思考了
機(jī)器人正在收拾床鋪,但它的抓夾突然停頓,身體失去了平衡,死死地咬住被子的一角不放開。
在機(jī)器人主動(dòng)嘗試幾次調(diào)整角度也未能找到角度松開抓夾時(shí),許華哲宣告了這次任務(wù)的失敗。他說:“我們的機(jī)器人似乎沒有找到一個(gè)很好的辦法來繼續(xù)完成這次任務(wù),希望大家給他一些時(shí)間,稍后再來觀看?!?/p>
許華哲是清華大學(xué)交叉信息研究院助理教授,同時(shí)也是星海圖的聯(lián)合創(chuàng)始人。第一財(cái)經(jīng)記者在一旁全程觀察到了這次“失敗”,許華哲告訴記者,在具身智能模型發(fā)展初期,這個(gè)狀況發(fā)生非常正常,“就這幾天機(jī)器人的工作情況來看,這種情況的發(fā)生概率不高”。
自變量新發(fā)布的本體。圖片來源:受訪者供圖。
從數(shù)據(jù)環(huán)節(jié),到核心零部件,再到機(jī)器人的本體和大模型,原本強(qiáng)調(diào)單點(diǎn)能力的企業(yè),正在劍指更大的生態(tài)環(huán)節(jié)。
共識(shí)尚未達(dá)成,頭部企業(yè)的野心已經(jīng)顯現(xiàn)?!安煌髽I(yè)在VLA與強(qiáng)化學(xué)習(xí)等技術(shù)路徑上有差異,但這并不是‘二選一’的問題?!笔壮炭毓啥聲?huì)辦公室總經(jīng)理康雨向第一財(cái)經(jīng)記者如是說道。
去年,首程控股參與設(shè)立并管理了規(guī)??傆?jì)100億元的“北京機(jī)器人產(chǎn)業(yè)發(fā)展投資基金”,并且已經(jīng)參與投資了星海圖、自變量、宇樹科技等企業(yè)。在首程控股投資的企業(yè)中,各家的技術(shù)路徑分歧已經(jīng)出現(xiàn),比如星海圖采用的是分層模型,而自變量則堅(jiān)持統(tǒng)一模型直出??涤暌蔡寡裕軜?gòu)是模型的核心與底層問題,“因?yàn)樗苯記Q定未來需要的數(shù)據(jù)量、算法的絲滑程度,以及訓(xùn)練中要消耗多少算力”。
“根據(jù)我們的觀察,幾乎每一家涉及具身智能的公司,都在不斷迭代自己的架構(gòu)。”康雨同意了王興興此前表達(dá)的觀點(diǎn):架構(gòu)決定了后續(xù)的訓(xùn)練成本與效率。她說,一套優(yōu)秀的模型架構(gòu)可能只需極少的數(shù)據(jù)就能完成泛化,而也許能夠成為企業(yè)的核心競(jìng)爭(zhēng)力。
在康雨看來,技術(shù)的優(yōu)勢(shì)不僅關(guān)乎當(dāng)下機(jī)器人的性能表現(xiàn),更決定了企業(yè)未來能否以可控的成本實(shí)現(xiàn)規(guī)?;涞亍?/p>
對(duì)于正處在快速迭代中的機(jī)器人行業(yè)而言,這或許才是真正的分水嶺——跑得快并不難,難的是在長(zhǎng)跑中保持速度與耐力。