界面新聞記者 | 李如嘉
界面新聞編輯 | 文姝琪
4月2日,智元機(jī)器人公布了兩項(xiàng)新動向。
其一是官宣具身智能領(lǐng)域的國際學(xué)者羅劍嵐近期已正式加入公司,出任首席科學(xué)家并牽頭組建“智元具身智能研究中心”。據(jù)其介紹,智元具身研究中心專注于具身大小腦、空間智能、強(qiáng)化學(xué)習(xí)等方面的研究,覆蓋AI及機(jī)器人核心技術(shù),主導(dǎo)前沿算法研發(fā)與工程化落地。
羅劍嵐畢業(yè)于加州大學(xué)伯克利分校,曾在Google X、Google DeepMind從事研究工作。在伯克利人工智能實(shí)驗(yàn)室(BAIR)擔(dān)任博士后期間,羅劍嵐領(lǐng)導(dǎo)開發(fā)的世界上首個超人類的機(jī)器人真機(jī)強(qiáng)化學(xué)習(xí)系統(tǒng)SERL/HIL-SERL,首次實(shí)現(xiàn)將任務(wù)成功率提升到100%, 在全球范圍內(nèi)被廣泛應(yīng)用。
另外一個動向是智元宣布與國際具身智能公司 Physical Intelligence(Pi)達(dá)成合作伙伴關(guān)系,雙方將圍繞動態(tài)環(huán)境下的長周期復(fù)雜任務(wù),在具身智能領(lǐng)域展開深度技術(shù)合作。這一合作將由羅劍嵐帶頭推進(jìn)。
Pi是去年3月官宣成立的美國明星創(chuàng)業(yè)公司,羅劍嵐博士后研究期間的導(dǎo)師Sergey Levine是聯(lián)合創(chuàng)始人之一。去年11月,這家公司完成了4億美元的A輪融資,融資后估值為20億美元,主要投資者包括亞馬遜創(chuàng)始人貝索斯、OpenAI、Thrive Capital等知名公司或投資機(jī)構(gòu)。
“我們認(rèn)為具身智能的復(fù)雜性讓單一公司很難承擔(dān)全部鏈條,所以我們強(qiáng)調(diào)開放協(xié)同,做效率和資源的合理分布。聯(lián)合外部公司可以互相提供不同的視角和能力?!?/span>羅劍嵐對界面新聞表示。
智元表示,目前與Pi的合作已經(jīng)初具成效,可以實(shí)現(xiàn)一個通用模型根據(jù)不同的指令輸入執(zhí)行多個任務(wù),也可以適配多種末端執(zhí)行器,包括靈巧手、平行夾爪和旋轉(zhuǎn)夾爪,同時可以兼容魚眼和針孔相機(jī)等多種傳感器。
在智元發(fā)布的合作成果視頻中,展示了機(jī)器人在鏡子前戴上圍巾、換垃圾袋,將物品從傳送帶移入物流箱等覆蓋家庭和工業(yè)場景的多元復(fù)雜任務(wù)。
作為具身智能領(lǐng)域的知名學(xué)者,羅劍嵐的工作被評價(jià)為“讓強(qiáng)化學(xué)習(xí)真正跑起來”,推動了強(qiáng)化學(xué)習(xí)在工業(yè)自動化、柔性生產(chǎn)等具身智能場景的落地。
“機(jī)器人領(lǐng)域過去十年的進(jìn)步很多都是受到了其他領(lǐng)域新突破的啟發(fā)產(chǎn)生,比如CV和NLP。順著這個邏輯,現(xiàn)在具身智能的主流路線是大模型和強(qiáng)化學(xué)習(xí)的結(jié)合。”羅劍嵐告訴界面新聞,大模型可以使用大量數(shù)據(jù)對機(jī)器人進(jìn)行預(yù)訓(xùn)練,幫助機(jī)器人有上手機(jī)會,做一些粗略的基本動作。這樣訓(xùn)練出來的機(jī)器人可能有百分之七八十的成功率。強(qiáng)化學(xué)習(xí)則負(fù)責(zé)打磨最后的百分之二三十,最后通過試錯做到最終的完善。
他表示,未來智元可能還會研發(fā)世界模型,根據(jù)云端的模型去預(yù)測下一步環(huán)境會發(fā)生什么。不過羅劍嵐也提到,這些都是工具,具身智能本質(zhì)上需要解決的,是怎樣在開放數(shù)據(jù)鏈構(gòu)建具有魯棒性的策略,感知、預(yù)測、行為生成這一整套機(jī)制的泛化能力才是最核心、最關(guān)鍵的。
羅劍嵐認(rèn)為,現(xiàn)在許多爭議存在的原因都是因?yàn)槿鄙贁?shù)據(jù)。不過樂觀來看,機(jī)器人部署到真實(shí)世界的難度小于智能駕駛,因?yàn)?/span>車在安全性等各方面要求非常嚴(yán)格。而機(jī)器人可以從一些封閉空間、半封閉空間先開始部署。隨著越來越多的機(jī)器人在真實(shí)世界部署,也會有越來越多的真實(shí)數(shù)據(jù)回傳。屆時研究者對于算法會有更好的認(rèn)知,軟件硬件將同步進(jìn)行迭代,最終收斂到幾個方案。
他表示,具身智能的研發(fā)是一項(xiàng)系統(tǒng)性的工程,包括算法、硬件、數(shù)據(jù)和場景等方面都需要聯(lián)合迭代,最終走向通用性,這也是智元布局具身智能全棧的原因。