文|偲睿洞察 Renee
編輯|孫越
2023,機器人這一浪漫主義產(chǎn)物在東八區(qū)、西八區(qū),再次火爆。
東八區(qū),是供應(yīng)商們紛紛在階段性presentation——WAIC大會上秀肌肉,拿捏住80%群眾的眼球與攝像頭:
西八區(qū),是兩位風(fēng)云人物為人形機器人站臺:英偉達創(chuàng)始人兼首席執(zhí)行官黃仁勛直言,AI下一個浪潮就將是具身智能;馬斯克表示,通用型AI算法支持的機器人是特斯拉未來長期價值所在。
如果要追究“2023年XX股價暴漲,XX行業(yè)爆火”的導(dǎo)火索,十有八九是因為ChatGPT,人形機器人也不例外。ChatGPT來臨后,市場情緒高漲:“人形機器人歷經(jīng)近百年,ChatGPT 有望引爆技術(shù)奇點”等說法層出不窮。
在“人形機器人+大模型”這一命題上,各個AI廠商、人形機器人廠商的執(zhí)行力出乎意料:
3月,微軟在其官網(wǎng)發(fā)表了一篇名為《機器人 ChatGPT:設(shè)計原則和模型能力》論文,給出“通過ChatGPT實現(xiàn)用人類語言控制機器人”的現(xiàn)實路徑;
(機器人與人類自然語言交互 圖源:開源證券)
4月,AI公司Levatas與波士頓動力合作,將ChatGPT和谷歌的語音合成技術(shù)接入Spot機器狗,成功實現(xiàn)與人類的交互。
本文試圖探究,人形機器人近百年來,為何沒有所謂的“奇點”?這近百年沉寂的“死水”,ChatGPT要如何打破?
01 1495年,命運的齒輪開始轉(zhuǎn)動
1504年,達芬奇畫筆下的《蒙娜麗莎的微笑》,被視為“以人為本”意識覺醒的標志,自此,人類開始自我欣賞,走上尋找自我價值的漫長征途。
而出人意料的是,機器人的“覺醒”,來得更早些。在1495年,達芬奇便已提交了關(guān)于機器人主題的畫稿:一個靠風(fēng)能和水力驅(qū)動的“機器武士”。
在這之后的400多年,關(guān)于人形機器人的探索從未停止。
憑借著一腔熱血和為人形機器人“千千萬萬遍”的韌勁,1927年,美國西屋公司推出“Televox”:不能走動,但可以抬起接收器以接聽電話,并根據(jù)接收到的信號通過操作開關(guān)來控制簡單的動作,此外其還能回答一些問題。
(世界上第一臺人形機器人“Televox” 圖源:國盛證券研究所)
10年過后,西屋公司在此基礎(chǔ)上制造出“摩托人Elektro”,被認為是真正的第一個類人機器人,如此論斷,或許是因為它會抽煙?
在1939年的世博會上,摩托人Elektro接到煙之后,像人類一樣嘬了幾口,但遺憾的是,它并不會“吐氣”,煙霧只能從頭顱里散發(fā)出來。
(摩托人Elektro 圖源:國盛證券研究所)
又經(jīng)過半個世紀的“調(diào)教”,人形機器人不再是藝術(shù)品里的天馬行空,或是科技展會里的“喜劇秀”,開始“腳踏實地”起來。
1972年,早稻田大學(xué)孵化出ASIMO,世界上第一個真正意義上的人形機器人誕生(能走動能說話)。2000年,第一代ASIMO能“拉呱”和“搬磚”,到十幾年后的第七代,ASIMO已經(jīng)具備了類似人類的步行方式,能以將近9公里的時速奔跑和倒行,也能擰杯蓋和倒水。
(ASIMO 多代參數(shù)比較 圖源:廣發(fā)證券)
緊接著,人形機器人故事的主角紛紛涌現(xiàn):其中不得不提的,便是現(xiàn)階段花活最多的波士頓機器人。
(Atlas機器人發(fā)展歷程 圖源:海通國際)
Atlas原型機最早于2009年亮相,Atlas多年以來,主打一個“體育生”人設(shè),秀肌肉,秀技能:
2013年7月11日向公眾正式公開。Atlas機器人身高188cm,體重150kg,其設(shè)計目的是為了搜索和救援任務(wù)。
2018年,波士頓動力進一步對機器人進行優(yōu)化設(shè)計,最新身高1.5m,體重80kg,全身具有28個關(guān)節(jié),速度能達到1.5m/s,能完成快速小跑、三級跳、后空翻和空中體操等一系列復(fù)雜動作。
本以為,人形機器人會一路高歌,而2022年卻帶來了一個好消息和一個壞消息,讓整個人形機器人行業(yè)“撲朔迷離”。
壞消息是,“一代梟雄”退出歷史舞臺,商業(yè)化落地的大坑,無人幸免:2022年3月31日,在本田汽車公司的東京總部,仿人機器人ASIMO正式宣布退役,結(jié)束了長達22年的職業(yè)生涯。
好消息是,多個科技大廠跨界奔赴而來,“壁壘高筑”成為歷史:2022年,特斯拉推出人形機器人“擎天柱”、小米發(fā)布全棧自研人形機器人“CyberOne”、亞馬遜注資機器人“Digit”······
好運延續(xù)到了2023年,這半年,原生賽道選手動作頻頻:
1月31日,Walker機器人的優(yōu)必選正式向港交所遞交招股說明書;
7月6日,傅利葉智能在2023世界人工智能大會上發(fā)布首款GR-1通用人形機器人;
但從WAIC的展會來看,人形機器人仍然令人心生敬畏:
在機器人展區(qū),僅有傅利葉的下肢康復(fù)機器人,云深處的絕影等四足機器人能夠?qū)a(chǎn)品搬到展會并進行演示,特斯拉的人形機器人模型“束之高閣”,達闥陳列了各式各樣職業(yè)的人形機器人模型······
1495年開始,人形機器人命運的齒輪開始轉(zhuǎn)動。以下是現(xiàn)如今,人形機器人廠商,給出的階段性成果:
(典型的人形機器人 圖源:廣發(fā)證券)
500多年過去,基于成本、續(xù)航等難題,人形機器人仍未成功“落戶”。
02 人形,究竟有多難?
機器人想要成“人”的成本,是精英的千千萬萬倍。
將一個真正的人培養(yǎng)至大學(xué)畢業(yè),時間成本是23年,其金錢成本按知乎博主三笛規(guī)劃測算,低配版至少要花70萬,高配版要花費966萬。
而僅僅是要為6歲WALKER進行4次迭代,“家長”優(yōu)必選的代價是,近25億元的投入(按照優(yōu)必選披露的最低數(shù)據(jù)測算,近年來優(yōu)必選科技的研發(fā)開支分別達到2020年4.288億元、2021年5.171億元和2022年前9個月3.247億元)
如此費錢的根源是,人形機器人需要集“運動健將、智多星、導(dǎo)航助手”三大“完美人設(shè)”于一身,即在運動模塊、傳感模塊和人工智能模塊都要駕輕就熟。
而其他機器人的“KPI”往往只有一項:工業(yè)機器人的能力,取決于其“肌肉個數(shù)”,即主要側(cè)重于運動控制技術(shù);掃地機器人的能力,取決于其能否成功規(guī)避障礙物,把全屋打掃干凈,即側(cè)重于導(dǎo)航傳感技術(shù)。
所以,人形機器人的這一“完美人設(shè)”背后,需要大把銀兩去維護:今年6月,天風(fēng)證券的一份專家紀要顯示,目前國內(nèi)單臺人形機器人生產(chǎn)成本在70-100萬元。
一個自然而然的問題是,如何降本?難題多的是,目標得先行。國內(nèi)外皆有廠商,給出自己的schedule:根據(jù)優(yōu)必選預(yù)測,在2030年,人形機器人將降本70%-80%至2-3萬美元。特斯拉的Flag更為激進:3-5年之內(nèi),降到2萬美元。
基于特斯拉數(shù)據(jù)與自身測算,開源證券給出了降本的方向與空間:對比當前時點和終局狀態(tài)下 BOM 表拆解,線性關(guān)節(jié)和靈巧手的降本空間最大。
可以看到在核心環(huán)節(jié),技術(shù)壁壘較高,國產(chǎn)化率較低,供應(yīng)鏈話語權(quán)堪憂。尤其是諧波減速器,其技術(shù)迭代幾近停滯,同時日本哈默納科一家獨大,短期之內(nèi),國產(chǎn)廠商難以突破,現(xiàn)階段國產(chǎn)廠商正布局機電一體化,以期提高工業(yè)機器人等自動化設(shè)備的靈活性。
技術(shù)降本,荊棘重重,故現(xiàn)階段廠商用產(chǎn)能擴張規(guī)模化,來講述降本的故事:
優(yōu)必選的降本規(guī)劃,便是基于產(chǎn)能擴張規(guī)模化來測算的,同時其相關(guān)負責(zé)人表示,國產(chǎn)人形機器人的降本,受益于行業(yè)應(yīng)用擴展的規(guī)模化量產(chǎn)和國產(chǎn)供應(yīng)鏈的成本優(yōu)勢,同時也可通過改進制造工藝、采用更魯棒運動控制算法降低對硬件精確度、硬件指標要求來實現(xiàn)。
(優(yōu)必選對人形機器人成本預(yù)測 圖源:開源證券)
這更為考驗國產(chǎn)廠商的量產(chǎn)能力與供應(yīng)鏈管理能力。除此之外,眼下還有一大障礙是,人形機器人的續(xù)航問題。
據(jù)優(yōu)必選向偲睿洞察透露,目前其產(chǎn)品Walker在充滿電的情況下,續(xù)航時間大約在兩小時左右,而這已然是前幾名的成績。
機器人巨大的耗電量實際上主要來自于關(guān)節(jié)部位,伺服驅(qū)動器是最主要的耗電單元,而它的耗電量又與效率有關(guān)。對此,優(yōu)必選給出的解決方案是:通過優(yōu)化“單個伺服舵機的驅(qū)動方式、機器人直立行走的算法、手眼協(xié)調(diào)的算法”,從而大幅降低機器人在運動狀態(tài)下的耗電量。
以上,還是沒有計算進階版“大腦”和“眼睛”的顯性成本與困境。基于現(xiàn)狀,無論是科技大廠還是原生選手,皆選擇面向TO B,等待蛻變。
Tesla bot最新一批“打工人”大概率將去造車,奔赴超級工廠;
據(jù)傅利葉智能7月12日發(fā)布會顯示,其未來將繼續(xù)深耕醫(yī)療場景,在陪護/照護/康復(fù)等細分領(lǐng)域注力,同時邁向生產(chǎn)制造、科技展館/演出等B端場景;
優(yōu)必選已然在科研開發(fā)和科技展館、政企展廳等落地,同時近期的一系列動作,也圍繞著新能源汽車、3C電子等相關(guān)工業(yè)場景。
人形,難在核心部件技術(shù)壁壘高企,降本依靠量產(chǎn)規(guī)模;難在續(xù)航在兩小時左右,工作效率遠比不上打工人;更難在集“運動健將、智多星、導(dǎo)航助手”于一身······
03 成年人的戰(zhàn)爭,只會更加激烈
業(yè)內(nèi)專家認為,人形機器人對本體制造商的考驗,在以下三個方面:整機集成能力、運動控制算法軟件開發(fā)能力、AI布局。
AI布局,也就是大腦層面,成為現(xiàn)階段最大的變數(shù):
先前在“大腦”層面,幾乎沒有什么水花,各家推出的模型,能動的基本只能倒倒水、搬搬快遞;而現(xiàn)階段,ChatGPT來臨之后,人形機器人的“大腦”,終于迎來質(zhì)變的可能性。
微軟已給出“通過ChatGPT實現(xiàn)用人類語言控制機器人”的現(xiàn)實路徑:
首先,由于機器人是個多元化領(lǐng)域,在微軟的操作框架下,不同機器人都有自己對應(yīng)的特定函數(shù)庫。這些函數(shù)庫,可以理解為中控,能夠連接機器人控制系統(tǒng)進行底層硬件的管理,以及執(zhí)行基本運動的代碼和功能模塊。
然后,為了讓ChatGPT能遵循函數(shù)庫的規(guī)則,需要清晰的預(yù)定義函數(shù)命名。清晰的函數(shù)名,能讓各API之間建立良好的功能連接,最終生成高質(zhì)量的回答。
最終,在設(shè)計好庫和API后,用戶給ChatGPT編寫了一個文本提示(prompt),描述目標任務(wù),并明確說明函數(shù)庫中哪些函數(shù)可用,就可以控制機器人去執(zhí)行任務(wù)。
(機器人與人類自然語言交互 圖源:開源證券)
ChatGPT的利好,還在持續(xù)進行中:一個具體案例是,近日已經(jīng)有開發(fā)人員將GPT-4與目標檢測網(wǎng)絡(luò)結(jié)合,實時捕獲攝像頭中的物體進行分析并執(zhí)行人類指令。
當詢問GPT-4開發(fā)人員手中是什么物體時,GPT-4能識別出健怡可口可樂,然后繼續(xù)提問可樂的卡路里,GPT-4也能做出回答;GPT-4還能識別出攝像頭中的牙刷,然后還能按要求在網(wǎng)上找到牙刷的購買鏈接。
(向GPT-4提問攝像頭中的信息 圖源:杳杳寒山道)
這也就意味著,人形機器人的心智很快要脫離稚嫩,“成年人”的戰(zhàn)爭,只會更加激烈。
那么,誰會先碰掉那條終點的紅線?整機集成能力、運動控制算法軟件開發(fā)能力(下文簡稱控制能力)、AI布局是三大參考標尺。
以特斯拉為代表的車企跨界選手,在AI布局上,有著天然優(yōu)勢:
特斯拉FSD視覺感知算法可以在機器人上復(fù)用,并以智駕領(lǐng)域積累的Know-How進行賦能,同時還有FSD V12、Dojo超算落地,這將大幅提升AI訓(xùn)練速度;
同時,自有工廠創(chuàng)造應(yīng)用場景,以機器學(xué)習(xí)+大量數(shù)據(jù)的方式,在真實的場景不斷訓(xùn)練-優(yōu)化機器人。
除此之外,在供應(yīng)鏈上,特斯拉有著充足話語權(quán)。據(jù)開源證券表示,特斯拉機器人軸承、齒輪箱、滾珠絲杠、電機等部件可直接復(fù)用特斯拉汽車成熟的供應(yīng)鏈。
這是因為,特斯拉機器人關(guān)節(jié)執(zhí)行器采用的零部件種類和現(xiàn)有的工業(yè)機器人基本一致,同時,由于沒有像工業(yè)機器人一樣對實現(xiàn)高速運動的要求,還一定程度上降低了生產(chǎn)難度。
換言之,特斯拉只需根據(jù)人形機器人的特點對零部件進行調(diào)整修改就可以進行標準化的大批量生產(chǎn)。
以優(yōu)必選、傅利葉為代表的原生賽道選手,在整機集成能力、控制能力上把握更多的“Know-How”,而在AI布局上,略有欠缺,現(xiàn)階段也在努力查漏補缺:
優(yōu)必選透露,其已經(jīng)嘗試在人形機器人上導(dǎo)入具身多模態(tài)語言大模型提升語音交互,靈巧自主操作,足式機器人環(huán)境認知學(xué)習(xí)與自主導(dǎo)航能力。
傅利葉創(chuàng)始人顧捷表示,其正在與高校或者其他 AI 團隊深度合作,構(gòu)建商業(yè)化智能 AI 大模型的能力;
跨界選手追覓,在控制能力上積累了不少導(dǎo)航模塊的經(jīng)驗:據(jù)其透露,其在運控算法、導(dǎo)航算法、視覺與AI算法等方面有著持續(xù)儲備優(yōu)勢。
當ChatGPT強勢入局之后,人形機器人將邁入成年人的賽道。
成年“人”的世界,無疑會更加激烈:在整機集成能力、控制能力、AI能力這三大維度上,大家各有優(yōu)勢,沒有誰是絕對的贏家。但,成年人也更懂如何合力,如以上企業(yè)所做的,聯(lián)合多方力量,奔赴云和月。
至于還有幾千里,得看大模型們能否將“大腦”訓(xùn)練明白,滿足人們對人形機器人最基礎(chǔ)的要求:其既是博士生,能進行日常、專業(yè)的對話,也是“跑腿”的,能完美馴服四肢,拿快遞掃地倒垃圾······