文| IT時報記者 沈毅斌
編輯|孫妍
“桌面有點亂,你幫忙清理一下。”
“好的,正在為您清理桌面。”
聽到指令后,“青龍”一邊回答一邊緩緩抬起雙臂,用雙手緩慢且輕柔地抓起桌面上混合擺放的面包和水果,分類放進左右兩個籃筐內,即使是柔軟的面包,也不會變形。在人形機器人與具身智能發展論壇上展示的這款“青龍”人形智能機器人不僅擁有識別認知能力,185厘米的身高和80公斤的體重,放在機器人界也是妥妥的“型男”一枚。
從國內外眾多機器人企業“大秀肌肉”展出的“十八金剛”,到各種論壇暢想著機器人的發展前景,人形機器人、具身智能成為2024世界人工智能大會(WAIC 2024)當之無愧的“頂流”。主辦方數據顯示,本屆大會合計展出的人形機器人超過25款。火熱的人形機器人賽道,正在迎來商業化蝶變的關鍵時刻。
但冷靜下來思考,人形機器人的發展依舊面臨諸多挑戰,上海人形機器人制造業創新中心首席科學家江磊表示,人形機器人當前面臨的問題可以總結為“一高五難”,硬件門檻高、軟件算法難、軟硬解耦難、知識積累難、人才聚集難、安全應用難。
人形機器人與具身智能目前發展現狀如何?何時能夠商業化落地?怎樣讓人形機器人遵循“機器人三大定律”?帶著這些問題,走進WAIC 2024的人形機器人“世界”。
人形機器人應該“論斤賣”
人形機器人由控制器、傳感器、精密減速器、交流伺服電機等核心零部件組成,每一個部件都需要不菲的成本。
根據Macquarie Research在2023年發布的報告,人形機器人的硬件總成本目前約為5萬美元。其中,端到端AI軟件大腦、傳感器與芯片、伺服電機與電機驅動器都各需要1萬美元,慣性測量單元與扭矩傳感器需要5000美元,精密減速器需要8000美元,電池與電池控制系統需要2000美元,其他部件約5000美元。
以色列智能機器人中心主席Yosi Lahad在人形機器人前沿論壇上表示,為了讓人形機器人能夠得到大規模采用,其成本需要降到2萬美元以下,是現在成本的一半以下,甚至可能需要對機器人的外型進行一些改變,例如重新考慮模仿人類腿部的底座設計。而特斯拉預計明年量產的Optimus,預計成本控制在1萬美元左右,預計售價2萬美元。
相比之下,國內人形機器人已經將售價降至10萬元以下,今年5月,宇樹科技發布的最新的人形機器人產品Unitree G1,市場售價僅9.9萬元起。“我們一直認為,人形機器人未來應該像豬肉一樣論斤賣。”宇樹科技聯合創始人陳立在“國際人形機器人技術與應用發展論壇”上表示,拋開研發成本,人形機器人其實是鐵、鋼、銅等材料的堆疊,隨著零部件的量產,成本自然也會隨之降低。
根據《2024年中國人形機器人行業研究報告》,人形機器人按量產規模不同,降本大致可劃分為三個階段:小批量千臺量級生產,降本20%~30%至約10萬美元;萬臺級別降本50%至5萬美元;數十萬至百萬臺大規模量產,降本70%~80%至2萬~3萬美元。一時間,人們感到人形機器人商業落地近在咫尺。
但需要注意的是,Unitree G1與Optimus的區別在于沒有搭載大模型,若按照智能標準來看,特斯拉的Optimus依舊可以作為行業的風向標之一。
成本不僅來自硬件
硬件是人形機器人最直觀的成本,但在降低成本方面不能只依賴于硬件的量產。
“硬件成本降低我認為已經不是主要難題,而是時間問題,設計和研發環節的成本才是人形機器人目前需要突破的成本問題。”聚焦國訊芯微董事長方婷婷在論壇上表示,國內人形機器人領域有許多核心技術依賴國外進口,如人形機器人仿真工具平臺。
從人形機器人軟件形態來說,大量的跨學科內容都需要軟件來融合,需要更多的相關產業企業來抱團。而人形機器人本體廠商也要從設計之初就考慮軟硬件成本。
鑫精誠傳感器董事長吳浩認為集成化也是降低人形機器人成本的方式之一,比如在靈巧手方面,人類的手指可以感受溫度、力度等,人形機器人的傳感器也可以借鑒,將多模態的感受集成在同一零部件上,這樣既能降低成本,也能減少體積。
人形機器人會在哪些應用場景爆發?B端場景下,開普勒CEO胡德波認為,第一類是工業場景,尤其是重工業,工人的安全得不到保障,用人成本高,適合用人形機器人替代;第二類是倉儲物流場景,可能是最快實現落地的場景之一;第三類是制造業,如3C制造、汽車制造等。業內人士對C端場景的應用已經達成共識,人形機器人將走進千家萬戶,賦能養老育兒場景。
據高盛最新預測,人形機器人到2035年將呈爆發式增長,出貨量將達到140萬臺,全球市場總規模(TAM)達380億美元。全球從事物流和制造業的人形機器人將在2030年左右達到100萬臺,人形機器人有望在十年內走入服務、家庭護理、健康和教育產業。
5~10年迎來大突破
如今的人工智能如同一顆封在瓶子中的“大腦”,雖然會計算、思考,卻不能付諸行動。具身智能是一種智能系統或機器通過感知交互與環境進行實時互動的能力,通俗的理解是為人工智能打造一款可操控的身體,包括四足機器狗、工業機器人、動物仿生機器人、自動駕駛汽車等多種形態,但人形機器人的類人形態,可以更貼合人們的互動需求,無疑是具身智能的最佳載體。
中國工程院外籍院士張建偉在人形機器人與具身智能發展論壇上表示,實現具身智能需要完成三個維度的突破,即空間維度,在開放式、復雜、動態的空間環境下,實現二維、三維動態語義建模;時間維度,除了簡單移動外,還要同時具備操作和使用工具的能力;交互能力,讓機器人基于知識和人、環境做出正確的交互行為。這其中依賴的便是AI大模型。
僅靠大模型進行感知、策劃還不能讓具身實現真正智能,加入“小腦”才能進行動作執行。
以“青龍”為例,名為“朱雀”的具身大腦以多模態大模型為核心,通過文字信息、圖像信息作為輸入,輸出語音交互以及任務決策信息。“玄武”小腦模型則是具體任務執行模型,軌跡規劃模塊由端到端模仿學習所驅動,以人類的作業作為模仿對象,進行機載視覺輸入,并輸出人們所期待的行動軌跡。運動控制器則基于強化學習的智能運動控制方法和全身動力學的模型預測控制方法兩條技術路徑,通過環境信息以及機器人的狀態,完成任務執行。
盡管AI大模型開始“移植”到具身智能上,但效果并不算理想。“青龍”機器人平臺技術負責人梁振杰坦言,目前,模型還處于發展的初期階段,功能尚不完善,能力仍需提升。
宇樹科技CEO王興興在論壇中表示,目前大語言模型、多模態模型對整個世界的理解其實是非常糟糕的,包括時間、時空、物理定律等方面的理解。世界模型+具身智能才是通向AGI的最佳路徑。
上海人工智能實驗室主任、首席科學家周伯文也認為,具身智能不只是大模型加機器人的應用,而是需要根據物理世界的反饋及時進化的大模型。
不過,對于人形機器人和具身智能未來的發展,業內依舊持積極開放態度。“未來5年肯定有很大的技術突破,絕對不會超過10年。”王興興預測道。國家地方共建人形機器人創新中心總經理許彬也表示,會把相關的人形機器人的全棧技術,包括大腦、小腦、肢體的相關技術全部開源。通過5年~10年,在人類的家政服務、交流陪護領域進行更多應用。
規模化數據是最大痛點
數據無論是對人工智能,還是具身智能而言,都是靈魂般的存在。目前,人形機器人主要數據來源是國外的開源數據,以及研發機構通過動作捕捉、視覺捕捉等方式自行采集。
但自行采集往往需要大量的人力成本,去不斷模擬演示。北京大學助理教授、銀河具身智能聯合實驗室主任王鶴在人形機器人與具身智能發展論壇上舉例道,把電池放到盒子里這樣一個對于人類而言十分簡單的動作,特斯拉靠40人的采集團隊進行遙操實現,每一個傾斜、橫倒、錯位等所有失效案例都要采集。
“人形機器人規模化數據是整個行業目前最大的痛點。”國家地方共建人形機器人創新中心研發體系總監邢伯陽也同樣表示。
面對這一行業痛點,王鶴認為當下可以真正實現規模化量產的數據就是合成數據。所謂合成數據,是一種通過算法生成的數據,雖與真實數據相似,卻并不直接來源于真實世界。
靠合成數據具身智能實現了從0到1的突破。在銀河通用機器人訓練時發現,二維傳感器存在泛化問題,跳脫出訓練數據便不會處理;三維傳感器又無法識別玻璃等透明物體。最終,靠合成數據進行千萬場景十億抓取的大規模訓練,才實現銀河通用機器人對各種物體的任意抓取。
邢伯陽代表的國家地方共建人形機器人創新中心則主張通過數據開源的方式來共享海量數據。為此打造出Openloong開源社區,通過社區和訓練場創新的機制加速人形機器人、具身智能訓練和數據集構建的工作。
不發展是最大的不安全
人形機器人已不再是科幻小說中的幻想,而是融入日常生活的現實。試想一下,未來人形機器人穿梭于繁華都市的大街小巷,在工廠、醫院等地按照系統指令按部就班,這將改變人們的生活方式和社會結構。而與這一科技進步相伴而來的,是關于人形機器人治理的思考與挑戰。
“高鐵剛進入中國時,許多人擔心電磁波輻射;早期飛機、電話等發明同樣被人們所擔憂。可以說人類的進步史就是對科技發展的擔憂史。我們應該制定一部促進人工智能發展的法律,而不是一部規范人工智能行為的法律。”在人形機器人法治與倫理論壇上中國政法大學副校長時建中表示,面對擔憂不應過度焦慮,要對人工智能采取包容和審慎態度,這體現在訓練數據易獲取、算力與算法鼓勵合作、生成內容容錯并及時糾錯等方面。
聯合國人工智能高級別咨詢機構成員、中國政法大學數據法治研究院教授張凌寒同樣表示,不發展是最大的不安全,要全力促進人工智能的發展。
“它就像一歲半大的孩子,需要我們的正確引導。”華東師范大學人工智能金融學院院長、教授邵怡蕾表示,目前,人形機器人在人工智能的加持下已經具備感知智能和認知智能,最后一座需要攻克的“堡壘”是行為智能。而當人形機器人行為出現在人類社會后,是對人類身份與法律的挑戰,這不僅需要對人形機器人進行身份界定,更需要人類對其行為進行引導和約束。
如何協調機器人與人類之間的互動?阿西莫夫的“機器人三定律”曾經被視為基礎規范。但是,當具身智能時代來臨之際,這樣的“約法三章”已經難以解決人機共生的復雜問題,需要一種新的法律治理架構。
中國海洋大學法學院教授李晟在《東方法學》人形機器人法治專刊中表示,治理架構需要立足于人形機器人與人的差距,考慮當前發展階段的應用問題,而不是關注人形機器人替代人時所產生的未來問題。
排版/ 季嘉穎