界面新聞記者|戈振偉
界面新聞編輯|林騰
“人形機器人必須從‘能跑能跳’轉向‘能工作’,擁有泛化的智能操作能力才是下一代機器人競爭的核心”,智平方創始人兼CEO郭彥東近日在接受界面新聞的采訪時說。
郭彥東是美國普渡大學博士,師從AI領域的美國工程院院士。他曾在微軟美國總部核心AI團隊任職,擔任過小鵬汽車和OPPO的首席科學家與研發高管,曾主導數億臺智能終端的AI研發工作。2023年初,他帶領中美頭部企業及名校背景的團隊創立智平方,目標直指擁有“具身智能大腦”的新一代機器人。
與多數機器人公司不同,智平方選擇了一條“軟硬一體”的路徑。其Alpha Bot系列機器人已進入汽車制造場景,直接對標特斯拉Optimus,并拿下國際車企訂單。
3月6日上午,智平方宣布完成數億元Pre A+輪融資。股東包括清華大學電子系背景基金SEE Fund、清智資本、達晨(國家中小企業發展基金),以及宇樹科技早期領投方敦鴻資本,千億規模的基石資本、頭部雙幣基金云啟資本和產投方國投創盈等。
區域布局上,智平方的選擇頗具代表性:硬件與產業化扎根深圳,AI團隊則設于北京。
“珠三角的供應鏈響應速度與長三角的精密制造各具優勢,但北京在AI人才密度上仍難被超越。”郭彥東坦言。這種“南北協同”模式,和Deepseek“杭州+北京”的資源配置一樣,有利于科研與產業的深度融合,或許正是中國機器人產業換道超車的縮影。 “任何國家的科學家要做具身智能,就得去中國,否則技術很難走出實驗室。”
人形機器人的“實用性”,正成為行業分水嶺。郭彥東認為:當前機器人本體處于“研發成熟、量產爬坡”階段, 2-3年內將迎來平滑上量期。當硬件性能逐漸趨同,智能化將成為下一個戰場。人形機器人進入消費端的“iPhone時刻”,他預測還需5-7年沉淀。
以下為專訪內容,刊發時有所編輯:
界面新聞:宇樹科技等中國機器人公司頻繁引發關注。它們是不是像我們認為的那么優秀?
郭彥東:宇樹科技的突破在于兩點:一是通過本土供應鏈和算法優化,將四足/雙足機器人的運動能力提升至波士頓動力水平,甚至實現部分超越;二是大幅降低成本,這背后是中國供應鏈的支撐。它的核心價值在于推動行業上游關節、驅動、減速器等零部件的國產化進程,為后續量產鋪路。如果說宇樹了不起,背后是我們中國的供應鏈了不起。
中國的機器人供應鏈,植根于消費電子與新能源汽車,又得益于宇樹這樣先行者的牽引,成為了世界上最好的機器人硬件制造的沃土。
但當前行業已進入新階段——機器人需要從“能跑能跳”轉向“能工作”。這一代產品的核心是智能化,即通過大模型賦予機器人自主決策和泛化能力,而這給以“具身智能大腦”為核心競爭力的創業公司帶來廣闊機遇。
界面新聞:人形機器人真正商業化要突破什么?
?郭彥東:從波士頓動力的“炫技型”機器人到特斯拉Optimus的“實用型”機器人,行業邏輯已發生根本轉變。過去機器人比拼運動性能,比如波士頓動力的“后空翻”和“單腿平衡”,但特斯拉Optimus、Figure等新一代機器人公司更強調“實用性”——機器人必須能進工廠、進家庭,成為真正的服務工具。
這意味著兩大挑戰:一是泛化能力,即面對不同任務和環境時,無需重新編程即可自適應調整。其實這也更符合人類進化的過程,首先你能跑能跳,解放上半身,上半身解放出來能干什么,一定要能做操作;二是成本控制,中國在這兩方面具備天然優勢:供應鏈成熟度高,且制造業場景豐富,能為大模型提供海量真實數據。我曾經跟一些頂尖科學家交流,說你們若想做具身智能,就得去中國做,否則你們的技術就很難走出實驗室。
界面新聞:現在整個人形機器人行業里面,不同企業的側重點是什么?
郭彥東:大面上是從上往下做或者從下往上做,只是大家的發力點和優勢不一樣。宇樹科技是特別經典的,從下往上做,做四足、雙足、做平衡,能站穩是它的重點。一般成立時間比較長的機器人公司(因為那個時候沒有大模型),比較容易跟宇樹科技一個思路,但每個公司都有自己的優勢所在。
目前,全球機器人行業正經歷范式轉變:硬件性能逐漸趨同,智能化成為決勝點。深圳培育出運控強、機電強的公司土壤豐厚,但類似我們這樣自研端到端具身大模型公司近年才開始出現,誰能夠把真正的具身大模型做出來,結合深圳的本地硬件優勢,會對行業有最強大的影響力。
界面新聞:如何衡量一家人形機器人公司的真正實力?
郭彥東: 不能只看Demo演示(如疊衣服、搬箱子、翻跟斗),而需關注其是否具備泛化能力。真正的實力體現在三方面:一是技術棧的完整性(硬件+AI+數據閉環);二是商業化落地能力;三是供應鏈把控力。個別公司為炫技采用不成熟技術,反而導致產品無法量產。
界面新聞:智平方是在什么背景下成立的,它在行業中如何定位?
郭彥東:智平方成立于2023年年初,公司以通用具身機器人大腦為核心,軟硬一體,為行業輸出具身智能機器人產品、方案和服務。
我們團隊有“AI+硬件”的雙重基因——我個人曾在美國微軟總部、小鵬汽車、OPPO均擔任過關鍵研發負責人以及高級研發管理職務。核心團隊凝聚了AI、機器人、智能終端規模量產的專家,具備大模型+機器人最需要的復合行業經驗。
智平方的核心競爭力在于自研具身大模型AI2R Brain以及軟硬垂直整合,采用端到端大模型范式,在數據(自有數據積累)、算法(創新模型架構設計)、算力(自有高效模型訓練方法)三大關鍵要素都有原創自主且領先的技術積累。不僅比硅谷頭部公司更早確立端到端VLA的技術范式,更在空間交互精度與零樣本多任務成功率等核心指標上實現大幅超越。2024年,公司作為具身機器人行業唯一的企業,獲全國創新創業大賽初創型企業全國總決賽第二名。
界面新聞:智平方的商業模式有何獨特性??
郭彥東:我們提供軟硬一體化的機器人服務,核心差異化是智能。現階段以機器人Alpha Bot系列為載體,未來賣的不一定是機器人,可能直接按服務收費。例如,工廠為每臺機器人支付“智能操作工時費”,而非一次性購買硬件。這一模式的核心在于,機器人能否通過大模型持續創造價值。
目前,智平方的機器人Alpha Bot與具身大模型AI2R Brain已經在真實場景中完成驗證,尤其在汽車行業直接對標特斯拉擎天柱機器人。獲得國際一線車企、高端制造,以及頭部互聯網大廠的商業訂單并超千萬回款。
界面新聞:除了具身大模型,當前機器人本體產業鏈是不是也還沒有成熟?
郭彥東:我更愿意把成熟拆成研發成熟和量產成熟。因為我從小鵬和OPPO出來,主機廠里面做AI,在公司布局的時候,對零部件的選擇不能選研發不成熟的。很多機器人公司為了炫技選一些研發都不成熟的技術進來,比如科研還在進行中的一些超柔性、仿真電子皮膚等。我們現在這個狀態比較能夠選擇的叫研發成熟、量產不成熟,這是我們的機會。我們的零部件至少有兩家以上的供應商可以選擇,不會被卡脖子。
而量產上沒有百分百成熟,一些零部件的產量并不大,產能有待建設,但隨著需求變大,慢慢能夠到成熟,而且這個變化和變成的過程比較平滑,不會很劇烈。而研發不成熟的產品,硬件零部件若納入到主機里面,就有可能被卡住的,它有很多不確定性。AI眼鏡就被卡過好多年,機器人行業不能犯一樣的錯誤。
界面新聞:所以現在本體就是屬于研發成熟、量產不成熟階段。
郭彥東:可以這么說,但在具身大模型方面,現在的狀態應該叫技術范式開始收斂,這個技術范式叫端到端VLA。
端到端VLA包含兩層核心含義,一是“端到端”,二是“VLA”。首先是"端到端"的數據驅動模式,這對持續提升硬件AI性能至關重要,這一點只有經歷過大規模量產的團隊才能深刻理解,因為在實驗室環境中,DEMO的展示并不需要端到端的方式去訓練。
第二是"VLA"技術,即基于感知-規劃-控制的預訓練模型,這要求團隊具備深厚的AI大模型理解能力。智平方恰巧是一個具備這兩方面能力的團隊。以我們的AI2R Brain為例,作為中國的科研力量,比硅谷的PI和Figure更早推出并應用端到端VLA技術。我們和北大聯合發表的 RoboMamba, 也是在這個方向的一次重要開源嘗試,比硅谷更早發表并開源了具身大模型。
但范式收斂不代表不需要研發了,因為它基于這個范式還有很多調整和適配,包括一些基于這個框架的算法創新,數據的持續獲取,增量學習,訓練加速等等。所以,現在是加大研發和應用最好的時候。
界面新聞: 本體從量產不成熟到成熟,你覺得還需要多久?
郭彥東: 我覺得在量產成熟上,可能整個行業的發展會比我們預想的要快,兩三年的時間,而且它會比較平滑。
界面新聞:要做人形機器人,你覺得中國哪個區域更有優勢?
郭彥東:我們公司總部在深圳,硬件在深圳,產業化在深圳,但我們AI團隊在北京,北京在AI人才方面,確實有明顯的優勢,包括DeepSeek的AI團隊也在那。做硬件的話,當然珠三角和長三角都有相應的優勢。
界面新聞:人形機器人的“iPhone時刻”會是什么時候?
郭彥東:人形機器人時代的“iPhone時刻”要做到to C,就是真正的iPhone時刻,我覺得要5~7年。機器人能夠真正的大規模to B的使用,我覺得3年左右就可以。to C的至少要5~7年。智平方的愿景是讓通用智能機器人像智能汽車和智能手機一樣,成為人人可用的智能終端。我們也在推動這個時刻的到來。