界面新聞記者 | 李如嘉
界面新聞編輯 | 宋佳楠
近日,自動駕駛公司元戎啟行公布了一輪約一億美金的C1戰略融資,由國內某頭部主機廠獨家投資。元戎啟行表示,本輪融資將用于夯實國內量產項目,拓展海外業務,同時為探索Robotaxi(無人駕駛出租車)商業化運營和布局VLA(視覺語言動作模型)等前沿技術提供資金支撐。
雖然元戎啟行并沒有公布該主機廠的名字,但據界面新聞了解,本輪融資為長城汽車集團獨家投資。今年一季度,元戎啟行依靠端到端輔助駕駛方案成為長城供應商,而今年8月發布的長城新藍山上,已搭載了由元戎啟行提供的智駕方案。
包括C1輪在內,元戎啟行已完成6輪融資,累計融資金額超5億美元,股東包括復星銳正、云啟資本、阿里巴巴、耀途資本和東風資產等。
最近兩年,智能駕駛賽道融資進入冷靜期,融資金額和數量都有所降低,但今年以來,一波小熱潮悄然出現,不少智駕公司都宣布了新的融資。
在接受界面新聞專訪時,元戎啟行副總裁、技術合伙人劉軒表示,促成本次融資的主要因素之一是“元戎啟行更具有AI基因”。
“現在的資本對于人工智能成分更高的行業和場景會更加青睞。”劉軒說,大語言模型熱潮涌現后,市場普遍認為人工智能能力的提升,會對產品落地的形態帶來革命性的影響,在智能駕駛領域也是如此。
據他所述,元戎啟行是國內較早布局“無圖”方案、端到端模型的智能駕駛企業。目前,公司已成功將端到端模型應用上車,成為國內少有能提供城區NOA(自動輔助導航駕駛)并實現量產的企業。
劉軒進一步解釋稱,以往在智能駕駛領域,搭載高精地圖、采用規則驅動方案的企業獲得的投資會比較多,但現在業內越來越多人認為,采用端到端技術、利用深度神經網絡才能更好地實現自動駕駛大規模鋪開,從而用更低的成本,做出性能更好的產品,實現商業閉環。
智能駕駛賽道目前已經進入淘汰洗牌期。在劉軒看來,未來行業會進一步整合,能夠留下來的公司首先需要技術能力夠強、不斷做技術創新,并且對技術的預判力要好,是引領者而不是跟隨者的角色;其次是能夠做到商業閉環,有自我造血的能力,這里面最重要的是能夠量產,讓消費者去為產品買單。
他判斷,屆時能夠在高階智駕領域留下的玩家不會太多,大概只有兩三家。新的玩家事實上已經很難再進入賽道的第一梯隊,這不僅需要其技術能力夠強,也要車企愿意“賭一個可能性”,去培養一個新的供應商,在中國市場這么卷的情況下是尤其難的。
本次元戎拿到的投資來自于頭部主機廠,這不僅令其有了資金彈藥,也會獲得相應的車企項目支持。
目前,元戎啟行的高階智駕平臺DeepRoute IO已成功搭載上車,與車企共同打造的量產車已超20000臺。預計到2024年底,至少會有三款搭載元戎啟行智能駕駛系統的車輛進入消費者市場。同時,該公司也在積極推進與多家主流車企的十余款智能汽車的量產合作。
劉軒指出,現階段公司與車企的合作質量,一個是看定點數量,每個定點都會有相應開發費,但更重要的是看定點銷量。方案商的穩定和高質量收入,其實來源于每賣出一輛車所產生的車輛授權費。定點數量多并不代表銷量高,而且多個項目也會讓業務和人員更加分散,所以智能駕駛方案商更希望能在一個定點做出“爆款車”,這樣也可以拿到更多數據來訓練模型。
高階智駕量產的最大挑戰在于,要讓上千臺、上萬臺車在全國都能順暢行駛,性能上要求具備統一性,并且足夠安全。為了做到這點,需要大量的極限泛化測試。
據界面新聞了解,元戎啟行在實現量產項目的幾個月時間里,在全國大小城市、鄉村的各種天氣條件下都進行了測試。其中,CTO曹通易還帶隊做了許多極限測試,例如從河北一路智駕到成都,在懸崖路段進行測試等。當積累了這些優質數據后,技術的迭代速度變得更快。
如何讓量產交付符合汽車行業傳統的安全生產流程和標準也是一個挑戰,因為汽車行業歷史已久,有著成熟且嚴格的安全標準。但人工智能行業與其存在諸多不同,如果完全按照以前的流程是無法保證交付速度和效率的。方案商需要和車企深度合作,探索一套新的,既能夠保證安全性,又能做到快速量產交付的流程。
元戎啟行第一個量產項目花了八個月,第二個縮短至五個月。劉軒表示,未來項目的周期會更短。
量產之外,其在技術上也有新進展。今年9月,元戎啟行CEO周光提出,基于英偉達Thor芯片,公司進行了VLA模型的研發,預計將于2025年正式推出。通過VLA模型,智能駕駛系統擁有更高階的思考能力,能夠理解交通場景中復雜的交互事件、隱藏的語義信息和邏輯推理。
“我們也可以稱VLA模型是元戎的端到端2.0模型?!眲④幷f,現階段的端到端1.0仍然面臨幾個問題,一個是模型的可解釋性會比較差,依然是一個黑盒狀態,無法解釋駕駛決策邏輯,且存在一定幻覺。此外,碰到潮汐車道、限行時段等罕見路標、邊緣場景難以用常識理解讀懂,這種情況下很難推理出好的駕駛決策。
而VLA具有場景理解能力,能通過語音、文字形式,對自己的駕駛行為和推理進行描述,并采用多模態訓練,除了視頻數據訓練,還引入了語言模態訓練、行為模態訓練。VLA模型可以通過預訓練的方式,從大量的未批注數據中進行訓練,學習語料的通用特征,擁有更多常識。傳統的規則式架構只能預測1、2秒之后的物體運動,目前的端到端1.0大概只能推理到7秒以后。一旦VLA上車,元戎啟行認為其可以推理到物體幾十秒或者1分鐘以后的物體運動。
劉軒告訴界面新聞,作為融合了視覺、語言和動作的多模態模型,VLA模型可提高模型的泛化能力和判斷推理能力。不僅限于汽車,VLA還能移植到機器人等更多載體上,實現物理世界的通用人工智能。
而VLA的實現離不開數據的澆灌。周光曾經提到,一個智駕公司至少要交付上萬臺的車輛,才能做端到端1.0,而如果想要做到一個模塊的VLA架構,需要10萬臺級的量產車。
元戎啟行預計,在今年年底,其交付到用戶手中的量產車會超過3萬臺,而明年能夠達到20萬臺的目標。隨著高階智駕、端到端的芯片量產,高階智駕的成本還有可能進一步下探,明后年,就可以覆蓋到15萬元以上的車型,這也會加速銷量的提升。
未來,該公司計劃用端到端系統走出兩條商業化落地路徑,第一條是量產業務,跟車企深度合作,將端到端模型應用上車,共同開發智能駕駛車輛;第二條是以開放的態度,基于端到端模型、量產車,去跟車企或第三方運營商平臺合作實現Robotaxi的規?;\營。
“傳統基于高精地圖和規則式的Robotaxi是很難回本的?!眲④幈硎?,高精地圖要定期維護,車輛上也需要搭載昂貴的傳感器。未來,搭載“無圖”端到端模型,用面向用戶的乘用量產車打造的Robotaxi在時間和經濟成本上更具優勢,可以實現全域打車,更有助于市場普及和加快Robotaxi的落地進程。