文|偲睿洞察 經緯
編輯|孫越
“冬天到了,春天還會遠嗎?”
深陷資本寒冬的自動駕駛業內近期可謂是“冰火兩重天”,重量級的利好與利空頻出。
2022年,由于自動駕駛“長尾問題”難以解決導致應用場景受限、進而導致商業落地困難。投資人失去興趣,融資大幅縮水。據公開資料統計,披露的融資額度由2021年的1591.9億元銳減至205億元,直接縮減至原先的13%,行業進入寒冬。
投資資金一旦停滯不前,人員必然頻繁流動:據鈦媒體App統計,僅2023年上半年,自動駕駛相關的高層人員離職事件就高達16起,其中不乏曾被資本捧在手心里的企業。
在愈發寒冷的2023,如日中天的大模型,憑借解決“長尾問題”以及引發科技奇點的可能,如“冬天里的一把火”,照亮了行業的方向。
此外,大模型的熱度也越來越高,在汽車領域,已經入場的企業紛紛引入大模型,專職大模型的企業也在場外摩拳擦掌:
7月21日,整合了盤古大模型的華為云正式發布自動駕駛開發平臺;緊接著,商湯便宣布其“商湯日日新SenseNova”大模型體系已經形成產業應用實踐,包括商湯絕影最新打造的智能座艙產品和車路云協同交通體系等。
現實是,大模型來了之后,自動駕駛行業僅僅是完成從寒冬到暖冬的轉變。
感知決策型大模型本身的成本問題、硬件要求,以及數算中心網絡通訊問題都會影響其性能的發揮。
換言之,加載大模型后成本直線上升,即使有大模型的加持,自動駕駛依然經濟性有限。
本文試圖探究,在大模型降臨之后,自動駕駛為何還是迎來不了自己的春天?
PART-01 “三九”未過,自動駕駛寒冬依舊
沒有大模型之前,自動駕駛行業可謂是一念天堂,一念地獄。
(自動駕駛等級劃分,圖源:千際投行)
自動駕駛技術按自動化程度可以分為L0至L5共六個等級。其中L0至L2級可以統稱為“輔助駕駛”。
L3級別因為不再需要駕駛員隨時“手腳待命”,汽車本身擁有了環境感知與自主決策的能力,成為了自動駕駛的第一道分水嶺。
L4級別自動駕駛則可以做到真正的“無人駕駛”,不再強制需要人的介入。L5級別則完全不需要人的介入,也沒有地域限制,甚至不會有方向盤等現今常見的汽車操控部件。
百事利為先,自動駕駛最本質的盈利邏輯就是省掉操作員的人工成本。
自動駕駛技術除了搭載在汽車上作為車商的技術附加直接銷售外,主流的商業落地途徑主要有這幾條:物流、環衛、礦山/港口等工業場景,以及無人出租車(Robotaxi)。
其中應用場景最廣,最具商業價值的是Robotaxi。知名華爾街基金經理木頭姐Cathie Wood在今年4月接受CNBC采訪時宣稱:至2030年,Robotaxi可創造8至10萬億美元的收入。
Robotaxi的商業前景引得各方紛紛布局。首先是一波政策“加持”,包括但不限于2022年4月1日發布的《北京市智能網聯汽車政策先行區乘用車無人化道路測試與示范應用管理實施細則》,開啟了國內乘用車無人化運營試點。
有了北京的先例,其他地區地方政府也在紛紛跟進。
2022年6月,深圳發布《深圳經濟特區智能網聯汽車管理條例》;8月,上海發布的《上海市加快智能網聯汽車創新發展實施方案》提到,到2025年,初步建成國內領先的智能網聯車創新發展體系,具備高度自動駕駛功能(L4 級及以上)在限定區域限定場景實現商業化應用。
政府卯足力氣提供政策支持,企業故事不斷,資本再不進場,就晚了。2020年與2021年,自動駕駛行業風頭正盛,各方勢力紛紛進場,一時間企業拿融資拿到手軟。
2020年,自動駕駛產業鏈廠商,紛紛迎來春天的第一場雨:小馬智行就曾獲得由豐田汽車與蔚來資本等資方投資的4.62億美元融資。同年5月和12月,滴滴和文遠知行也相繼宣布完成5億美元融資和2億美元投資······
2021年,毫末智行、圖森未來、斑馬智行、地平線等廠商更受資本寵愛。而誰又能想到短短的一年,凜冬的冰雪,就降落到了自動駕駛的春花之上。投資方態度180°大轉彎的癥結在于,真正意義上的“無人”即L4,很難實現。
接近千億的資本涌入賽道大大加速了各家企業的技術研發測試進程。2021年Waymo路測里程達到410萬英里。同年,北京示范區自動駕駛測試安全行駛近里程達400萬公里。
但是自動駕駛行業的問題在也測試中逐漸顯露:無法真正的無人。
(Robotaxi上的安全員,圖源:小馬智行官方微信公眾號)
即使是走在全國前列的北京亦莊示范區,在L3、L4的正常運行背后,被設置了重重關卡。
在2022年乃至2023年上半年的多次的試點中,基本要求每輛上路運營的Robotaxi內必須設有安全員,以確保自動駕駛系統平穩運行,以及遇到突發狀況時應急干預。
而這種為L3級別自動駕駛設置的安全員門檻極高。其工作性質決定了安全員不僅要駕駛技術一流,可以應付各種緊急情況,而且要對自動駕駛系統有一定了解。因此培養安全員的周期較普通出租車司機更長,成本更高,不具備經濟性。
雖然在2023年7月7日,北京市高級別自動駕駛示范區工作辦公室正式宣布,亦莊開始“車內無人”商業化試點,Robotaxi終于可實現車輛完全自主駕駛,達到了L4級自動駕駛的標準,但是運營中心仍需配備后臺工程師隨時監控。
Robotaxi能在亦莊運行,因為在基礎設施上亦莊下足了功夫。亦莊在建設早期就把高精度的數據地圖列為重點建設項目之一,高度數字化的基礎設施成為了后來Robotaxi的運營保障。但擁有類似亦莊水平的,高精度,高度數字化地圖的地區寥寥無幾。“脫圖”,即不依賴高精度地圖運行的L4自動駕駛商業,落地遙遙無期。也就是說,如今的L4,既需要“后臺有人”,又要在亦莊這一“避魔圈”內運行。
眼見此番不“自由”的自動駕駛,資本紛紛進入了“賢者時間”,開始撤資。一時間眾多自動駕駛企業或資金鏈斷裂,倒閉關停,或節衣縮食,難以為繼。
據偲睿洞察不完全統計,至2022年底,在納斯達克上市的十余家家自動駕駛初創公司,在上市后的平均跌幅超過 80%。
更好落地的無人駕駛卡車(Robotruck)賽道上也同樣“尸橫遍野”。
相比于Robotaxi多涉及的城市場景,Robotruck,尤其是干線運輸多涉及高速場景,道路、路徑狀況較為單一,落地難度上要遠小于Robotaxi。但即便如此,落地依然困難。
美國Robotruck公司Embark股價由巔峰時期的209美元跌至如今的3美元左右。曾官宣在亞利桑那州完成全球首次開放道路全無人駕駛重卡測試,有著“自動駕駛第一股”之稱的圖森未來股價也由最高時期的接近80美元跌至現今的2美元上下。
歸根結底,落地難是因為難以解決自動駕駛大敵“長尾問題”:少部分場景一直未能攻克。
PART-02 “長尾”難“醫”,大模型真乃良藥
前谷歌無人車項目CEO約翰·克拉夫西奇曾表示,谷歌無人車技術已經接近于“走進大眾生活”。但是至今Waymo商業化運營仍困難重重。不僅是Waymo,市場上諸多商家自動駕駛項目都處在“成百步者半九十”的狀態,其原因就是“長尾問題”。
所謂“長尾問題”,其主要表現形式是,自動駕駛測試過程中的場景模擬始終無法覆蓋現實情況。
低頻率、種類極多、且對行車安全造成嚴重影響的“Corner Case”是橫亙在自動駕駛技術門前的一道坎?,F階段各車企的解決方法是“數量取勝”,即通過大量測試,盡可能多的模擬各種情況,以觀察并矯正自家駕駛系統的行為。
但實驗室模擬總有這樣或那樣的問題。卡耐基梅隆大學機器人學習實驗室主任、被譽為“自動駕駛之父”的Sebastian Thrun曾多次發聲:實驗室實驗和真實應用場景認知差異巨大。實驗室環境只能盡量模擬真實環境,卻不能完全模擬真實場景。因此得出的數據和模型的精準度和可信度,在現實環境中可能毫無價值,即使是滿足了100%準確率的實驗,在現實生活中也不一定可行。
即便是實車在真實道路上的訓練和標定,大多數的數據的定位都是單調重復,對策略優化意義不大。在某個城市進行了自動駕駛的成功試驗,也并不意味著經驗可以在另一個城市成功復制。目前模擬測試還是公路測試,都是“窮舉”打法,很難不陷入越努力越心酸的困局。
大模型,給這個已在寒冬中匍匐一年的自動駕駛,遞了一把火。
正如阿里前CEO張勇在今年4月11日阿里云峰會上說:“在AI時代,所有產品都值得用大模型重做一次”。大模型的出現給了自動駕駛企業解決“長尾問題”希望:
當模型參數量達到了一定程度,超過某個臨界值之后,“涌現”現象就會出現:模型的性能會大大超越預期。雖然為什么出現這種現象現階段尚無公論,但這種“量變”到“質變”的過程,為攻克號稱“最后1%”的“長尾問題”帶來了曙光。
(自動駕駛系統的組成部分,圖源:安信證券)
自動駕駛系統主要可以拆解為三個層次:感知層、決策層、控制層?,F階段比較清晰的大模型應用的方向是感知層。
大模型如何應用在感知層面?目前的主流思路是提升數據閉環。所謂數據閉環,即不斷將高價值數據從自動駕駛系統獲取的原始數據中提取出來后,輸送給算法做訓練。整個過程包括對來自傳感器數據進行特征標注、對“長尾數據”特征的挖掘、提取特征后“舉一反三”萃取其他數據、利用這些“長尾數據”進一步訓練算法。大模型的出現可以大大提升數據閉環,加速算法完善進度,以更好地解決各種“Corner Case”。
擁有處理海量數據的能力,大模型便可以在測試自動駕駛系統上限、重建自動駕駛場景上發光發熱,甚至可能搭載在車輛上進行合并檢測小模型、檢測道路物體、進行車道拓撲預測等。
由于大模型卓越的性能,在理想汽車大模型MindGPT發布之后,理想汽車董事長李想就表示,先前一年要做大概1000萬幀的自動駕駛圖像的人工標定,外包公司價格大概6元到8元錢一張,一年成本接近一億元。
而當使用大模型之后,降本將立竿見影:通過訓練的方式進行自動化標定,過去需要用一年做的事情基本上3個小時就能完成,效率是人的1000倍。”如此“神器"自然引得各方爭搶。
7月21日,華為云公有云業務部總裁高江海在“華為云智能駕駛創新峰會&烏蘭察布汽車專區發布會”上宣布,華為云自動駕駛開發平臺正式發布。
據悉,平臺將基于盤古大模型和ModelArts AI開發生產線,提供數據生成、自動標注、模型訓練、數據閉環等一系列能力,幫助車企和商用車企業加速自動駕駛算法的開發驗證和優化迭代?,F如今已在礦用卡車、港口ART、專線物流重卡等商用車場景中應用。
7月25日,光輪智能透露近期完成了“天使+”輪融資。光輪智能CEO,前蔚來汽車高管謝晨表示,光輪智能將在仿真的基礎上融合生成式 AI,以一小部分真實數據為藍本,通過生成式 AI 技術來放大數據量級,并基于自研的 " 端到端真實性評測算法 " 保證數據質量和效能,生成高信息增量的、用于算法訓練的數據。從技術角度來看,大模型確實是“神器”。然而,大模型真的是自動駕駛的“萬靈藥”嗎?
PART-03 和璧隋珠,新技術難入尋常家
大模型,不言自明,其最大的特點就是“大”。龐大的數據體量以及算力要求為其應用帶來了不小的挑戰。
如果將大模型“塞進車里”,首當其沖的便是硬件成本問題。大模型的規模和復雜度也在不斷提高,對硬件設備的要求也越來越高。
大模型需要大量的計算資源來訓練和運行。傳統的CPU、GPU等硬件設備已經無法滿足這種需求。專業為大模型計算設計定制的加速器芯片,如NVIDIA的A100、TPU等將成為硬需求,現實是,現如今僅有一些大廠有A100的存貨。
雪上加霜的是,大模型還需要大容量的存儲設備來存儲訓練數據和模型參數。由于大模型的數據量非常龐大,動輒百億級別數據需要使用高速的SSD硬盤或者NVMe固態硬盤來提高數據的讀寫速度······
硬件的問題將不可避免帶來成本的上升。雖然大模型的推廣可以減少如激光雷達等感受器的數量來降低成本,但是由于感受器需要留足安全冗余,大模型本身規模就已經龐大且指數級別的上升指日可待,故,硬件成本將在很長一段時間內成為難以回避的問題。
那么,我們換一個思路,如果把大模型從車里搬出來情況可行嗎?
將大模型所需數據集中儲存,無疑會攤薄使用者成本。運營商擁有更大的財力,可以采購更先進的存儲、傳輸設備。但自動駕駛大模型與普通用于AIGC的大模型之間最大的區別就是,對鏈接穩定性以及數據傳輸速度的要求極為嚴苛。
作為大型移動設備,車量鏈接數據中心唯一的途徑就是無線網絡。汽車行駛中,由于秒級別的延遲造成無可挽回事故的案例,比比皆是。
對硬件性能、成本、以及對數據傳輸的穩定性與速度的嚴苛要求下,“大模型上車”的時間點極為遙遠。
那么,如果把大模型作為解決“長尾問題”的后臺軟件開發工具是否可行?
現實是,大模型的訓練成本居高不下,國盛證券基于參數數量和token數量估算,GPT-3訓練一次的成本約為140萬美元;
(GPT-3訓練成本估算,圖源:國盛證券研究所)
對于一些更大的LLM模型采用同樣的計算公式,訓練成本介于200萬美元至1200萬美元之間。
(GPT-3以及其他更大LLM模型訓練成本估算,圖源:國盛證券研究所)
據業內估算,現階段已經在使用的Transformer大模型量變引起質變需要1億公里的里程數據。Transformer相比上一代CNN模型需要更大量的數據來訓練模型。
成本問題,束縛了大模型大展拳腳的空間。
正如錢鐘書在《圍城》中寫道,“好比冬季每天的氣候罷,你沒法把今天的溫度加在昨天的上面,好等明天積成個暖和的春日?!?/p>
在成本、硬件等一系列關鍵性問題得不到解決的情況下,昨日的自動駕駛加上今日的大模型,很難換來一個溫暖的春天。
即使某些企業短時間內突破了技術瓶頸,在數據安全、法律法規等行政性問題尚未妥善解決的情況下,L3及以上自動駕駛也很難“面朝大海,春暖花開”。