文|智駕網 黃華丹
ChatGPT走紅后,大模型的熱度持續不減。
尤其在國內,更是出現諸神混戰的場面。從3月到4月,包括百度、阿里巴巴、騰訊、知乎等多家巨頭官宣進軍大模型,發布中國版ChatGPT。
有機構統計,今年以來,宣布進入大模型創業的公司,從互聯網巨頭、科技公司,到科研院所和創業明星大佬,林林總總超過30余家。
而國外,除了微軟、谷歌等巨頭,不久前馬斯克也被曝出緊急搶購1萬張GPU,創立X.AI,準備開發TruthGPT。
行業熱火,但,開發大模型的成本如何?商業模式又如何?對于一腔熱情的入局者們,成本與前景,也是不得不面對的問題。
如果無法實現商業落地,如今熱鬧的大模型,也很可能步元宇宙的后塵。
有觀點認為,通用型大模型參數量大,訓練成本和使用成本高啟,并不是一般創業者所能承受的。而垂直領域的大模型相對成本較低,或許會成為更容易實現商業落地的領域。
而正在向智能化發展的汽車,就是一個很好的場景。
4月18日,上海車展首日,阿里巴巴新能源汽車發布會上,阿里集團副總裁、斑馬智行CEO張春暉在發言時表示,大模型開啟AI時代,會重塑千行百業,而新汽車是大模型最大的交互應用場景,智能汽車操作系統也會被重塑。
同時,張春暉宣布AliOS智能汽車操作系統已接入通義千問大模型進行測試,斑馬智行第三代汽車AI能力體系Banma Co-Pilot首次亮相,相關技術將率先在智己汽車上落地。
4月11日,阿里巴巴集團董事會主席兼CEO、阿里云智能集團CEO張勇公布阿里人工智能大語言模型“通義千問”,并宣布,未來阿里所有的產品都將接入“通義千問”。
阿里發布通義千問并不算早,斑馬宣布大模型上車也不是首例。但這依然代表了一種趨勢。
此前,百度發布文心一言后,便有多家車企宣布將接入文心一言。
據不完全統計,目前已經宣布將接入文心一言的車企包括長安、集度、吉利、嵐圖、紅旗、長城、東風日產、愛馳、零跑、海馬等。長安逸達成為首搭文心一言的車型。
據路透社報道,此前通用汽車一位高管也曾表示正在探索ChatGPT的用途,作為其與微軟公司更廣泛合作的一部分。
而毫末智行也在本月發布了首個基于大模型的自動駕駛算法DriveGPT。
大模型熱潮已來,行業會走向何方?而對汽車業來說,大模型能力的發展又將為汽車帶來怎樣的變化?
01 僅中國就可能超過50家
根據公開信息,目前已經入局大模型的互聯網巨頭包括百度、騰訊、京東、阿里巴巴、華為、字節跳動、360等,而以美團聯合創始人王慧文、王興,搜狗創始人王小川等為代表的大佬們也熱情高漲,“帶資入組”的,融資組建團隊的,熱鬧非凡。
據民生證券不完全統計,目前國內已發布超過30個大模型,而據出門問問創始人、CEO李志飛預計,中國未來1-2年會看到50家以上公司做大模型。
不久前馬斯克還在批判濫用GPT背后的大模型會引發人類社會發展危機,轉身便也躬身入場。
但馬斯克等人呼吁暫停時擔憂的AI監管問題,確實也尚未在全球形成一致的共識。
不過,從目前來看,入局者首先要擔心的,恐怕并不是安全問題,而是是否能夠找到商業落地方向,并以可靠的技術實現落地。
李彥宏認為,中國創業公司中基本不會出現下一個OpenAI。OpenAI誕生是因為美國大廠不看好這個方向,但現在中國的大廠都看好AI大模型,都在做這個方向。創業公司重新再做一個ChatGPT沒有多大意義。李彥宏認為基于大語言模型開發應用機會很大,沒有必要再重新發明一遍輪子。
大量創業者同時涌入,一定意義上其實是對資源的浪費。
而且,不得不提的是,開發和訓練大模型的成本很高,并不是一般創業團隊能夠承擔的。
據浙江大學人工智能研究所所長吳飛介紹,ChatGPT的訓練門檻是1萬張英偉達A100 GPU,約人民幣10億元,模型訓練算力開銷是每秒運算一千萬億次,需運行3640天。
而國盛證券計算機分析師劉高暢和楊然也在《ChatGPT需要多少算力》報告中估算,GPT-3訓練一次的成本約為140萬美元,對于一些更大的大語言模型,訓練成本介于200萬美元至1200萬美元之間。
除了算力,訓練大模型還需要服務器、數據甚至電費等多方面的支持。
有機構估算,假如平均每天約有1300萬用戶訪問ChatGPT,就需要3萬多片英偉達A100 GPU,初期投入成本約為8億美元,每日還需約5萬美元的電費。
就OpenAI的投入來看,數據顯示,微軟已向其投資累計130億美元,使其估值近300億美元,此外,微軟還向OpenAI提供算力和研發支持。
而根據PitchBook的數據,OpenAI今年營收將達到2億美元,比2022年增長150%,2024 年將達到10億美元。
這是一門昂貴的生意。
在商業化可能上,OpenAI的GPT可以說走在前列。B端和C端均實現了收費。但對大部分后來者而言,要實現如OpenAI的C端規模基本不可能。在B端尋求落地才是更可行的方案。
而智能汽車,就是目前一個可行的B端場景。
02 在汽車領域應用相對容易實現
一方面,汽車有著明確的交互需求,而且相較于通用型大模型,垂直領域的應用場景相對較小,對參數的量級要求也沒有通用型AI那么大,因此是更容易實現應用的領域。
目前來看,大模型在車上的應用場景主要是在智能交互和智能駕駛上。
張春暉在阿里巴巴新能源發布會上表示,雖然語音交互已經發展了多年,但目前車載語音助手整體水平還停留在可能叫不醒、響應慢、總出錯、聽不懂、不好用的階段。
而大模型可以通過深度學習等技術,訓練出更加準確的語義和意圖理解模型,幫助車載系統更好地理解用戶的指令和意圖。并讓車載語音實現更深層次的個性化和自然擬人的交互。
例如,在大模型賦能下,車載助手將具備真正的智能化水平,更好地了解用戶的喜好,根據語義識別,理解用戶的環境和情緒狀態,并以此推薦相應的音樂、電影、電子書等內容。
而基于AI大模型對語音及圖像的理解能力,座艙內的交互方式能夠變得更加多元。語音之外,用戶還能夠以手勢、眼神等方式,創造出更加自然、便捷的交互方式。
此外,大模型還可以訓練出預測用戶行為的模型,預測用戶是否會變道或剎車等,提前做出相應的駕駛協助。
上海車展期間,商湯也展示了其最新的座艙應用。其全新推出的大模型體系“日日新Sensenova”擁有語言大模型以及數字人等多種生成式AI能力,可為車艙提供更智能和人性化的多模態人車交互體驗。
據商湯科技介紹,商湯語言大模型“商量SenseChat”會與嘉賓交流互動,并推薦個性化體驗內容,同時,它還支持郵件模式,可自動提煉郵件關鍵信息,幫助用戶節省閱讀時間。“秒畫SenseMirage”文生圖創作平臺則借助商湯AIGC模型能力自動為嘉賓生成各種風格的照片。
Elektrobit中國區總經理鄒露君則認為,人機交互應該是受影響最大的領域,大模型對人機交互會產生顛覆性的影響。
就座艙內的交互而言,對大模型上車的期待絕不會只停留在可以為用戶提供更順暢的交流,以及提供生成圖片的能力。
而在智能駕駛方面,地平線CTO黃暢在接受采訪時曾表示,GPT在自動駕駛場景中最先應用的很可能是環境模型的預測和交互式規控、交互式規劃。
黃暢認為,這個場景不需要特別大規模的參數模型,因為它不是一個完整的端到端,尤其因為它更關注于預測和規劃,不用花太多精力在感知這個層面上,因此很可能在百TOPS級別的算力平臺上就能應用,在三到五年內就可以初步上線。
而在完整的端到端緩解,從感知到定位地圖到規控,整個端到端的閉環做出來,黃暢認為需要一個更大規模的參數模型,大概需要五到十年的時間。
毫末智行發布的DriveGPT雪湖·海若則是使用GPT模型和技術邏輯的自動駕駛算法模型。作為適用于自動駕駛訓練的大模型,DriveGPT雪湖·海若的能力是:
在預訓練階段引入量產智能駕駛數據,訓練出一個初始模型。然后引入量產數據中的用戶接管片段,訓練反饋模型。通過強化學習,使用反饋模型不斷優化迭代初始模型。
其基本邏輯是:
1、按概率生成多個場景序列,每個場景都是一個全局的場景,每個場景序列都是未來有可能發生的一種實際情況。
2、在所有場景序列都產生的情況下,把場景中最關注的自車行為軌跡給量化出來,也就是生成場景的同時,便會產生自車未來的軌跡信息。
3、有了這段軌跡之后,DriveGPT雪湖·海若還能在生成場景序列、軌跡的同時,輸出整個決策邏輯鏈。
也就是說,利用DriveGPT雪湖·海若,在一個統一的生成式框架下,將規劃、決策與推理等多個任務全部完成。
有業內人士認為,通用型大模型的發展,將會使其成為一種如基礎設施般的存在。而對智能汽車來說,大模型能力對車輛智能化的推動也將上升一個量級。
不過,當然,前提是如今倉促進場的各方能有足夠的投入將技術打磨成熟。
此前李彥宏曾表示文心一言與ChatGPT之間只差兩三個月,引發一波爭議。王小川則認為有三年的差距。
文心一言與通義千問已開啟內測,而大部分項目仍處在公布階段。顯然,國內大模型行業要走的路,還有很遠。