文|定焦(dingjiaoone) 黎明
編輯|方展博
中國的大模型創業很火,但有些公司可能跑偏了。
“百模大戰”這半年,大大小小的科技公司,都推出了自己的大模型。仿佛不發布一個大模型,就不配坐上通往AI時代的列車。
這造成一種現象:高度雷同,同質競爭。大家一蜂窩撲上來,重復造輪子。
11月15日在深圳舉行的西麗湖論壇上,百度董事長兼CEO李彥宏發表演講時表示,他看到很多企業對大模型的本質理解不深,被各種說法忽悠,都想去自己搞個基礎模型,或者按照網上傳播的評測方法去挑選一款評分高的大模型,就以為這是擁抱AI了。
“殊不知大模型本身不僅不產生任何價值,還造成了對公司資源、社會資源的巨大浪費。”
金沙江創投主管合伙人朱嘯虎近期也說過,今年上半年有一波AI的虛火,大家天天在講大模型。投資人FOMO,投了很多大模型,現在都后悔了。他認為明年下半年大部分創業者會出局。
大模型創業,方向比努力更重要。要想持久坐在牌桌上,就得看清浪潮的流向。
跟風搞大模型,AI創業的歧路
都知道大模型很重要,問題是,我們到底需要多少個大模型?
在15日的演講中,李彥宏引用公開數據說,截止10月份國內已經發布了238個大模型,而6月份的時候這個數字是79個,相當于4個月就翻了3倍。
平均下來,每天至少有一個大模型面世。
200多個大模型,看似很多,實際差異很小,大家本質都差不多。其中,還有一些是“套殼”——在Llama開源模型的基礎上訓練而來。比如零一萬物的Yi系列大模型,最近就被質疑完全使用LLama架構,卻對外宣稱“原創”。
相對之下,美國作為大模型的發源地,也只有上十個大模型。
大模型不是越多越好,我們不需要那么多大模型,最終這些大模型也不會全部活下來。
李彥宏認為,大模型可以被視為AI時代的操作系統,是各類原生應用的基礎底座。他做了一個類比:縱觀互聯網發展史,不論是PC時代,還是移動互聯網時代,操作系統都只剩下少數幾個——PC是Windows系統,移動時代是安卓和iOS。
那么同理,大家普遍認為,最終能活下來的通用大模型,也會是個位數級別。這意味著,國內一股腦冒出來的200多個大模型,絕大部分都是炮灰。
一家AI設計公司的創始人對「定焦」說,大模型是一種基礎設施建設,需要集中力量辦大事,投入產出比才最高,生態里的各種人匯集在平臺上,就會形成平臺效應和規模效應。
不是所有公司都能成為基礎設施般的存在,這與野心無關,而與能力有關。要做出一款好用、可用的大模型,技術門檻和成本門檻極高。
OpenAI潛心研發這么多年,背靠微軟的支持,投入數十億美金,才取得今天的成績。國內的百度、華為、阿里等互聯網大廠,也是因為有過去多年的積累,今天才能快速跟上潮流。那些跟風入場、從零起步的創業公司,想要自研一款通用大模型,難度可想而知。
即便技術實力過關,或者借用開源方案,訓練模型的成本也讓很多公司吃不消。訓練一遍,耗資幾百萬人民幣,不在少數。關鍵是,訓練出來的模型本質上不是原創,也沒什么人使用。
按照李彥宏的說法,“國內有200多個大模型,很多上了這個榜單、那個排名,其實都沒有什么使用量。”他認為,“重復造輪子其實是對社會資源的極大浪費。”
有一些公司劍走偏鋒,想從頭訓練自己的專用大模型,這樣成本可控。但李彥宏認為,這樣煉出來的大模型是沒有智能涌現能力的。因為只有參數規模足夠大,算法、數據訓練都做對的時候,并且能夠持續投入,不斷迭代,才能夠產生智能涌現,大模型才具有觸類旁通的能力。
做不了通才,又成不了專才,就沒有核心競爭力。
“今天你推出一個大模型,花錢打了榜,有很多人用,可能明天就有個新的模型迅速替代掉。”另一家人工智能公司的創始人對「定焦」說。
所以,一些跟風搞大模型創業者,跑偏了。
創業者真正的機會
如果不做通用大模型,創業者應該做什么?
李彥宏的答案是:AI原生應用。“AI原生時代,我們需要的不是100個所謂的大模型,而是100萬量級的AI原生應用。”他說。
互聯網歷史上的幾波創業潮,漲潮的標志性事件,都是原生應用的爆發。距離我們最近的移動互聯網,是由iPhone手機掀起的,業內公認的起點是2010年。
但事實上,初代iPhone在2007年就誕生了,一直到三年后,具有劃時代意義的iphone 4發布,手機行業才整體進入智能化時代。iphone 4除了亮眼的外觀設計,最大的貢獻是搭建了系統生態,讓無數開發者創造了大量原生應用,由此開啟了創業者的黃金年代。
過去十多年,互聯網行業最成功的公司、最亮眼的產品、最明星的創業者,都集中在應用層。微信、抖音、美團、滴滴,都是從零開始成為超級應用。
李彥宏認為,人類進入AI時代的標志,是出現大量的AI原生應用,而不是出現大量的大模型。基于基礎大模型開發出來的應用,才是模型存在的意義。
AI原生應用,就是基于大模型智能涌現后產生的理解、生成、邏輯和記憶四大核心能力開發出來的應用。這些能力是過去的時代所不具備的,能解決過去解決不了或解決不好的問題,因而才能打開無限的創新空間。
那么,AI原生應用進展如何?
答案是尚未爆發。
國內的AI原生應用屈指可數。9月初,國內才開放第一批大模型備案,允許公開注冊使用,此前都只能內測。百度的文心一言APP第一批上線,迅速登頂手機應用商店排行榜。11月1日,百度正式上線文心一言專業版,開啟訂閱收費,每月59.9元。這是國內首個采用會員模式面向C端收費的大模型產品。
國外的進展更快一些,AI原生應用的數量已經有上千個。據應用商店監測平臺Sensor Tower的數據,美國市場貢獻了55%的AI應用總收入,歐洲市場占20%,包括中國在內的其他市場,加起來只占比25%。
10個大模型里找不出1個應用,這就是中國大模型創業的現狀。
對于創業者而言,必須要考慮清楚,是去跟風砸錢做基礎大模型,還是做大模型在垂直行業的精調,抑或是基于大模型打造新的應用。
在李彥宏看來,直到今天,不論中國還是美國,最好的AI原生應用還沒出現。這恰恰就是創業者千載難逢的機會。
是時候尋找爆款應用了
中國的AI原生應用發展緩慢,不是中國創業者不努力,而是起步晚了。
大模型創業分為三大類:一是做基礎大模型,二是做行業大模型,三是基于前兩類大模型開發應用。
在中國,基礎大模型和應用層的創業,幾乎是同步展開的。去年底ChatGPT火了之后,中國的創業者一方面研發基礎大模型,同時也嘗試AI原生應用的各種可能性。但基礎模型不成熟,意味著應用層發展所倚賴的條件不具備。
大半年的“軍備競賽”之后,一些頭部的大模型廠商脫穎而出。互聯網大廠中,典型的如百度,創業公司中,也有一些發展很快。這些基礎大模型是AI原生應用的底層驅動力,為爆款應用的出現提供了基礎。
按照李彥宏的話說:“只有用好最強大的基礎大模型,中國的開發者和創業者才可能做出更多超級應用。”
根據與大模型接入的深度,應用層創業可以分為兩類:自建模型開發應用,以及直接調用已有大模型開發應用。
百度正在孵化全新的AI原生應用。比如智能代碼助手Comate。據百度透露,百度現在每新增100行代碼,就有20行是AI生成的,而且這個比例還在快速增長中。這樣的AI原生應用,通過人機協同,大幅提升了研發效率。
與此同時,百度在內的一些頭部大模型廠商,以及一些開源平臺,對開發者提供全套開發工具,降低了應用層的創業門檻。對于那些無力獨立訓練一個大模型的中小開發者,接入大廠的API,成為一個性價比較高的選擇。
前幾天OpenAI召開首屆開發者大會,推出Assistants API,讓開發者能夠調用GPT上幾乎所有的新功能,面向普通用戶推出的GPTs,則讓不懂代碼的人也能輕松編程。這“殺死”了一些模型層和中間層創業者的生意,卻為應用層的繁榮打下了基礎。
這是一個重要的風向轉變。國外已經將重點轉向了應用層的AI agent(智能體),而國內還在卷大模型。
李彥宏說,API是AI原生應用調用基礎大模型的主要方式。未來,每一家企業跟自己客戶打交道的方式,都將被改造為AI原生應用,這將大幅度提升企業的競爭力。“百度的目標,就是打造好大模型的基礎能力,支持好AI原生應用開發。”
百度擁有800萬AI開發者,不久前上線的大模型插件平臺,讓個人和企業都能把自己的數據和能力,快速變成插件。插件是一種特殊的AI原生應用,大大降低了開發者門檻,有利于構建繁榮的AI原生應用生態。
在巨頭們已經鋪好路、建好基礎設施的情況下,創業者與其重復造輪子與巨頭對抗,不如將重點放在應用開發上,尋找下一個爆款應用。
梳理清楚自己的核心優勢和競爭壁壘,在生態里找到自己的位置,才能在大模型創業潮里借勢而起。
*題圖及文中配圖來源于Unsplash。