界面新聞記者 | 陳振芳 伍洋宇
界面新聞編輯 | 文姝琪
每當工作遇到困難的時候,梁文峰總會想起量化投資先驅西蒙斯的話:“一定有辦法對價格建模。”梁文鋒是私募基金幻方量化的實際控制人。由他創立的大模型公司DeepSeek在業內被稱為“價格屠夫”,是最近這一輪大模型價格戰的始作俑者。
2024年5月6日,DeepSeek發布DeepSeek-V2開源MoE模型,在市場毫無預見的情況下改變了大模型廠商格局。其API接口定價直接下探至每百萬tokens輸入1元、輸出2元(32K上下文),價格僅為GPT-4-Turbo的近百分之一。
不出半個月,智譜AI、字節跳動、阿里云、百度、騰訊云接連選擇跟進降價。其中,騰訊和百度直接免費了幾款大模型產品——正如梁文峰曾經相信的那樣,由他發起的價格戰正在重塑整個大模型產業格局。
過去一年多的大模型狂熱推動英偉達市值一路暴漲。然而,除了提供GPU的英偉達賺到了錢,大模型廠商依然在大量燒錢。每一次模型訓練,用戶的每一次詢問,開發者的每一次調用,都對應一份算力消耗,每次消耗都是一筆成本賬。
這使得突如其來的降價潮更加出乎旁觀者意料?!叭ツ旮鶯P匯報時,我們預測三年后才能達到現在的價格水平,沒想到不到一年就達到了。”一位硬科技投資人告訴界面新聞,降價肯定會促使AI應用迸發,只是這一天更早的到來了。
1
引領這輪降價潮的梁文峰被認為是一個“攪局者”。
2008年,他從浙江大學畢業,并沒有走入如火如荼的互聯網創業。在外界無從得知的幾年,傳說他曾住在成都的出租屋,幾經波折最終走上量化投資之路。多年后,由他主導建立的幻方量化成為突破千億大關的量化私募機構。
投資和大模型有何關系?梁文峰就是兩條路上交匯的那一個點。不少AGI信仰者聲稱: “Scaling law”(規模法則)是通往AGI的必經之路,即數據、算力、計算量越大,訓練的模型越“聰明”。 而量化投資者們相信大數定律,當樣本容量足夠大時,樣本均值將趨近于總體均值。
“DeepSeek創始人是理想主義者?!庇型顿Y人向界面新聞如此評價。梁文峰的理想主義“財大氣粗”,帶著一萬枚英偉達A100 GPU、在北京租賃近2000平方米場地,“深度求索DeepSeek”在2023年7月橫空出世,寓意“路漫漫其修遠兮,吾將上下而求索”。
萬卡不一定是DeepSeek的上限。有行業人士向界面新聞表示,這家公司或許已經有超兩萬枚英偉達A100 GPU。除了互聯網巨頭,幾乎沒有創業公司有如此多算力儲備。

在DeepSeek率先挑起價格戰之后,“跟還是不跟?”成為行業里每個參與者必須面對的選擇題。
最先坐不住的是掌握大量企業客戶的智譜AI。這家公司率先將對標GPT3.5-Turb的入門級模型GLM-3 Turbo模型調用價格下調90%,由5元/百萬tokens調整為1元/百萬token。
隨之而來的則是從未缺席過任何一場行業價格戰的互聯網大廠們。
字節跳動直接將大模型從以分計價帶到以厘計價時代。旗下的豆包通用模型pro-32k版輸入價格降至0.0008元/千Tokens,為同規格模型的1/150。
阿里云旗下的通義千問GPT-4級主力模型宣布降價97%,API輸入價格從0.02元/千tokens降至0.0005元/千tokens,旗下9款商業化及開源模型也紛紛降價。
戰況愈演愈烈。百度文心直接將ERNIE Speed、ERNIE Lite兩款免費。騰訊云隨后也宣布混元大模型全面降價,主力模型之一“混元-lite”從0.008元/千tokens調整為免費,API輸入輸出總長度也將從目前的4k升級到256k。
然而,降價接力賽在大廠之間如火如荼,但創業公司的身影卻鮮少出現。大部分備受關注的獨角獸們均不動聲色。
百川智能創始人王小川認為,這一輪大廠降價的實質是云廠商進到新戰場,降價是大廠射程范圍內的事。他勸創業公司別把這個商業模式作為業務重點,也別摻和進去。
零一萬物創始人李開復的表態更早,也更強硬。
在這輪降價潮襲來之前,李開復就提醒說,“不應在行業內按照ofo式的燒錢打法重蹈覆轍?!倍诖髲S降價的苗頭漸起后,他依然表達了不參戰的態度,“如果以后中國市場可能就是這么卷,大家寧可賠光通輸也不讓你贏,那我們就走外國市場?!?/p>
李開復堅持認為價格戰是一個“雙輸”的打法,創業公司如果認定自己的技術值得,就應當堅持一個合適的價格,而絕不能靠貼錢、賠錢做生意。

2
大廠和創業公司面對降價潮態度不一的背后,是心態和資金儲備的全然不同。
創業公司的視角是更好理解的。當前仍在牌桌上且手握大把籌碼的大模型創業公司,大都認可研發和應用的“雙輪驅動”理論,這意味著它們既要做模型,也要做產品。而模型要技術人才、萬卡集群,產品要投流買量、跑馬圈地,創業公司燒錢的日子還在后頭。
更重要的是,創業公司的野望在C端(個人用戶市場)而非B端(企業市場)?!皼]有一家大模型公司靠賣API活著。”一名關注大模型行業的FA(財務顧問)對界面新聞記者表示。
但如果選擇不參戰,創業公司也無法完全無動于衷,必須找到自己的應對策略。
獵豹移動董事長兼CEO傅盛認為,這次大降價基本宣告了大模型創業公司必須尋找新的商業模式。降的最兇的都是有云服務的大公司,通過大模型來獲取云客戶,“羊毛出在豬身上,降得起”,而大模型創業公司沒有這樣的生態,必須另尋商業模式。
除此以外,創業公司還需要警惕的是,自己是否會被可能出現的市場格局變動擠下牌桌。
活躍在投融資的FA和VC們告訴界面新聞,融到錢的創業公司其實已經到了向投資人和市場“秀肌肉”的時刻。但技術進展的漫漫征程擺在眼前,燒錢也燒不過大廠,當商業化進展不夠順利,估值處于第二、第三梯隊的創業公司,會面臨融資壓力陡增的境地。
“今年很多大模型初創公司可能會出局,”前述FA表示,“市場上并不需要這么多家企業?!?/p>
而對資源儲備雄厚的大廠而言,降價的決策其實“早有預謀”。
在這波密集動作之前,它們幾乎已經都在通過代金券、場景合作、工程優化等各種方式,試圖降低模型利用的成本,當前的定價也是結合技術和用戶規模預期等綜合因素考量的結果。
“坦白說,誰的算力更充沛,誰就會有更大的收益。”上述FA人士表示。一個可證實的數字是,據DeepSeek內部人士消息,該公司大模型服務在降價后的利潤率仍超50%。
“關鍵是什么時候降價?”這可能是過去一年所有云廠商都在琢磨的問題,直到DeepSeek作為導火索出現。
從技術上來說,大模型價格戰打得起來的根本原因在于,模型之間的差距不大。一位投資人直言,大廠之所以跟進,是因為在它們的視野中,DeepSeek所實現的架構創新自己可以在短期內達成,提前虧幾個月無所謂。
一位前互聯網云廠商從業人員告訴界面新聞,由于企業縮減預算,這兩年云市場的行情并不太好。另一方面,大模型還是沒有那么顛覆性,尤其國內大模型還遠不如國外成熟。所以,以價格換市場成為自然而然的選擇。
多名受訪者認為,大廠降價的目的就是籠絡更多企業和開發者,為自己搭建生態護城河。
一名火山引擎內部人士告訴界面新聞:“豆包大模型降價的真實原因在于,大模型在B端的應用還沒有起來,場景太少?!彼赋?,雖然行業在討論用AI大模型重構業務,但在日常工作生活里很少能感受到大模型能力的落地?!敖祪r本質上是降低使用門檻。”
這個觀點在跟進降價的大廠中間是共識。大模型仍然處于市場培育階段,降價或免費都是為了讓更多企業和開發者能快速用上,并接入到自己的業務場景中。畢竟,讓更多人參與進來是行業發展的前提。

3
降價能不能最終帶來AI生態的繁榮?
AI應用層的投資人對此持樂觀態度。楊泉在去年大模型公司融資勢頭最為火爆的時候,見過月之暗面創始人楊植麟,也見過王小川,但他所在的機構最終沒有買下那張通用大模型的入場門票,而是轉向了AI應用層。
“我跟朱嘯虎的觀點比較一致,所以我是樂于見到所謂降價潮的。”楊泉說,只有基礎設施的成本極低,在上面做應用的公司才能迎來爆發。
過去移動互聯網的發展已經證明了這一點。當運營商的網絡資費,云服務廠商的成本大幅下降之后,才逐漸長出了微信、抖音等等超級應用。
而大模型領域也許能復制這一過程。當前在基礎大模型領域,中國公司的能力與OpenAI等美國引領者還有較大差距。多位投資人表示,中國彎道超車的機會在大模型應用層。
一位美元基金硬科技投資人對中國的大模型發展更加樂觀:“中國不擅長于做顛覆性的創新,但特別適合做增量式創新,或者叫‘快速跟隨者’。”
他進一步指出,短期內,大模型領域的創新層出不窮,中美存在較大差距。但把時間拉軸拉長來看,創新斜率總會慢慢變平,當曲線當變平,中國就會有機會去反超,這是在電動車領域已經發生的故事,“當特斯拉的技術創新放緩,中國電動車就追上來了?!?/p>
李飛飛團隊也提到,中國在全球AI專利申請方面占據主導地位,美國在AI模型的發展上保持領先。今年上半年,中國大模型創業公司和互聯網大廠對于模型更新和產品發布的節奏,在戰術上已有對于OpenAI的全面追趕之勢。
不過也有人持不同意見,作為一家大模型應用初創公司的創始人,李靈昊沒有被這輪降價潮打動。在他的觀察中,更大參數、更大模型能力的高參量模型并沒降價或者降幅不多,主要是放開了一些低端的使用場景。
因此,從技術角度來說,他認為這輪降價并沒有為下游帶來太多變化。相較而言,他們更期待的是真正的技術變革。
李靈昊認為,但如果行業志在看到顛覆性的創新繁榮,大模型廠商們的最好做法,仍然是推進Scaling Law,真正從性能上讓下游開發者感受到何為如虎添翼。
大廠對此不是沒有認知。百度內部人士告訴界面新聞:“長期來看,模型廠商最終競爭的還是模型本身的能力,只有把基礎模型效果做得足夠好,才能構筑競爭壁壘?!?/p>
前述關注大模型行業的FA也指出,API價格戰不能代表什么,因為價格本身已經足夠低了,它更多來源于技術架構更新疊加市場劇烈競爭,“大家只是被迫卷,想先拉出身位差 ?!?/p>
不過,正如投資人所預言的那樣,降價難以影響模型性能升級,但有機會促使AI應用的大迸發。
盡管王小川定義下的“超級應用”只與“超級模型”深度綁定,正在降價的大模型API無法催促超級應用的誕生。但在整個應用生態中,當大模型時代的“電價”足夠普惠,垂直應用生態有望進一步繁榮。
回看當下,降價潮并不會偃旗息鼓。前述FA判斷,“價格戰仍未觸底,硅基流動所引領的AI infra(AI 基礎軟件)還能將大模型的性能和價格再次‘擊穿’,只是還沒有對外發布?!薄獜倪@個角度而言,AI 2.0時代的“電力普及”或許才剛剛開始。
發起這場價格戰的DeepSeek已經開始悄悄謀劃從幻方量化獨立出來,醞釀成為大模型賽場的大玩家。理論上,梁文峰彼時會手握量化交易、大模型兩張王牌。交易出身的他,曾無數次證明過一個普通道理,即價格可以重構市場。
(應受訪者要求,李靈昊、楊泉為化名)
(界面新聞記者肖芳、崔鵬對此文亦有貢獻)