文 | 時代財經
3月1日,DeepSeek“開源周”的最后一天,DeepSeek拋出最后一枚“王炸”——首次披露成本利潤率關鍵信息。
DeepSeek在社交媒體的官方賬號上稱:“假定GPU租賃成本為2美金/小時,總成本為$87,072/天。……如果所有 tokens全部按照DeepSeek R1的定價計算,理論上一天的總收入為$562,027,成本利潤率545%。”
當然,這只是最理想的情況。
而現實是,DeepSeek開源周讓行業振奮。這些開源工具不僅讓全球AI開發者能更高效、更低成本地進行AI模型的開發和訓練,也讓多年來關于大模型開源和閉源的“口水仗”,在這一階段有了初步結論。
2月,過去堅定的“閉源派”百度(9888.HK)宣布將開源下一代文心大模型,之后,字節豆包、昆侖萬維等均推出開源模型,阿里巴巴(9988.HK)也進一步深化開源。
“或主動、或被動,開源(大模型)已經被帶動起來了。”開源大模型社區OpenCSG聯合創始人、CTO王偉向時代財經感慨。
DeepSeek正在撼動當前AI大模型的市場格局。有行業人士表示,大模型仍然保持超高速迭代的態勢,“過時的”模型幾乎無人問津。“在大模型領域,想利用短期的算法技術優勢或商業模式來打造形成長期的競爭壁壘,目前看來是不可能的。”該業內人士稱。
DeepSeek給開發者們帶來福音的同時,也讓一些大模型公司可能不得不“趕鴨子上架”,“跟風”開源。
但開源之后呢?
DeepSeek可以測算自己的理論利潤率,但其他廠商是否找到盈利模式?
開閉源戰局扭轉
繼模型、論文開源之后,DeepSeek正向著更底層的開源進發。
“DeepSeek開源周開源的這些技術,能夠大大提高推理效率,同樣場景和服務規模下,所需GPU數量更少。往大了說,這甚至能達到節能減排的效果。”王偉稱,以DeepSeek開源項目中涉及到的EP(Expert Parallelism,專家并行)技術為例,過去除了少數頭部公司有能力實現,多數企業是享受不到EP加速的,只能以較低的效率進行推理。
“但DeepSeek開源后,這一情況有望很快得到改善。開源成果將會被其他通用開源項目、企業、科研組織等快速吸收,地融入到他們的項目之中。”王偉表示。
例如,摩爾線程就在3月1日晚上宣布在短時間內成功實現對 DeepSeek 各個開源項目的全面支持,涵蓋 FlashMLA、DeepEP、DeepGEMM、DualPipe 以及 Fire-Flyer 文件系統(3FS)。
“當然,這套技術方案還存在一些限制,例如它主要還是針對英偉達的技術架構,特別是Hopper架構的顯卡,以及針對MOE這類架構模型的訓練和推理等。”王偉補充道。
在LangGPT社區創始人云中江樹看來,DeepSeek的開放程度直接將大模型應用的門檻基本拉平了。“它足夠開放,沒有任何限制,現在甚至把部署的底層代碼都開放出來,相當于手把手地教大家如何高效部署了。”
據云中江樹介紹,目前全球主要有Meta Llama系列模型、阿里千問系列和DeepSeek三個重要的AI開源玩家。開源則涉及到模型的權重、訓練代碼和訓練數據三個層面。
從模型權重來看,這是每個開源玩家都會選擇開放的基本要求,而訓練代碼和訓練數據則幾乎沒有一家可以完全開放。
差異主要體現在開源協議上,DeepSeek在開源協議上對商用幾乎沒有任何限制。從開源的廣度來看,也幾乎只有DeepSeek能將集群計算、通信等提升能效的代碼開放出來。并且在開源可復現性上,DeepSeek公開了更多訓練細節及核心思想,目前社區已有 OpenR1 項目實現完全復制。
更重要的是,DeepSeek完全扭轉了關于大模型開閉源的戰局。
時代財經從多名業內人士處了解到,過去一段時間海外大模型開源勢頭有所減弱,硅谷的AI巨頭逐步轉向閉源。王偉提到,美國科技巨頭們為了商業化目標,紛紛選擇閉源作為自身的發展模式,而DeepSeek、Qwen等中國模型則成了開源的重要力量。
此前,業內人士認為開源可能是“偽命題”,比如李彥宏就曾表示,“開源模式是一種智商稅。”但如今百度也走到了自己的反面,2025年的2月14日,百度官方微信發布公告,“我們將在未來幾個月中陸續推出文心大模型4.5系列,并于6月30日起正式開源。”用短短一句話宣布放棄堅持了兩年的閉源之路。
“趕鴨子上架”?
DeepSeek的技術實力匹配開放程度,一時讓開源成為大模型的主流。
不只百度,多家大模型企業在2月推出開源模型或進一步深化開源。2月10日,字節跳動豆包大模型團隊聯合北京交通大學等開發的視頻生成實驗模型“VideoWorld”正式開源;2月18日,昆侖萬維開源了其旗下面向AI短劇創作的視頻生成模型SkyReels-V1和表情動作可控算法SkyReels-A;2月23日,月之暗面Kimi宣布開源大模型Moonlight。
另外一家大模型廠商阿里云則是一直開源和閉源兩條腿走路的。2月25日,阿里通義千問推出QwQ-Max-Preview深度思考模型,支持聯網搜索,并計劃后續開源。當日深夜,阿里云視覺生成基座模型萬相2.1(Wan)開源了14B和1.3B兩個參數規格的全部推理代碼和權重,同時支持文生視頻和圖生視頻任務,本地消費級GPU即可部署。
頂著DeepSeek的風暴,廠商們選擇開源背后的動力,是創新,是跟風,還是“趕鴨子上架”?
在近期百度財報電話會議上,百度創始人兼CEO李彥宏解釋了促使百度做出這一艱難抉擇背后的原因。
李彥宏稱,“開源最好的模型可以極大地促進采用”,并希望通過開源讓開發者和用戶認識到文心系列大模型的真正價值。
“促進采用”的背后,可能蘊藏著更深層的生態戰位。
王偉表示,DeepSeek一系列模型開源之后,國內外從芯片到Infra框架,再到應用層,幾乎都快速去做適配。這股風潮甚至超過了之前Meta開源的Llama模型。
據時代財經此前報道,單是芯片廠商,截至2月中旬就有超過15家緊急適配了DeepSeek系列模型,包括華為昇騰、壁仞科技、昆侖芯、沐曦、云天勵飛(688343.SH)、摩爾線程等廠商,并且更深入的適配工作仍在進行中。
王偉進一步解釋,當一個新架構的模型推向市場時,會面臨在芯片、框架和應用等軟硬件生態適配問題,需要投入人力去攻克。這個周期較長,很多時候沒有生態工具來助力,最后,往往是廠商花費大量資金解決這個問題,最終由用戶來買單。
如今,DeepSeek則通過強大的模型能力和有效的開源策略快速跨過了適配難關。其他模型廠商如果仍堅持商業化全閉源策略,那么除了API接入外,私有化部署的生態適配會維持在高成本狀態,這會大大削弱這些廠商的競爭力。
“如同Llama開源后催生了一批基于Llama的生態項目,目前整個AI生態都在與DeepSeek兼容。甚至,盡管DeepSeek還處于發展中,估計過一兩年,它可能就會成為AI領域的‘安卓系統’。”云中江樹同樣認為,開源是融入進大模型生態中最好的辦法。
如果企業自己開發一套閉源的、較小的系統,而其他廠商不與之兼容,軟件也無法適配,那么自然而然地,其他廠商和用戶都不會選擇這樣的系統,甚至可能會面臨被淘汰的風險。
因此,主動也好,“趕鴨子上架”也好,開源成為大模型廠商不得不考慮的選項。
另外,從融資的角度看,一家風險投資機構負責人告訴時代財經,能不能選擇開源一定是接下來投大模型一個非常重要的指標。
“不是說開源就領先閉源,而是你可以閉源,但是開源可能會在更短的周期內追上你,那么你的競爭優勢還在不在模型本身,或者說競爭優勢還能不能持續這件事,是需要大家更多去考量的。”上述負責人表示。
一名業內人士對時代財經坦言:“一個殘酷的事實是: DeepSeek開源了,原來的大模型堅持的閉源私有化商業模式就不成立了。”
開源之后呢?
閉源的商業模式受到沖擊,但是對于開源大模型如何實現商業化也是很多企業的的未解難題。
在上述風險投資機構負責人看來,DeepSeek的商業化路徑并沒有非常清晰。“這也是開源一直存在的問題,過往在軟件行業通過開源獲得巨大成功的公司在美國有出現過,在國內確實尚未看到相關案例。”更何況,從DeepSeek 的創始人梁文鋒的對外表態來看,他是一位技術理想主義者,而非為了盈利目的。
不過,云中江樹也指出,在目前大模型的發展階段,即使是閉源,其商業化本身也并不理想,如OpenAI、Grok等頭部模型的盈利能力也不強。底層的原因是,當前大模型的智能化水平尚未達到真正商業化落地的要求。
DeepSeek在《DeepSeek-V3 / R1 推理系統概覽》中指出,由于DeepSeek-V3定價低于R1,且網頁端和應用程序免費,僅部分服務產生收入,再加上非高峰時段設有夜間折扣,其實際收入不及理論數值。
“其他公司想快速做到(像DeepSeek)這么好,并不容易。”據王偉透露,幾家知名的DeepSeek R1 API供應商的利潤率遠不如DeepSeek自己。但在此次開源周之后,這個情況有望改善。
王偉認為,短期內, DeepSeek的開源會讓模型廠商面臨很大的壓力,大量的研發投入也可能會被質疑。但長期來看,大模型的競爭遠沒有結束,各模型廠商如果能適當吸收DeepSeek的開源成果,拿出更競爭力的模型,未來是有可能反超的。長期看好中國的大模型企業,國內有多家基礎模型廠商具備與DeepSeek相當的實力。
“開源也有其獨特的商業模式。”云中江樹表示,一種是免費提供模型,但出售相關服務來盈利,比如幫助企業需要將模型部署到自己的公司,進行性能調優、本地部署、專項能力提升等;其次是實行雙軌制,即開源和閉源并行,一些基礎的或較小的模型開源以吸引人氣,而高級版、較大規模的模型則閉源出售;還有一種策略如埃隆·馬斯克旗下的xAI公司,它的策略是開源上一代Grok模型,而最新一代模型則采用閉源等。
“不過,無論是哪一種商業模式,目前沒有商業化訴求的DeepSeek可能還是一個很大的變量和異數。”云中江樹說。
(時代財經龐宇對此文亦有貢獻)