文|正見TrueView
當前除了傳統電商業務被卷回消費者補貼的舊軌,“新貴風口”大模型領域同樣掀起了價格戰。
5月15日,字節跳動正式對外發布豆包大模型,以大幅低于行業價格的商業定價,打響了國內AI大模型的首波價格戰。接連幾天內,幻方量化DeepSeek-V2、智譜AIGLM-3等相繼宣布大幅降價大模型API調用價格。
如此激烈的競爭之下,阿里云也于今日發布了通義千問GPT-4級主力模型Qwen-Long,API輸入價格從0.02元/千tokens降至0.0005元/千tokens,直降97%。僅隔幾個小時,百度更是宣布文心大模型的兩款主力模型ENIRE Speed、ENIRE Lite全面免費,即刻生效。短短一天內,大模型價格戰便從“厘時代”卷至了免費時代。
從大廠至明星創業AI公司,低價已成為AI大模型市場的“第一吸引力法則”,客戶開發拓展、市場用戶教育借此鋪開,產業快速邁向下一發展階段。
“價格比同行低99.3%”的震懾力
在火山引擎原動力大會上,總裁譚待重點披露了豆包大模型的商業化價格。對比國內外目前最新的32K主力模型,GPT4價格約為0.42元/千tokens,百度文心一言和降價前的阿里通義千問2.5價格均接近0.12元/千tokens,而豆包通用模型pro-32k版模型推理輸入價格僅為0.0008元/千tokens,比行業低99.3%。
極具優勢與競爭力的定價策略一旦落地,對同業廠商的沖擊可想而知。通義千問作為對比參照之一,也是不得不拿出更大“誠意”,不僅喊出“擊穿地心式降價”,并同樣拿出主力模型參與競爭。
阿里云此次降價涵蓋通義千問九款閉源及開源模型,包括目前百煉平臺上調用量最大、性能對標GPT-4的模型Qwen-plus,以及旗艦款大模型Qwen-max,性能在權威基準OpenCompass上與GPT-4-turbo持平,其API輸入價格也大幅降低。
事實上,騰訊混元大模型的價格也在豆包大模型定價發布后明顯降低。5月14日也就是豆包大模型發布的前一日,騰訊云官網顯示混元大模型標準版(hunyuan-standard的前身)和高級版(hunyuan-pro的前身)的模型推理輸入價格分別為0.012元/千tokens和0.12元/千tokens。
5月17日,騰訊云生成式AI產業應用峰會召開,騰訊云在宣布混元大模型多個版本模型實現升級,雖全程沒有公開介紹價格,但官網顯示窗口尺寸為32K的hunyuan-standard模型和hunyuan-pro模型,模型推理輸入價格分別為0.0069元/千tokens和0.069元/千tokens,兩者均為刊例價的6.9折。
相對于國內僅有6%的AIGC用戶滲透率與普通用戶的token使用量,有行業人士認為目前國內AI廠商核心爭奪的是企業級市場,以及企業上云預算。
譚待曾舉例,企業要想用AI做一項創新,至少要消耗100億token。“今年大模型能力提升,應用是很重要的環節,我們判斷,在未來一年,大模型將在越來越多的企業場景從POC階段走到真實的生產系統。”
火山引擎是字節跳動旗下的云服務平臺,以豆包大模型為打開企業創新需求的切入口,實施降價策略,將“企業AI創新成本從80萬元將至8000元”作為重磅“彈藥”搶占客戶,從而推廣、帶動云服務增長,合乎商業曲線。
阿里云也在回應本次通義千問降價的基本情況時表示,開源模型云上調用的成本遠低于私有化部署。一般情況下,自建集群需要考慮的成本有集群硬件采購、軟件部署、網絡費用、電費,及硬件折舊、人力成本等,如果出現計算資源閑置或超載等情況,還需要付出額外成本;而在云上調用大模型API真正實現了隨用隨取,按需使用。
以使用Qwen-72B開源模型、每月1億token用量為例,在阿里云百煉上直接調用API每月僅需600元,私有化部署的成本平均每月超一萬元。
“虧損換收入”or“技術進步必然”
無論是業務關聯性還是定價策略,國內AI大模型市場“會不會像云計算一樣,價格戰也打了,最后卻一地雞毛”成為新的顧慮和討論點。
根據火山引擎公布的價格計算,一元錢能買到豆包主力模型125萬tokens,大約是200萬個漢字,相當于三本《三國演義》。今日阿里云便打出“1元可以買200萬tokens,相當于5本《新華字典》文字量”的應對牌,火藥味十足。
相似的一幕也曾在云計算市場上演。2023年4月,阿里云曾對核心產品價格全線下調15%-50%,騰訊云、京東云、移動云等隨后跟進,降價力度大且涉及廠商多。
2024年2月29日上午,阿里云再次宣布下調價格,對100余款核心產品平均降價20%,當晚京東云便宣布從次日起針對特定云服務商開啟比價活動,并稱“隨便降,比到底!”。
當時面對各界對于價格戰的猜測與疑問,阿里云資深副總裁劉偉光曾表示,“云計算每經歷一段時間的技術積累,都會產生新的規模效應和新的技術紅利”。
大模型降價引發的疑問與產生的應對也十分相似。譚待表示,“豆包模型的超低定價,來源于我們有信心用技術手段優化成本,而不是補貼或是打價格戰爭奪市場份額。”他認為,“羊毛出在豬身上”在企業市場行不通,技術驅動的極致性價比才能真正創造價值。
據了解,火山引擎主要通過模型結構的優化、工程上從傳統的單機推理變為分布式推理,以及把不同負載的推理進行混合調度等方式,帶來超預期的降本效果。
阿里云同樣將此次大幅度降價歸結于公共云技術紅利和規模效應帶來的巨大成本和性能優勢。阿里云從模型和AI基礎設施兩個層面不斷優化,追求極致的推理成本和性能。
例如,阿里云基于自研的異構芯片互聯、高性能網絡HPN7.0、高性能存儲CPFS、人工智能平臺PAI等核心技術和產品,構建了極致彈性的AI算力調度系統,結合百煉分布式推理加速引擎,大幅壓縮了模型推理成本,并加快模型推理速度。
對于AI市場而言,低價策略顯然有助于降低企業使用AI服務的門檻,加快推動AI技術的普及和應用,但也必然導致市場格局的重塑,促使其他廠商也采取降價策略,以維持市場競爭力。
隨著價格戰的持續,國內AI大模型產業格局和市場秩序將面臨更多變數,對于模型層的服務廠商們也提出了更嚴苛的競爭力構建要求,尤其是創業型企業,新開啟的大模型“圈地戰爭”,恐怕無法留給其充足的發展窗口期。