文丨鏡相工作室 彭杰克
編輯丨盧枕
短短一年時間,兩次大會,臺上的“AI教主”黃仁勛依舊穿著熟悉的皮衣,卻多了些磕絆,少了些從容。
上一次GTC大會,正是英偉達如日中天的時候。各國科技公司對生成式AI進行不計回報的瘋狂投入,將英偉達一步步推上神壇,一度成為全世界市值最大的公司。
但今年以來,英偉達的股價持續震蕩。1月27日美股收盤,單日跌幅超過17%,創下公司歷史上單日下跌最多的紀錄;截至3月10日,遠期市盈率從1月的45倍回落至28倍,低于五年均值37.6倍。
市盈率的回落,背后是一個殘酷的現實:市場沒那么看好英偉達的未來了,AI樹立起來的“算力信仰”正在動搖。
因此,在一年一度、被譽為“科技春晚”的GTC大會上,老黃的使命變了——不再是讓人們看到英偉達又搞出了多么牛逼的產品,而是讓人們重新相信他們真的需要這些產品。
黃仁勛的AI路線圖
站在英偉達的視角來看,這是一屆需要打起精神來直面諸多挑戰的GTC大會。
將英偉達芯片捧上神壇的AI算力市場正發生變化。Deepseek的開源以及長思維鏈技術路線,讓生成式AI廠商的關注點從堆量訓練走向推理,而逐漸滲透的ASIC架構芯片,其在AI推理場景中展現出的成本、能效優勢,對英偉達在AI算力市場的份額構成直接威脅。
英偉達內部也面臨壓力。原計劃去年第三季度量產、第四季度發貨的Blackwell系列芯片,因設計缺陷問題,推遲至2025年第一季度才開始批量出貨,間接導致2025財年第四季度的毛利率下降,且預計下個季度會進一步收縮。
在期待或懷疑之中,北京時間3月19日凌晨1點12分,英偉達創始人黃仁勛穿著熟悉的黑色皮衣姍姍來遲,一上來就開始講述從生成式AI到代理式AI(Agentic AI)、Physical AI的變革,這背后意味著巨大的算力需求。
今年年初,Deepseek-R1模型的高效和開源,曾一度讓市場判斷,大多企業將不再需要英偉達昂貴的GPU來做大參數模型的預訓練。這也被認為是英偉達股價受重挫的直接原因。
2月下旬,黃仁勛談到Deepseek時說:“這是一項卓越的創新,但更為重要的是,它開源了一個世界級的推理AI模型。幾乎每一位AI開發者都在應用R1或思維鏈以及像R1這樣的強化學習技術來提升其模型的性能。”
GTC 2025上,黃仁勛仍然看好推理AI,巧妙地選擇用長思維鏈(CoT)推理需要消耗的tokens來做比較。他向傳統大語言模型(LLM)和推理模型提出了同一個問題:300人的婚禮上如何安排座位。LLM消耗439 tokens快速得出了一個錯誤答案,而推理模型消耗8559 tokens,經過較長時間的思考得出了一個得體的答案。

黃仁勛想說明的是,諸如Deepseek-R1這類推理模型,意味著更高的tokens消耗和更高的算力需求,只是這種算力需求從訓練環節后置到了推理環節。
在黃仁勛看來,推理模型也不是AI的終點,當下我們所處的Agentic AI,AI要處理更多更復雜的任務,有大量的應用將會出現,帶來算力需求的又一次爆發;而到了未來的Physical AI階段,AI甚至會復刻物理世界,那代表了將會有無限的tokens需要被處理。
結論是,用預訓練放緩來判斷AI的未來,或者英偉達的未來,就有點短視了。黃仁勛給了一個簡單粗暴的預判:“未來所需要的算力將是過去的100倍。”
那各大AI廠商要如何面對未來的AI新范式呢?沒錯,還是要買英偉達芯片,英偉達的護城河就在于無處不在——硬件上Blackwell系列芯片涵蓋了從預訓練、后訓練到推理的整個AI市場,跨越云端到本地再到企業環境;軟件上,CUDA仍然是繞不過去的高墻,黃仁勛強調說:“CUDA現在無處不在,它存在于每個云中,每個數據中心,可以從世界上的每家電腦公司買到,幾乎無處不在。”在他口中,CUDA已不再是一個單純的開發工具,而是成了“AI時代的英語”。
對于老黃的新故事,資本市場給出的反應是遲疑。演講結束后,英偉達股價沒有提振,反而一路向下,截至收盤,下跌3.43%。
英偉達把護城河又往深挖了挖
動搖英偉達“算力信仰”的,一度被認為是Deepseek創造出的效率神話。
Deepseek的天才工程師們,用自己的聰明繞過了英偉達芯片的一些限制,用算法和軟件能力挖掘出了更多的性能,從而節省了大量成本。
現在,英偉達大開方便之門,推出了自己的官方版本的“后門”——Nvidia Dynamo。
這是英偉達在推理領域構建的新CUDA,專為推理、訓練和跨整個數據中心加速而構建的開源軟件。在現有Hopper架構上,Dynamo可讓標準Llama模型性能翻倍。而對于DeepSeek等專門的推理模型,NVIDIA Dynamo的智能推理優化還能將每個GPU生成的token數量提升30倍以上。
當然,為了推銷最新的Blackwell系列芯片,Dynamo在Blackwell上的效果更好。在同等功耗下,Blackwell的性能比Hopper高出4-5倍。在推理模型的測試里,Blackwell的性能大約是Hopper的40倍。
目前,Blackwell系列芯片,GB200和B200已全面投產。這些產品采用臺積電4nm工藝制造,擁有高達2080億個晶體管。黃仁勛透露,2024年,美國前四大云服務提供商(CSPs)購買了130萬塊Hopper架構芯片,2025年又購買了360萬Blackwell架構芯片。
為了讓Blackwell像蘋果全家桶那樣深入到每個場景,針對不同類型的客戶,小到個人工作站,大到數據中心集群,英偉達推出了可以運行2000億參數模型的AI PC產品DGX Spark,為“AI推理時代”專門定制的Blackwell Ultra NVL72機柜,和基于Blackwell Ultra、即插即用的DGX Super POD AI超算工廠等一系列產品,涵蓋了AI時代大部分主流場景。
當然,作為“秀實力”的傳統環節,黃仁勛公布了新一代AI芯片Rubin,以“證實暗物質存在”的女性科學先驅薇拉?魯賓(Vera Rubin)命名。據介紹,Rubin系列芯片的性能可達Hopper的900倍,而Blackwell是Hopper的68倍。Vera Rubin NVL144將于2026年下半年推出,Rubin Ultra NVL576將于2027年下半年推出。
不管是Blackwell全家桶,還是像CUDA一樣只能運行在英偉達GPU上的Dynamo,都是英偉達在硬件和軟件層面上進一步挖深自己的護城河,在空間上做到無處不在,在時間上做到別人無法短時間內追上,英偉達就能繼續維持“AI領導者”的地位。
賣鏟子以外,英偉達也在講一些新的故事。本屆GTC,英偉達將主辦首屆“量子日(Quantum Day)”,黃仁勛將參加與量子計算行業業內人士的小組討論。但主題演講現場,黃仁勛并未提及相關細節。
頗為戲劇化的是,兩個月前的CES展會期間,黃仁勛說:“如果你說15年內就能制造出非常有用的量子計算機,那可能有點早。如果你說30年,那可能已經晚了。如果你說20年,我想我們很多人都會相信。”該言論直接導致了美國量子計算概念股崩盤式下跌。
窮追猛打的競爭者們
長期來看,似乎英偉達的領先地位還能保持很久,但短期并非沒有隱憂。
截至今年1月底的2025財年第四季度業績報告顯示,報告期內,英偉達數據中心收入為356億美元,同比增長93%,較上季度環比增長16%,貢獻了英偉達91%以上的營收,這個數字在去年同期和前年同期大約為80%與60%左右。這主要得益于Blackwell系列芯片,其在第四財季實現了110億美元的銷售額,創下了公司歷史上產品最快的增長速度。
但Blackwell系列芯片量產初期的成本也給英偉達帶去了不小的壓力。截至今年1月底的2025財年第四季度,英偉達毛利率為73%,較上季度下降3個百分點,而根據最新的業績指引,下季度英偉達的毛利率可能會進一步收縮至70.6%。
更大的威脅來自ASIC架構以及在這之下大力投入自研芯片的巨頭客戶們。
與廣義上的GPU相比,ASIC架構芯片可以專為特定推理任務而定制,且整體晶體管利用率更高,在特定任務上更高效、成本更低,對于中小公司來說是性價比很高的選擇。
同時,在英偉達GPU以高昂的價格一家獨大之時,亞馬遜、谷歌、微軟等英偉達大客戶們正奮力推進自研芯片流程,或是從英偉達的競爭對手AMD手中購買芯片。
根據智能涌現2024年中報道,用掉了世界上1/4算力的谷歌,“可能年底就不對外采購芯片了”。過去谷歌自研TPU更多基于成本考慮,比如擔心英偉達隨意漲價,或者供應不夠穩定,如今谷歌的造芯策略更為激進——“幾乎是不計代價和成本投入”。而微軟已經采購上萬片AMD的產品,特斯拉、Midjourney、美國國家實驗室、韓國電信也都已批量提貨。
不過,CUDA暫時還能擋一擋這些激烈的攻勢,哪怕亞馬遜的Trainium芯片能將成本壓到GPU的1/3,但開發者需要為每一款ASIC重寫代碼的現實,依然讓多數企業望而卻步。
另一大潛在的風險是地緣政治變化帶來的挑戰,大洋彼岸的對手們正在抓緊機會蠶食英偉達的市場,目前英偉達也沒有太好的解決辦法來應對。
光靠“算力老仙,法力無邊”,已經沒法不管不顧地向前猛沖了。擺在黃仁勛面前的問題是,如何平衡短期毛利率壓力與長期增長敘事。只有讓現在的投資者賺到錢,英偉達才能有更廣闊的未來。
參考資料
智能涌現:《圍剿英偉達》
虎嗅:《英偉達仍未失守》
硅星人Pro:《賣393億賺220億,英偉達不會暴跌但也不再暴漲了》