界面新聞記者 | 彭新 李彪
界面新聞編輯 | 文姝琪
抓住生成式AI機會的英偉達全面出擊,為大小挑戰者設下新標桿。
隨著人工智能革命席卷而來,英偉達的旗艦技術會議GTC已被外界視為“全球AI風向標”,美國時間3月18日,英偉達CEO黃仁勛的開幕演說更是備受外界關注,在此次黃仁勛的主講環節在美國圣何塞SAP中心舉行。
在開場,黃仁勛以“這不是一場音樂會”進行調侃,稱在科技業外,仍有來自全球價值百萬億美元的行業從業者出席了會議,他對此感到非常自豪。黃仁勛稱,隨著ChatGPT的問世,激發了大眾對于AI的想象,各種創新應用和創業公司陸續誕生,一個全新的時代已經來臨了。
英偉達市值僅2024年就增加了1萬億美元,使其一舉成為標準普爾500指數中表現最好的股票,因此市場高度關注GTC相關消息。美股3月18日,英偉達收報884.55美元/股,漲0.7%。
“Blackwell”成為平臺:GPU、DPU、NVLink全線更新
市場最為關注,英偉達時隔兩年發布全新“Blackwell”架構GPU(圖形處理器)如約亮相。
Blackwell用于數據中心,針對當前火爆的AI大模型優化,訓練、推理性能和能效均大幅提升,與英偉達Grace CPU、新一代網絡芯片等產品一起,面向生成式AI共同組成完整解決方案。黃仁勛還特意稱,Blackwell不只是芯片,而是一個全新的平臺。至此英偉達從芯片走向了類似蘋果的平臺之路。
新GPU架構“Blackwell”得名于美國數學家David Harold Blackwell,基于該架構的GPU芯片B200采用臺積電4NP制造工藝,英偉達稱其可實現在十萬億級參數模型上的AI訓練和實時LLM(大語言模型)推理。
B200由兩個超大型Die(裸片)封裝組合而成,內含超過2080億個晶體管,是前一代800億個晶體管的兩倍以上,整塊芯片還封裝有192GB高速HBM3e顯存。
在演講中,英偉達CEO黃仁勛將Blackwell稱為“推動新一輪工業革命的引擎”,并定義其為一個平臺,基于Blackwell,衍生出GPU、AI超級芯片、服務器、大型計算集群、云服務等多套解決方案。
此前,英偉達發布了“Grace Hopper”超級芯片,隨著Blackwell架構GPU發布,英偉達順勢推出“Grace Blackwell”GB200超級芯片,GB200由兩個B200 GPU和Grace GPU相連。
英偉達表示,基于Blackwell的處理器,B200為人工智能公司提供了巨大的性能升級,其AI性能為每秒20千萬億次浮點運算,而此前最強的H100為每秒4千萬億次浮點運算,約是其5倍。該系統可以部署一個27萬億參數的模型。而目前據稱OpenAI的GPT-4使用了約1.76萬億個參數來訓練系統。
一般而言,在數據中心架構中,通用性更高的CPU負責數據的查詢、存儲;而GPU則更擅長并行計算,因此承擔推理的任務。除了CPU、GPU本身帶寬大小決定了傳輸速度,CPU與GPU間的數據傳輸還存在“帶寬瓶頸”,這一瓶頸同樣由NVLink連接協議方案所解決。
Blackwell GPU計算性能強勁,但面對大模型時代的GPU集群計算,如何解決芯片之間的數據傳輸問題已成為瓶頸。對此,英偉達同步推出新一代NVLink連接協議方案和NVSwitch芯片,組成X800系列交換機,大幅提高數據吞吐量至800Gb/s,用來處理GPU之間的數據傳輸,進一步增強GPU集群擴展性和計算能力。
英偉達還發布了GB200 NVL72,整合英偉達在數據中心硬件方案中GPU、DPU、NVLink等技術的最新成果,構成驅動大語言模型背后的引擎。
GB200 NVL72進入云端,成為云廠商計算實例,黃仁勛在演講中還發布搭載B100 GPU的AI云服務DGX Cloud。通過與云廠商平臺向用戶提供能夠訓練生成式AI大模型,及其他AI應用的算力月租服務,該服務將首先上線亞馬遜云、微軟Azure和甲骨文云。
B200 GPU將于今年晚些時候推出,英偉達稱,包括亞馬遜云科技、戴爾科技、谷歌、Meta、微軟、OpenAI、甲骨文、特斯拉和xAI將計劃采用Blackwell產品。
人形機器人基礎模型和Isaac機器人平臺大更新
英偉達過去針對機器人市場的Isaac 機器人平臺也得到重大更新,包括發布了一款基于Thor芯片的新型人形機器人計算機Jetson Thor,以及一系列機器人預訓練模型、庫和參考硬件,在生成式AI基礎模型和仿真工具,以及英偉達算力的支持下,進一步對人形機器人應用優化。
Jetson Thor提供每秒800萬億次8位浮點運算AI性能,可以運行GR00T等多模態生成式AI模型,并大大簡化設計和集成工作。
英偉達稱,正在為多家人形機器人公司開發一個綜合AI平臺,如1X Technologies、Agility Robotics、Apptronik、波士頓動力公司、Figure AI、傅利葉智能、Sanctuary AI、宇樹科技和小鵬鵬行等。
在黃仁勛的主題演講過程中,迪士尼生產的使用相關英偉達芯片的Orange和Green機器人也登上了舞臺現場亮相。
“開發通用人形機器人基礎模型是當今AI領域中最令人興奮的課題之一。世界各地的機器人技術領導者正在匯集各種賦能技術,致力于在人工通用機器人領域實現突破。”黃仁勛也現場表達了公司對人形機器人研究的支持。
自動駕駛:多項重要合作宣布
黃仁勛在GTC主題演講中宣布,集中式車載計算平臺DRIVE Thor將搭載專為Transformer、大語言模型(LLM)和生成式AI工作負載而打造的全新Blackwell架構。
2015年,英偉達進入車載計算平臺領域,推出了初代自動駕駛計算平臺DRIVE PX和Tegra系列車載芯片,后陸續發布Xavier芯片、Orin芯片問世,。2022年又在汽車業務增速放緩的情況下,英偉達正式推出新一代自動駕駛計算芯片DRIVE Thor,當時公布的單顆算力高達2000 TOPS,是特斯拉FSD芯片算力的14倍。
多家頭部電動汽車制造商在GTC上展示了其搭載DRIVE Thor的下一代AI車型,既包括比亞迪、廣汽埃安、小鵬、理想汽車和極氪等眾多中國車企,也包括了文遠知行等自動駕駛平臺公司。
根據弗若沙利文統計數據顯示,2022年英偉達出貨量占到全球高算力自動駕駛芯片市場份額為82.5%。按照黃仁勛的規劃,未來汽車業務將與數據中心、游戲并列成為英偉達的三大支柱業務。
推理微服務成為AI入口:已用于量子計算、醫藥行業
除了硬件產品,英偉達還與大量與企業合作,推進AI落地。在發布會上,英偉達的推理微服務(NIM)頗具野心,它將作為企業AI的入口。
該服務有望支撐英偉達未來在AI服務上的營收增長,其具體模式為:英偉達提供預訓練好的AI模型并開放API(應用程序接口),再由行業客戶開發應用,以簡化企業自己開發生成式AI應用的成本。
黃仁勛也在現場示范了英偉達內部藉NIM所打造的“芯片設計聊天機器人”,經過數據訓練和模型微調后,聊天機器人即可給出符合芯片設計領域的答案,甚至能同步生成所需的程序代碼。
在量子計算領域,英偉達宣布推出云量子計算機模擬微服務,幫助研究人員和開發人員在化學、生物學、材料科學等科學領域的量子計算研究,該服務基于開源CUDA-Q量子計算平臺,支持用戶在云端構建并測試新的量子算法和應用,包括支持量子-經典混合算法編程的模擬器和工具等。與其他云服務不同,英偉達目前還沒有量子計算機,但未來它將提供第三方量子計算機的訪問。
在醫藥領域,英偉達宣布旗下包括Parabricks、MONAI、NeMo?、Riva、Metropolis,現已通CUDA-X微服務提供訪問,以加速藥物研發、醫學影像、基因組學分析等醫療工作流程。
英偉達還介紹,其已經推出的25個面向醫療領域的微服務,可以加快醫療企業的轉型,包括篩選數萬億種藥物化合物以促進醫學發展、收集更完善的患者數據以改進早期疾病檢測、實現更智能的數字助手等。
長期以來黃仁勛向外強調,摩爾定律已死,計算范式正發生改變,由CPU主導的通用計算轉向GPU的加速計算,GPU在行業場景下有大量替代CPU的機會,生成式AI更大大加速了這一進程。
此前英偉達宣布的計算光刻平臺cuLitho,已成為一大成功案例,在GTC上,英偉達宣布,臺積電和EDA公司新思科技將在生產中使用cuLitho,在生成式AI應用算法幫助下,晶圓廠的芯片生產效率將大幅提高。
數字人和虛擬助手:更真實的游戲體驗來了
游戲起家的英偉達,自然也沒有忘記人工智能技術在游戲領域大顯身手,這次GTC上重點展示的是它的數字人技術。
英偉達數字人平臺包括三項主要技術:NVIDIA ACE、NVIDIA NeMo和RTX光線追蹤技術,分別通過AI驅動游戲角色語言、語音、動畫和圖形。
其中,NVIDIA ACE可幫助開發者通過Audio2Face驅動的面部動畫以及由Riva自動語音識別(ASR)和文本轉語音(TTS)驅動的語音交流,讓數字人交互更加生動。英偉達稱,NVIDIA ACE允許模型在云端和PC上運行,以確保用戶獲得最佳體驗。此外,全球游戲發行商正評估NVIDIA ACE如何改善游戲體驗。
NVIDIA NeMo可幫助開發者提供企業級生成式AI模型,包括精確數據管理、模型個性化定制、檢索增強生成和加速性能等。最后,包含RTX全局光照 (RTXGI) 和DLSS 3.5等渲染技術的集合,可在游戲和應用中實現實時光線路徑追蹤。