界面新聞記者 | 彭新
英偉達用于云端AI計算和超算應用的超級芯片GH200全面投產。
5月29日,英偉達CEO黃仁勛在臺北電腦展上宣布,英偉達基于GH200的系統產品接受訂購,基于英偉達GH200的系統產品將于今年晚些時候上市。
據黃仁勛,作為生成式AI的引擎,首個加速計算處理器GH200整合了英偉達基于Arm架構的Grace CPU和Hopper架構GPU,內置共計超過2000億個晶體管,配備96GB HBM高速顯存以及576GB顯存,在系統內可提供高達900GB/s的總數據吞吐速度(帶寬),是當前行業標準PCIe Gen5接口速度的7倍。
算力之外,大型語言模型對于數據中心帶寬、數據存儲提出極高要求,成為人工智能大模型訓練的瓶頸,而GH200配置的高內存和大帶寬有望解決這一問題。
針對企業,黃仁勛還宣布推出大內存AI超級計算機DGX GH200。該產品集成最多達256個GH200超級芯片,配備多達144TB的共享內存,約為DGX A100超算320GB內存的500倍,可讓開發者更好地開發聊天機器人、互聯網推薦系統算法等大模型AI應用。據悉谷歌、Meta和微軟等科技巨頭將最先測試該系統。
GPU是全球數據中心處理人工智能應用的標配,占據超九成市場份額。英偉達的A100和H100是同類產品中的領先者,在數據中心、超算中心等應用領域扮演關鍵角色。在數據中心領域,英偉達已擁有Grace CPU、Hopper及Ada Lovelace GPU以及DPU等產品。英偉達稱,未來系統廠商和云服務商等合作伙伴將推出多達400多種配置的系統設備,進一步完善產品組合。
隨著GH200投產并進一步為大語言模型AI計算提供算力,英偉達有望在數據中心市場加速擠占英特爾、AMD兩大芯片巨頭的份額。
大語言模型在企業生產環節的應用已然加速。發布會上,英偉達便推出了用于游戲中人物模型開發的“ACE for Games”服務。據黃仁勛介紹,借助大語言模型,游戲中NPC輸入背景故事等必要資料,即可實時與玩家產生互動,產生符合邏輯的語言對話、表情等,增強游戲沉浸感。“這就是未來游戲的樣子。”黃仁勛稱。
黃仁勛還演示了借助大模型,僅通過輸入語言即可讓AI實時對話、唱歌等。
“我們得幫助產業利用到大模型,”黃仁勛在演講中稱,“大模型的普及仍然不夠,企業需要為特定的業務使用定制大模型。”
臺北電腦展開展前夕,英偉達發布的第一財季財報顯示,公司實現營收71.92億美元,同比減少13%,但大幅高于分析師平均預期的65.2億美元。非美國通用會計準則下凈利潤為27.13億美元,每股收益1.09美元,分析師平均預期為0.92美元。財報發布后的盤后交易中,英偉達股價大漲24.63%。
上季度作為大型公司爭相部署人工智能大模型的“高潮”期,對英偉達圖形芯片(GPU)需求大幅增長,使其成為AI競賽最大贏家。受益于此,英偉達數據中心第一財季營收為42.8億美元,同比增長14%,環比增長18%,較分析師預期的39.1億美元高約9.5%,去年四季度同比增長11% 。
顯然,黃仁勛所稱的AI“iPhone時刻”正實打實地轉換為公司業績,亦打破芯片周期“魔咒”。黃仁勛表示,OpenAI的ChatGPT等語言生成式工具和其他人工智能應用的崛起正在推動對計算能力的需求。
此次黃仁勛亞洲行程頗為緊湊,除臺北電腦展外,還在上周六出席臺大畢業典禮。在典禮上,黃仁勛致辭稱,人工智能技術將改變企業格局,并給每一個工作崗位帶來變化。據界面新聞了解,黃仁勛結束本次中國臺灣行程后還將到訪中國大陸,與員工見面并拜訪客戶。
在人工智能服務提供商的巨大需求推動下,英偉達的股價上周五創下歷史新高,市值接近萬億美元。