編譯|段祎
編輯|Panken
芯東西3月23日消息,據Tom’s Hardware報道,近日,美國人工智能訓練芯片巨頭英偉達CEO黃仁勛在GTC大會上就其即將推出的基于Arm架構的Grace CPU延遲發貨一事向Tom’s Hardware的記者Paul Alcorn做出了解釋,稱芯片延遲發布是正常情況,且由于此次研制的Grace芯片添加了許多創新設計,工作量增大,相應的制造時間有所延長。
在本周二的GTC大會上,黃仁勛首次展示了基于Arm架構的Grace芯片,該芯片在僅使用60%的功率下比基于x86架構的芯片快1.3倍。并且Grace CPU和Hopper GPU的新設計可以讓芯片實現速度和效率兼顧的共享內存中保存的信息,同時速度是PCIe接口的七倍。
一、推遲發布是正常現象,基于Arm架構帶來更大工作量
談及Grace CPU和Grace Hopper Superchip系統延遲交付終端市場的問題。他解釋道:“Grace和Grace Hopper都在生產中,‘硅片現在正在工廠里飛來飛去’。系統正在制作中,我們發布了很多公告。世界上的原始設備制造商(OEM)和計算機制造商正在構建它們。”黃仁勛還說,英偉達只用了兩年的時間來開發芯片,考慮到現代芯片通常需要多年的設計周期,這個時間相對較短。
▲Grace CPU(圖源:Tom’s Hardware)
此前,美國芯片制造巨頭AMD和英特爾開發的CPU在芯片量產上市前就會被部署到超大規模計算的設備上,不過,目前英偉達Grace芯片是否已經提供給客戶使用還是未知的,黃仁勛透露他們正在向客戶提供芯片樣品。
一般而言,像英特爾這樣的企業,也經常會延遲推出芯片,即便是基于其幾十年來成熟的在硬件和軟件平臺占主導地位的x86架構構建芯片,推出新芯片的難度也并不小。
相比之下,英偉達的Grace和Grace Hopper芯片在芯片設計方面注入了許多的全新思考,它采用了創新的芯片間互連技術。英偉達使用Arm指令集也意味著軟件優化和遷移的工作更重,該公司需要構建一個全新的平臺來生產該芯片。
二、Grace芯片消耗60%功率,數據處理速度快一倍多
黃仁勛在他的其余回應中提到了關于芯片設計思考的一些內容,他說:“我們從Superchips(超級芯片)而不是chiplet(小芯片)開始,是因為我們想要構建的東西很大,不過這兩種產品現在都在生產中。英偉達正在做很多測試,軟件也正在被遷移到芯片,同時英偉達向客戶提供芯片樣品。在會上,我用確切的數字展示了Grace芯片的各大性能優勢,但我不想堆砌數字來增加演講的負擔,但芯片的性能真的非常棒。”
在問答環節中,黃仁勛聲稱該芯片在HiBench Apache Spark內存密集型基準測試中比下一代x86服務器芯片數據處理速度快1.2倍,在谷歌微服務通信基準測試(Google microservices communication benchmark)中快1.3倍,同時只消耗了60%功率。
他說這允許數據中心將1.7倍以上數量的Grace芯片部署到功率受限的裝置中,每臺服務器的吞吐量提高了25%。他還說Grace在計算流體動力學 (CFD)工作負載方面的速度提高了1.9倍。
三、為云計算、AI定制芯片,兼具低功耗、高性能
Grace芯片在某些應用場景中雖然表現出超強的性能和效率,但英偉達并沒有計劃將它們定位到通用服務器市場。該公司針對特定使用場景定制了芯片,例如人工智能和云計算場景,這些場景需要支持卓越的單線程和內存處理性能以及出色的能效。
黃仁勛告訴說:“現在幾乎每個數據中心都受到功率限制,我們設計的Grace在功率受限的環境中表現出色”,“在那種情況下,你必須既有非常高的性能,又必須有非常低的功率,而且效率也要非常高。因此,與最新一代CPU相比,Grace系統的功率/性能效率大約高其兩倍。”
▲相同功耗下,英偉達Grace CPU性能比較圖(圖源:Tom’s Hardware)
“而且它是針對不同的場景而設計的,所以這是非常好理解的。”黃仁勛繼續說道,“例如,我剛才描述的內容對大多數企業來說并不重要。但它對提供云服務的企業來說很重要,對電力消耗大的數據中心也很重要。”
能源效率比以往任何時候都更受關注,黃仁勛說,他們最近評測過的AMD EPYC Genoa和英特爾的Sapphire Rapids等芯片的功率現在分別達到400瓦和350瓦。這需要特殊的新空氣冷卻解決方案來控制標準設置下的巨大功耗,并為達到芯片的最高性能提供液體冷卻。
相比之下,Grace的低功耗將使芯片更容易冷卻。正如GTC大會上首次展示的那樣,英偉達的144核Grace封裝為5英寸x8英寸,可以裝入體積非常小的被動冷卻模塊中。這些模塊仍然依靠空氣冷卻,但兩個模塊可以在單個超薄的1U機箱中進行空氣冷卻。
四、同時嵌入CPU、GPU,芯片間互聯速度快7倍
英偉達還在GTC大會上首次展示了其Grace Hopper 超級芯片。Superchip在同一個封裝上結合了Grace CPU和Hopper GPU,這兩個模塊就可以裝入一個服務器機箱中。
▲Grace Hopper(圖源:Tom’s Hardware)
這種設計的最大優勢是使CPU與GPU的結合更連貫協調,提供更低延遲的芯片與芯片之間的連接,其接口速度是PCIe接口的七倍,之前的設計無法實現速度和效率兼顧以共享內存中保存的信息,而現在CPU與GPU的結合成功解決了這一問題。
黃仁勛解釋說,這種方法非常適合人工智能、數據庫、推薦系統和大型語言模型(LLM),所有這些對這項具有新設計的芯片都有著巨大的需求。采用新設計的Grace芯片通過允許GPU直接訪問CPU的內存,簡化了數據傳輸以提高性能。
英偉達的Grace芯片可能有點落后于其此前制定的發布計劃,由于芯片制造商和原始設備制造商(OEM)在供應鏈中的關系,芯片制造商設計芯片并將設計方案交付給OEM,英偉達和華碩、Atos、技嘉、HPE、Supermicro、QCT、Wiston和Zt密切合作,這些合作伙伴都在為市場準備OEM系統,OEM系統現在預計將在今年下半年推出,但英偉達尚未說明給到這些合作伙伴芯片的確切時間。
結語:Grace芯片性能優勢顯著,推遲發布影響較小
各大芯片公司新芯片的研發通常需要較長的時間周期,再加上運輸鏈和設計難度的影響,這些公司往往會被迫推遲芯片發布時間。對英偉達此次基于Arm架構的Grace芯片發布延遲,黃仁勛依舊持樂觀態度,對外只是戲稱“硅”正在工廠“起飛”,預計今年下半年正式推出Grace芯片。
據黃仁勛介紹,此次Grace芯片僅在60%的低能耗下,速度就能簡單超越下一代x86芯片。同時,Grace的低功耗將使芯片更容易冷卻。Grace CPU和Hopper GPU的新設計可以實現共享內存中保存的信息,增強了CPU+GPU內存一致性。相比市面上現有的芯片,英偉達的Grace芯片性能優勢明顯,盡管此次新芯片延遲發貨,但對英偉達影響似乎并不大,我們拭目以待下半年Grace芯片發布。
來源:Tom’s Hardware