咨詢電話
021-80392549
相比幾年前談論的重點只有GPU,在擁有CPU和DPU之后,英偉達作為系統公司能夠談論的話題更加豐富。
在剛剛過去的Computex和時隔兩年重新回歸線下的ISC 2022(國際超級計算機大會),英偉達都展示了諸多其GPU、CPU、DPU的最新合作成果,這在很大程度上表明了英偉達的“三芯”策略已經初見成效。
英偉達「三芯」策略初步奏效 | ISC 2022
另外,英偉達在混合量子計算中的成果,也體現了其在高性能計算領域的前瞻性布局。
當然,英偉達CEO黃仁勛也在與媒體的交流中再次強調,“英偉達是一家系統公司,提供從硬件到系統軟件的全棧方案,客戶可以按照其需求選擇我們的產品。加速計算的世界與CPU截然不同,我們的產品和方案非常獨特�!�
英偉達的“三芯”到底如何加速那些世界上最快的加速系統?
獨特的CPU+GPU組合
GPU作為英偉達發明的產品,也是英偉達的標簽,在今年GTC 22上,雷峰網(公眾號:雷峰網)介紹了英偉達最新一代Hopper架構GPU H100發布,相比兩年前的Ampere架構A100 GPU,實現了數量級的性能提升。
黃仁勛表示,20個 H100 GPU 便可承托相當于全球互聯網的流量,使其能夠幫助客戶推出先進的推薦系統以及實時運行數據推理的大型語言模型。
不過,相比GPU,英偉達的Grace CPU更能吸引外界的關注。市場上已經有很多優秀的CPU產品,英偉達在這樣的背景下推出CPU讓人感到意外,也讓人好奇Grace CPU的不同之處。
當被問及Grace CPU有何獨特之處時,黃仁勛說,“Grace旨在比其它CPU更好地解決與數據處理有關的問題,能夠更高效處理大量數據,并且與我們的GPU緊密結合,更好地完成解決AI任務�!�
英偉達的Grace CPU超級芯片集成了兩個基于Arm的CPU,有多達144個高性能Arm Neoverse核心,并且帶有可伸縮矢量擴展和1 TB/s的內存子系統,支持最新的PCIe Gen5協議,可實現與GPU之間最高性能連接,同時還能連接NVIDIA ConnectX-7智能網卡以及NVIDIA BlueField-3 DPU。
由此看來,英偉達在設計Grace CPU之處就已經非常明確要將其所有硬件產品之間很好地互聯。這也容易理解,隨著摩爾定律的放緩,異構計算成為了未來趨勢,作為提供高性能計算產品的公司,英偉達有這樣的布局也十分合理。
ISC 2022上,英偉達CPU+GPU的產品組合獲得了認可,美國和歐洲的領先超級計算中心都將率先采用這兩款超級芯片。
美國阿拉莫斯國家實驗室(LANL)今日宣布,其新一代系統Venado將成為美國首個采用NVIDIA Grace CPU技術的系統。Venado是使用HPE Cray EX超級計算機構建而成的異構系統,將同時配備Grace CPU和Grace Hopper,這一系統建成后的AI性能預計將超過10 exaflops(10的18次方,百億億次)。
另一個率先采用英偉達Grace CPU和GPU的系統是瑞士國家計算中心的新系統Alps,基于HPE Cray EX超級計算機構建,這是一個通用系統,向瑞士及其他國家的研究者開放。
英偉達還宣布,源訊、戴爾科技,技嘉科技、慧與、浪潮、聯想和超微宣布計劃部署基于Grace CPU和Grace Hopper超級芯片的服務器。
DPU帶來的大幅性能提升
DPU是一個新概念,在英偉達帶動下成為備受關注的產品,涌現了大量初創公司以及資本的投入
DPU的核心價值是將通信和計算負載從CPU卸載,進而獲得巨大的性能提升。不過DPU能夠帶來的具體的性能提升,仍然需要實踐證明,英偉達借著ISC 2022給出了一些案例。
英偉達「三芯」策略初步奏效 | ISC 2022
洛斯阿拉莫斯國家實驗室(LANL)的杰出高級科學Poole 正與英偉達進行一項為期多年的廣泛合作,旨在將計算多物理應用的性能提高30倍。這其中包括使用 BlueField 及其NVIDIA DOCA軟件框架在計算存儲、模式匹配等。
LANL 已經感受到網絡計算的強大功能,加速閃存盒(ABoF)將固態存儲與DPU和InfiniBand加速器相結合,可為 Linux 文件系統的關鍵性能部分提供加速。它的性能高達同類存儲系統的30倍,并將成為 LANL 基礎架構中的關鍵組件。
俄亥俄州立大學的研究人員展示了 DPU 如何將一個HPC熱門編程模型的運行速度提高 21%。他們通過卸載消息傳遞接口(MPI)的關鍵部分,加速了P3DFFT,這是一個用于眾多大規模HPC仿真的數學庫。
對于運行藥物研發或飛機設計等HPC仿真應用的超級計算機,DPU也能夠帶來高達兩位數的性能加速。
歐洲的多個研究團隊正利用BlueField DPU 加速 MPI 和其他 HPC 工作負載。英格蘭北部的達勒姆大學正在開發一款軟件,用于在 16 個節點的 Dell PowerEdge 集群上使用 BlueField DPU 以實現 MPI 作業的負載均衡。劍橋大學、倫敦和慕尼黑等的研究人員也在使用 DPU。
DPU也在用于加速分子動力學研究,還能用于氣候學、天體物理學、大數據、AI 和更多方面的研究。這些研究人員也在考慮如何使用新一代的BlueField-3 DPU 的核心功能。
三芯策略初步奏效,布局量子計算
高性能計算系統對于算力有著更高要求,也有獨特需求,在英偉達擁有了GPU、CPU和DPU之后,它能夠實現更多的硬件組合,再配合上層的軟件系統,能夠更好滿足前沿應用和更高計算的需求。
通過ISC 2022的眾多成果展示,也能看到英偉達的三芯策略已經初見成效,不同的產品和產品組合已經在HPC、AI等應用中實現性能的顯著提升。
不止于此,英偉達還在布局前沿的量子計算。