巨大飞跃！给英伟达1.6万亿个晶体管，它就能承托全球互联网流量

英偉達（Nvidia）一年(nian)一度的GTC大會如(ru)期而至，兩年(nian)一更(geng)新的GPU架構(gou)Hopper也正式(shi)亮相。

今年，NVIDIA創始人兼CEO黃仁勛在英偉達新總部大樓發布了一系列新品，從新架構GPU H100，到Grace CPU 超級芯片，再到汽車、邊緣(yuan)計算的硬(ying)件新品，以及(ji)全面(mian)的軟件更新。

英偉達的全新發布再次向外界宣告，英偉達不止是一家芯片公司，而是全棧計算公司。他們正在加強其在AI、汽車等領域的領導力，同時也在努力占領下一波AI浪潮以及元宇宙的先機。

當(dang)然，作為一家(jia)發明GPU的(de)公司，英偉達的(de)全新(xin)GPU架構依舊是GTC 2022最(zui)值(zhi)得關注(zhu)的(de)新(xin)品。

Nvidia Hopper新架構以美(mei)國(guo)計算機領域的(de)先驅(qu)科學家(jia) Grace Hopper 的(de)名(ming)(ming)字命名(ming)(ming)，將取(qu)代(dai)兩年(nian)前推(tui)出的(de) NVIDIA Ampere 架構。相比上一(yi)代(dai)產品，基于Hopper架構的(de)H100 GPU實(shi)現了數(shu)量級的(de)性能飛躍。

巨大飛躍！給英偉達1.6萬億個晶體管，它就能承托全球互聯網流量

黃仁勛表示，20個 H100 GPU 便可承托相當于全球互聯網的流量，使其能夠幫助客戶推出先進的推薦系統以及實時運行數據推理的大型語言模型。

基于H100 GPU構建(jian)的各種系統，以(yi)及(ji)與Grace CPU 超級芯片組合(he)的各種系統，配(pei)合(he)英偉達(da)多年(nian)構建(jian)強大的軟件生態，將(jiang)成為了(le)英偉達(da)掀起新一代(dai)計算浪潮(chao)的能量。

H100 GPU將在今年(nian)第三(san)季(ji)度出貨(huo)，明(ming)年(nian)上半年(nian)開始供貨(huo)Grace CPU超級芯片。

NVIDIA Eos，比全球最快超級計算機AI性能快 4 倍

有了(le)性能升級(ji)的(de)(de)GPU，英(ying)偉達的(de)(de)第四代(dai)DGX系統(tong)(tong)DGX H100也隨之亮相(xiang)，包括DGX POD和DGX SupePOD兩種架構，能夠滿足大(da)型語言模型、推薦系統(tong)(tong)、醫療健康研究和氣候科學的(de)(de)大(da)規(gui)模計算需求。

巨大飛躍！給英偉達1.6萬億個晶體管，它就能承托全球互聯網流量

每個 DGX H100 系統(tong)(tong)配備八塊 NVIDIA H100 GPU，并由(you) NVIDIA NVLink連接，能(neng)(neng)夠在新的(de) FP8 精度下達(da)到 32 Petaflop 的(de) AI 性(xing)(xing)能(neng)(neng)，比(bi)上一代系統(tong)(tong)性(xing)(xing)能(neng)(neng)高(gao)6倍。每個DGX H100 系統(tong)(tong)還包含(han)兩個NVIDIA BlueField-3 DPU，用于卸載、加(jia)速和(he)隔離高(gao)級(ji)網絡、存儲及安全(quan)服務。

新(xin)(xin)的(de)(de)(de) DGX SuperPOD 架構(gou)采(cai)用全新(xin)(xin)的(de)(de)(de) NVIDIA NVLink Switch 系(xi)統(tong)，通(tong)過這一(yi)系(xi)統(tong)最多可連(lian)接32個(ge)節點，總計256塊(kuai)H100 GPU。第四代NVLink與NVSwitch相(xiang)結(jie)合，能(neng)夠在每個(ge)DGX H100系(xi)統(tong)中的(de)(de)(de)各個(ge)GPU之間實現(xian) 900 GB/s 的(de)(de)(de)連(lian)接速度，是(shi)上(shang)一(yi)代系(xi)統(tong)的(de)(de)(de) 1.5 倍(bei)。

新一(yi)(yi)代(dai)DGX SuperPOD性能(neng)同樣(yang)顯(xian)著提升，能(neng)夠提供1 Exaflops的(de)FP8 AI性能(neng)，比上一(yi)(yi)代(dai)產(chan)品性能(neng)高6倍，能(neng)夠運行具(ju)有(you)(you)數(shu)萬億參數(shu)的(de)龐大LLM工作(zuo)負載，有(you)(you)助于推動氣候(hou)科學、數(shu)字生物(wu)學和 AI 未來(lai)的(de)發展。

基于DGX H100，英偉達將在今年晚些時候開始運行全球運行速度最快的 AI 超級計算機 —— NVIDIA Eos，“Eos"超級計算機共配備 576 臺 DGX H100 系統，共計 4608 塊 DGX H100 GPU，預計將提供 18.4 Exaflops 的 AI 計算性能，比日本的Fugaku（富岳）超級計算機快 4 倍，后者是目前運行速度最快的系統。

在傳統的科學計(ji)算(suan)方面，Eos 超級計(ji)算(suan)機預計(ji)將(jiang)提供 275 Petaflop 的性能(neng)。

巨大飛躍！給英偉達1.6萬億個晶體管，它就能承托全球互聯網流量

黃仁勛說：“對(dui)于 NVIDIA 及OEM 和(he)云計(ji)算合作伙(huo)伴，Eos 將成為先進 AI 基礎設施的藍圖。”

576個DGX H100系(xi)統能夠構(gou)建一臺全球運(yun)行速(su)度最(zui)快的AI系(xi)統，少量的DGX SuperPOD 單(dan)元組合，也(ye)可以為(wei)汽車、醫療健康、制(zhi)造、通(tong)信、零售等行業(ye)提供(gong)開發大型(xing)模型(xing)所需的 AI 性能。

黃仁勛提(ti)到，為支持正在進行AI開發的(de)(de)DGX客戶，NVIDIA DGX-Ready軟件合作伙伴（包(bao)括(kuo)Domino Data Lab、Run:ai和Weights & Biases等）提(ti)供的(de)(de)MLOps解決方案將加入"NVIDIA AI 加速(su)"計劃。

為了簡化AI部署，英偉(wei)達還推出了DGX-Ready 托管服(fu)務計劃，能夠為希望與服(fu)務提(ti)供商開(kai)展合作來監督其(qi)基(ji)礎設施的客戶(hu)提(ti)供支(zhi)持(chi)。通過新的 DGX-Ready 生命周(zhou)期管理計劃，客戶(hu)還可以借助新的 NVIDIA DGX 平臺(tai)升(sheng)級其(qi)現有(you) DGX 系(xi)統。

Grace CPU 超級芯片，最強大的CPU

去年的GTC 21，英(ying)偉達首款數(shu)據(ju)中心CPU Grace亮相，英(ying)偉達的芯片路線(xian)也升級為GPU+DPU+CPU。

今年的GTC 22，英偉達(da)由推(tui)出了(le)首(shou)款面向 AI 基(ji)礎設施和高性(xing)能計算的基(ji)于Arm Neoverse的數據中心專屬(shu)CPU Grace CPU 超(chao)級芯片。

巨大飛躍！給英偉達1.6萬億個晶體管，它就能承托全球互聯網流量

Grace CPU 超(chao)級(ji)芯片是(shi)專為AI、HPC、云計算和超(chao)大規模應用(yong)而設計，能夠在單個(ge)插座（socket）中容納(na) 144 個(ge) Arm 核心，在 SPECrate 2017_int_base 基準測試中的模擬性能達到業界領先的 740 分。根據 NVIDIA 實驗室(shi)使用(yong)同類編譯器估算，這一結果(guo)較當前DGX A100搭載的雙CPU（AMD EPYC 7742）相比高 1.5 倍以上。

黃仁勛稱贊：“Garce的一切都令人驚嘆，我們預計Grace超級芯片屆時將是最強大的CPU，是尚未發布的第5代頂級CPU的2到3倍。”

據介紹，依托帶有糾錯碼的LPDDR5x 內存組成的創(chuang)新的內存子系統(tong)，Grace CPU 超級芯片可實現速度(du)和功(gong)耗的最(zui)佳平衡。LPDDR5x 內存子系統(tong)提供兩倍于傳統(tong)DDR5設計的帶寬，可達到1 TB/s ，同時(shi)功(gong)耗也大幅降低，CPU加內存整體功(gong)耗僅500瓦。

值得注意的(de)(de)是，Grace CPU超級芯(xin)片(pian)由兩個CPU芯(xin)片(pian)組(zu)成，通(tong)過NVLink-C2C互(hu)連(lian)(lian)在一起。NVLink-C2C 是一種新型的(de)(de)高(gao)速(su)、低延遲、芯(xin)片(pian)到芯(xin)片(pian)的(de)(de)互(hu)連(lian)(lian)技術，將支(zhi)持定制裸片(pian)與NVIDIA GPU、CPU、DPU、NIC 和 SOC 之間實現一致的(de)(de)互(hu)連(lian)(lian)。

借助先進的(de)封裝技術，NVIDIA NVLink-C2C 互(hu)連鏈路(lu)的(de)能效最多可比NVIDIA芯片上的(de)PCIe Gen 5高出25倍，面積效率高出90倍，可實現每秒900GB乃至更高的(de)一致互(hu)聯(lian)帶寬(kuan)。

得益于Grace CPU 超級(ji)(ji)芯片(pian)可以運行所(suo)有的英(ying)偉達計算(suan)軟(ruan)件棧，包括NVIDIA RTX、NVIDIA HPC、NVIDIA AI 和 Omniverse。Grace CPU超級(ji)(ji)芯片(pian)結合(he)NVIDIA ConnectX-7 網(wang)卡，能夠靈活(huo)地(di)配置(zhi)到服(fu)務(wu)器中，可以作為獨立的純CPU系統(tong)，或作為GPU加速(su)服(fu)務(wu)器，搭載(zai)一塊(kuai)、兩塊(kuai)、四塊(kuai)或八(ba)塊(kuai)基于Hopper的GPU，客戶通(tong)過維護一套軟(ruan)件棧就(jiu)能針對自身特定的工作負載(zai)做好性能優化。

巨大飛躍！給英偉達1.6萬億個晶體管，它就能承托全球互聯網流量

今日發(fa)布(bu)的NVIDIA Grace超級(ji)芯(xin)片(pian)系列以及去年(nian)發(fa)布(bu)的Grace Hopper超級(ji)芯(xin)片(pian)均采(cai)用了NVIDIA NVLink-C2C 技術來(lai)連(lian)接處理器芯(xin)片(pian)。

英偉達表示，除NVLink-C2C外，NVIDIA還將支持本月早些時候發布的 UCIe（Universal Chiplet Interconnect Express，通用小芯片互連傳輸通道）標準。與NVIDIA芯片的定制芯片集成既可以使用 UCIe 標準，也可以使用 NVLink-C2C。

国产人妻精品区一区二区,国产农村妇女毛片精品久久,JAPANESE日本丰满少妇,日本公妇理伦a片,射精专区一区二区朝鲜

最新Hopper架構H100 GPU的6大突破

NVIDIA Eos，比全球最快超級計算機AI性能快 4 倍

Grace CPU 超級芯片，最強大的CPU