美國企(qi)業對 H100 處理器的旺盛需求,推動(dong)英(ying)偉達(da)市(shi)值飆升至 1 萬(wan)億美元。
上周,英偉(wei)達股價一周內上漲了 25%,市值直逼萬(wan)億美(mei)元,其創始人黃仁勛的身價也突破了 330 億美(mei)元。
春風得意的黃老板于 5 月 29 日現身在中國臺北舉辦的 COMPUTEX 大會,并在大會上發布了面向所有行業的生成式AI平臺。“我們正在重新發明計算機,加速計算和人工智能標志著計算正在被重(zhong)新定義。”黃(huang)仁勛表示。
黃仁勛正在帶領英偉達從一家芯片公(gong)(gong)司(si)轉向提供AI計算系統的(de)公(gong)(gong)司(si),他此(ci)前稱,人工智能的(de) iPhone 時刻已經來(lai)臨。
英偉達發布超級芯片 GH200 和 AI 計算平臺
受 AI 熱潮的(de)(de)推動,英偉達也在硬件領域緊跟技術潮流,發布了一系列產品和解決方案:推出大(da)內(nei)存生(sheng)成式AI超(chao)(chao)級(ji)計(ji)算機 DGX GH200,可加速生(sheng)成式 AI 設計(ji)的(de)(de) Grace Hopper 超(chao)(chao)級(ji)芯片(pian) GH200 已全(quan)面投(tou)產;推出全(quan)新(xin)加速以太網平臺 Spectrum-X,為游戲(xi)提供定制化 AI 模型代工服務;與全(quan)球最大(da)的(de)(de)營銷服務機構 WPP 合作打(da)造生(sheng)成式 AI 內(nei)容引擎,多(duo)家世界頂(ding)級(ji)電(dian)子制造商采用英偉達生(sheng)成式 AI 工具與 Omniverse 平臺構建先(xian)進的(de)(de)數(shu)字工廠。
據(ju)悉,NVIDIA? GH200 Grace Hopper 超(chao)級(ji)芯片(pian)將為全球各地即將上(shang)線的(de)系統提供運行復雜 AI 和(he) HPC 工作負載(zai)所需的(de)動力。在 COMPUTEX 上(shang),黃仁勛公布(bu)了關于(yu) GH200 Grace Hopper 超(chao)級(ji)芯片(pian)的(de)更多(duo)細節(jie)。
NVIDIA? GH200 Grace Hopper 超級芯片使用 NVIDIA NVLink?-C2C 互連技術,將基(ji)于 Arm 的(de) NVIDIA Grace CPU 和(he) Hopper GPU 架構互聯(lian),實現了(le)高達 900GB/s 的(de)總(zong)帶寬,比傳統加速系(xi)統中(zhong)的(de)標(biao)準(zhun) PCIe Gen5 通道(dao)高出 7 倍(bei),算力有了(le)很大程(cheng)度的(de)提(ti)高,并且能夠滿(man)足(zu)要求最苛(ke)刻的(de)生成式 AI 和(he) HPC 應用。
具體(ti)來說, GH200 超級芯片是(shi)將 72 核的 Grace CPU、H100 GPU、96GB 的 HBM3 和 512 GB 的 LPDDR5X 集成在同一(yi)個封裝(zhuang)中,擁有(you)高達 2000 億個晶體(ti)管。這種組合提(ti)供了 CPU 和 GPU 之間(jian)驚(jing)人的數據帶(dai)寬,高達 900 GB/s,為某些內存(cun)受限的工作負載提(ti)供了巨大的優勢。
值得一提的(de),英偉(wei)達正(zheng)式(shi)發(fa)布了一款新型大(da)內存 AI 超級(ji)計算機——由 NVIDIA GH200 Grace Hopper 超級(ji)芯(xin)片和(he) NVIDIA NVLink Switch System 驅(qu)動的(de) NVIDIA DGX 超級(ji)計算機,旨在(zai)助(zhu)力(li)開發(fa)面向生(sheng)成式(shi) AI 語(yu)言應用、推薦系統(tong)和(he)數據分析工作負載的(de)巨型、下一代模型。
DGX GH200 的(de)細節(jie)還不太(tai)清楚,但已(yi)確(que)認(ren)英偉(wei)(wei)達(da)使用了一(yi)種(zhong)新(xin)的(de) NVLink Switch 系統(tong),包含 36 個(ge) NVLink 開關(guan),將(jiang) 256 個(ge) GH200 Grace Hopper 芯片(pian)和 144TB 的(de)共享內(nei)存(cun)連接(jie)成一(yi)個(ge)單元,英偉(wei)(wei)達(da) CEO 黃仁(ren)勛表(biao)示(shi),GH200 芯片(pian)為“巨(ju)型(xing) GPU”。英偉(wei)(wei)達(da)表(biao)示(shi),256 顆 Grace Hopper 超級(ji)芯片(pian)將(jiang) DGX GH200 的(de)“AI 性能”提升到(dao)了 exaflop(一(yi)百萬萬億次(ci))。
NVIDIA 加(jia)速(su)(su)(su)計算副總(zong)裁(cai) Ian Buck 表示(shi):“生(sheng)成式AI正(zheng)在(zai)迅速(su)(su)(su)帶來業(ye)(ye)務(wu)變革,解鎖醫(yi)療(liao)、金融、商業(ye)(ye)服務(wu)等行(xing)(xing)業(ye)(ye)的(de)新機遇(yu)并加(jia)速(su)(su)(su)這些行(xing)(xing)業(ye)(ye)的(de)研發(fa)工作。隨著 Grace Hopper 超級芯片的(de)全面(mian)投產,全球的(de)制造商很快將會提(ti)供企業(ye)(ye)使用(yong)專有數據構(gou)建和(he)部署生(sheng)成式 AI 應用(yong)所(suo)需(xu)的(de)加(jia)速(su)(su)(su)基(ji)礎設施。”
ChatGPT 問世后,芯片行業變天了
2022 年,英偉達發布(bu)了 H100——這(zhe)是其有史以(yi)來(lai)最強大、也最昂貴(gui)的處理器(qi)之一,單位價格約為 4 萬(wan)美元。當時看來(lai),這(zhe)款產品的發布(bu)時機并(bing)不理想,企業客戶紛紛在巨大的通(tong)脹壓(ya)力(li)下削(xue)減開支(zhi)。
但就在 11 月,ChatGPT橫空出世后(hou),情況發生了(le)變化。
英偉達首席執行官黃仁勛表示,“剛剛經歷艱難(nan)的(de)一年,情(qing)況似(si)乎一夜之間就出(chu)現了(le)轉機(ji)。”OpenAI 打造的(de)這款熱門聊天(tian)機(ji)器人堪稱“尤里卡時刻”(或(huo)頓悟(wu)時刻),“立即創(chuang)造出(chu)巨大需求”。
ChatGPT 的(de)迅(xun)速躥紅在全球(qiu)(qiu)領先的(de)科技巨頭和初創(chuang)公司之間掀起(qi)一波軍(jun)備(bei)競(jing)賽,各方開始(shi)競(jing)相爭奪寶貴的(de) H100 資源。黃仁(ren)勛稱這款產品是“全球(qiu)(qiu)首個為生(sheng)成式(shi) AI 專(zhuan)門設計的(de)計算機芯片”,能夠(gou)幫助 AI 系統更(geng)快輸出順暢(chang)自然的(de)文本(ben)、圖像和內容。
就(jiu)在(zai)過去一周(zhou),在(zai)正(zheng)確(que)的(de)時(shi)間(jian)推出(chu)正(zheng)確(que)的(de)產品再(zai)次成為決勝的(de)關鍵(jian)。英偉達上周(zhou)三宣布,其(qi)截(jie)至 7 月的(de)本(ben)季度銷售額預計(ji)將達 110 億(yi)美元,較華爾街(jie)之(zhi)前的(de)估計(ji)高出(chu) 50%以(yi)上。這(zhe)波強(qiang)勁(jing)浪潮背后,無疑是眾多大型科技公司(si)恢復數據中心支出(chu)和(he)瘋狂采購 AI 芯片的(de)現實需求。
投(tou)資人(ren)對此番預測也給(gei)出了積極回應,僅(jin)上(shang)周四一天之(zhi)內(nei)就讓(rang)英(ying)偉達公司(si)(si)的市值增加了 1840 億(yi)美元。于是這家已經是全球(qiu)最有價值的芯片(pian)公司(si)(si)在(zai)估值方面開始逼(bi)近萬億(yi)大關。
這項技術有望(wang)重塑各行各業(ye),帶(dai)來巨(ju)大的生產力(li)提升并取代數(shu)百萬個工作(zuo)崗位。
而(er) H100 芯片將加快這一(yi)技術飛躍。H100 基(ji)于名為“Hopper”的(de)英偉達全新芯片架構,以(yi)美國編程先(xian)驅 Grace Hopper 的(de)名字(zi)命名,如(ru)今已經是(shi)整個(ge)硅谷最(zui)炙手可(ke)熱的(de)稀缺資源。
黃仁勛表示,“就在我們(men)著手將(jiang) Hopper 投入(ru)量產之際,AI 突破(po)到來了。”也(ye)就是說,Hopper 剛好是在 ChatGPT 正式亮相的(de)幾周之前開始大規模生產。
黃仁勛(xun)對于持續收益的信心,很大(da)程(cheng)度來自與芯片制造巨(ju)頭臺(tai)積電的密切合作。雙方計劃擴(kuo)大(da) H100 的生產(chan)規模,以(yi)(yi)滿足(zu)微軟、亞馬遜和谷歌等云服務商,Meta 等互聯(lian)網大(da)廠(chang)以(yi)(yi)及(ji)其他(ta)企業客戶的爆(bao)發式需(xu)求。
CoreWeave 是一(yi)(yi)家專注(zhu) AI 的云基礎(chu)設(she)施初創公司。作為首(shou)批收到 H100 的客戶之一(yi)(yi),公司首(shou)席戰(zhan)略(lve)官(guan) Brannin McBee 表示(shi)“這已經成(cheng)為地球(qiu)上最稀缺的工程資源之一(yi)(yi)”。
也有部分客戶要等待半(ban)年之久,才能拿(na)到(dao)自己用來訓(xun)練大(da)規模數(shu)據模型的 H100 芯片供應。更(geng)多(duo) AI 初創公司則紛紛表示擔心,稱在(zai)需求(qiu)起飛那一刻,H100 就(jiu)將面臨供不(bu)應求(qiu)。
英偉達成為了 AI 浪潮中的首批贏家
馬斯克也已經為自己的 AI 初創公司 X.ai 買(mai)下大量(liang)英(ying)偉達(da)芯片(pian),他本(ben)人也在(zai)本(ben)周(zhou)《華爾街日(ri)報》的活(huo)動中表示,目前(qian) GPU“比藥品更(geng)難獲得”,還開玩(wan)笑說“而且(qie)這種情況在(zai)舊(jiu)金山隨處可見”。
“計算成本(ben)已(yi)經(jing)飆(biao)升至天(tian)文數字(zi),最低(di)的準入門檻也是(shi)投入 2.5 億美元為生成式 AI 系統構建服務器硬件(jian)。”
事實證(zheng)明(ming),H100 特(te)別受(shou)到微軟和(he)亞馬(ma)遜等(deng)大型科技(ji)企業(ye)的(de)歡迎。他們正紛紛建立以 AI 工作負載(zai)為中心(xin)的(de)更(geng)多(duo)數據中心(xin)。此外,OpenAI、Anthropic、Stability AI 和(he) Inflection AI 等(deng) AI 初創公司也在(zai)密切關注 H100 的(de)性能承諾,希望借(jie)助它的(de)力量加(jia)快產品發布、降低訓練成(cheng)本。
英偉(wei)達超大規模與(yu)高(gao)性能計(ji)算業務負責人 Ian Buck 表示(shi),“從(cong)購買難(nan)度(du)來講,沒錯,新(xin)架構 GPU 就是(shi)不容易買到(dao)。”肩負增加 H100 以滿(man)足需(xu)求(qiu)這項艱(jian)巨(ju)任(ren)務的(de) Buck 承(cheng)認(ren),“目前供不應求(qiu)已經(jing)成為規模性事件”,部(bu)分(fen)大客戶正(zheng)瘋狂采購數以萬計(ji)的(de) GPU。
這種性能極強的(de)(de)(de)(de)芯片(pian)負責充當(dang)數據(ju)中(zhong)心的(de)(de)(de)(de)“加速器”,其搭載的(de)(de)(de)(de) 800 億個晶體管(guan)達到最新款 iPhone 處理(li)器晶體管(guan)數的(de)(de)(de)(de) 5 倍。盡管(guan) H100 的(de)(de)(de)(de)售價(jia)高(gao)(gao)達 2020 年發售的(de)(de)(de)(de)上代(dai) A100 芯片(pian)的(de)(de)(de)(de) 2 倍,但早期買家紛紛表示其性能至少(shao)提高(gao)(gao)了 3 倍,所以仍然極具性價(jia)比。
作為 Stable Diffusion 圖像(xiang)生成服(fu)務(wu)背后的廠商,Stability AI 聯(lian)合(he)創始人兼 CEO Emad Mostaque 表(biao)示“H100 解決了長期困擾 AI 模(mo)型創建者的可擴展性(xing)問(wen)題”。“這非常重(zhong)要,它能(neng)讓我們(men)更快(kuai)訓(xun)練出更大的模(mo)型,真正將研究問(wen)題轉化(hua)為工程問(wen)題。”
雖(sui)然 H100 的發布可謂正當其時,但英偉(wei)達在 AI 領(ling)域的突破(po)實際源自近 20 年前的軟(ruan)件創新。
英偉達的(de) Cuda 軟件誕生于 2006 年(nian)(nian),作(zuo)用(yong)就是讓 GPU 在圖形(xing)之(zhi)外(wai)作(zuo)為(wei)其他工作(zuo)負載類型的(de)加速器。待時間來(lai)到 2012 年(nian)(nian)左(zuo)右(you),“AI 終(zhong)于找(zhao)上了我們。”
加拿大的研(yan)究人(ren)(ren)員們很快意識到 GPU 非常適合用于(yu)創建(jian)神(shen)經網(wang)絡,這是(shi)一(yi)種由人(ren)(ren)腦內神(shen)經元間相互作用啟發而來(lai)的 AI 形式,后來(lai)成為 AI 開發的新焦點。Buck 感(gan)慨(kai)道(dao),“我們花了近 20 年(nian)才最終走到了今天。”
英偉達如今(jin)擁(yong)有的軟件工程(cheng)師比硬件工程(cheng)師還多,這(zhe)也使(shi)其(qi)得以(yi)支持后續幾年(nian)出(chu)現的多種(zhong)不同類(lei)型的 AI 框(kuang)架(jia),也使(shi)其(qi)芯片(pian)在訓練 AI 模型所需要的統計(ji)(ji)計(ji)(ji)算(suan)方面(mian)愈(yu)發高效。
Hopper 是首個針對 transformers 進行優化的架構(gou),而(er) transformers 則是支持 OpenAI 聊天(tian)機器(qi)人明(ming)星的底層 AI 方法。通(tong)過與 AI 研究人員(yuan)的密(mi)切(qie)合作,英(ying)偉達在 2017 年就注意到了 transformers 的出現,并開(kai)始相應調整自(zi)己(ji)的軟(ruan)件。
AI 初(chu)創(chuang)企業投資方 Air Street Capital 的普通(tong)合伙人(ren) Nathan Benaich 指(zhi)出,“英(ying)偉達可以(yi)說(shuo)比其他人(ren)更早看到(dao)了未來,并將重點放在了 GPU 可編(bian)程方面。在發(fa)現機遇并押下賭注之后,英(ying)偉達獲得了持續領先于競爭對(dui)手的優勢。”
Benaich 估(gu)計,英(ying)偉達比其他競爭對手要(yao)領先約兩(liang)年。但他也(ye)補充稱(cheng),“英(ying)偉達硬件(jian)和軟件(jian)方面的市場地位恐怕還達不到堅不可摧的水平。”
Stability AI 的(de) Mostaque 對此(ci)表示贊同。“谷歌、英特爾和其他公司(si)打造(zao)的(de)下一代芯片正(zheng)在迎(ying)頭(tou)趕上。而且隨著軟(ruan)件(jian)標準化的(de)普(pu)及,就連 Cuda 也不足以構(gou)成可靠(kao)的(de)技術護(hu)城河。”
但對 AI 領先的(de)另一些從業者來說,華爾街本(ben)周的(de)熱情(qing)似(si)乎有(you)點過度樂觀。不過芯片咨(zi)詢公司 D2D Advisory 創始(shi)人 Jay Goldberg 仍然(ran)承(cheng)認,“從目前的(de)情(qing)況看,AI 半(ban)導體市場仍然(ran)保持著英(ying)偉達贏家通吃的(de)局面(mian)。”
參考(kao)鏈接:
//www.ft.com/content/315d804a-6ce1-4fb7-a86a-1fa222b77266
本(ben)文轉(zhuan)載(zai)來(lai)源:
//www.infoq.cn/article/e95bPU2tu1o9eGQqmQvP