3月(yue)20日至23日,英偉達GTC 2023如(ru)期舉行(xing)。據了解,本屆GTC大會將舉辦超過650場由(you)技術、商業、學術等領(ling)域相關的會議,英偉達創始(shi)人兼CEO黃仁(ren)勛還在會前表(biao)示:這將是英偉達迄(qi)今為止最重要的一次GTC。
昨晚11點,本次GTC大會迎來了最重要的環節,黃仁勛帶來了他在本次大會上的精彩演講,分享了他對于人工智能未來的愿景,以(yi)及英偉達如(ru)何通過突破(po)性技術和解(jie)決方案來加(jia)速計(ji)算(suan)光刻、生成式AI、云(yun)計(ji)算(suan)、工業生產等(deng)領域的下一波(bo)浪潮(chao)。
計算光刻速度提升40+倍
如今,芯片幾乎(hu)成為各行各業(ye)得(de)以(yi)(yi)發(fa)展的基礎,芯片制(zhi)造更(geng)是要(yao)求極高的精(jing)(jing)確度。舉例來說,這種精(jing)(jing)確度的量級幾乎(hu)相當于(yu)人(ren)類DNA鏈的尺(chi)寸,比細(xi)菌還要(yao)小(xiao)1000倍以(yi)(yi)上。
而作為(wei)芯片制造過程(cheng)的(de)起始步(bu)驟,光(guang)(guang)刻就是在晶圓上(shang)創建圖案的(de)過程(cheng)。在進行(xing)光(guang)(guang)刻時,光(guang)(guang)線由(you)ASML的(de)EUV極(ji)紫外光(guang)(guang)刻系統產生,激(ji)光(guang)(guang)脈沖每秒向一滴錫發射(she)5萬次,使其(qi)汽(qi)化,產生一種能(neng)發射(she)13.5納米EUV光(guang)(guang)的(de)等離子(zi)體,隨(sui)后(hou)再經過多層鏡(jing)面來(lai)引導光(guang)(guang)線至光(guang)(guang)掩膜,光(guang)(guang)掩膜板中(zhong)的(de)多層反射(she)器利(li)用13.5納米光(guang)(guang)的(de)干涉圖案實現更(geng)精(jing)細的(de)特征(zheng)。

而在光(guang)刻(ke)(ke)機(ji)軟硬件(jian)不(bu)變的情況下,采用數學模(mo)(mo)型(xing)(xing)和(he)軟件(jian)算(suan)法(fa)對照明模(mo)(mo)式、掩模(mo)(mo)圖形與工藝參數等進行(xing)(xing)模(mo)(mo)擬(ni)和(he)優化,可以有(you)效提(ti)高(gao)光(guang)刻(ke)(ke)分辨(bian)率、增大工藝窗口,這(zhe)類(lei)技術被稱為(wei)(wei)“計(ji)算(suan)光(guang)刻(ke)(ke)”。更重要的是,隨著(zhu)(zhu)算(suan)法(fa)的不(bu)斷進步,當前計(ji)算(suan)光(guang)刻(ke)(ke)已(yi)經做到2nm的水平。黃仁勛(xun)表示,計(ji)算(suan)光(guang)刻(ke)(ke)模(mo)(mo)擬(ni)了光(guang)通過光(guang)學器件(jian)并與光(guang)刻(ke)(ke)膠相互作用時(shi)的行(xing)(xing)為(wei)(wei),有(you)著(zhu)(zhu)芯片(pian)設(she)計(ji)和(he)制造領域中(zhong)最大的計(ji)算(suan)工作負載(zai),很多大型(xing)(xing)數據中(zhong)心更是全年無休(xiu)的運行(xing)(xing)來創建(jian)用于光(guang)刻(ke)(ke)系統的掩膜(mo)板,每年消耗數百億CPU小時(shi)。
為此(ci),英偉(wei)達(da)歷時(shi)近四年,并與臺(tai)積(ji)(ji)電、ASML等企業密(mi)切合作,正式推出了一(yi)個計算(suan)(suan)光(guang)(guang)刻庫——cuLitho,將計算(suan)(suan)光(guang)(guang)刻加速了40倍以(yi)上(shang)。當(dang)前,英偉(wei)達(da)的H100顯卡上(shang)需要(yao)89塊掩(yan)膜板(ban)(ban),在(zai)CPU上(shang)運(yun)行時(shi),用計算(suan)(suan)光(guang)(guang)刻處(chu)理(li)單個掩(yan)膜板(ban)(ban)需要(yao)兩周(zhou)的時(shi)間(jian),而如果在(zai)GPU上(shang)運(yun)行cuLitho,只需8小時(shi)即可(ke)處(chu)理(li)完(wan)一(yi)個掩(yan)膜板(ban)(ban)。不僅如此(ci),通(tong)過在(zai)500個DGX H100系統上(shang)使(shi)用cuLitho加速,臺(tai)積(ji)(ji)電還用4000個Hopper GPU代替(ti)了用于(yu)計算(suan)(suan)光(guang)(guang)刻的4萬臺(tai)CPU服(fu)務器,在(zai)縮短(duan)時(shi)間(jian)的同時(shi)還可(ke)以(yi)提高產量(liang),甚至(zhi)功耗也從35MW降低至(zhi)5MW,大大減少了制(zhi)造過程中的碳足跡。
助力生成式AI重塑更多行業
在(zai)整個(ge)(ge)演(yan)講的(de)過程(cheng)(cheng)中,ChatGPT一(yi)(yi)(yi)詞不知一(yi)(yi)(yi)共被(bei)老黃(huang)提到了幾次,足以(yi)看出英偉(wei)達對此(ci)的(de)重(zhong)視(shi)程(cheng)(cheng)度。可(ke)以(yi)這(zhe)(zhe)么說,以(yi)ChatGPT為代表的(de)生(sheng)成式(shi)(shi)AI是一(yi)(yi)(yi)種新型計算(suan)機(ji),一(yi)(yi)(yi)種可(ke)以(yi)用人(ren)類語言進行(xing)編程(cheng)(cheng)的(de)計算(suan)機(ji),這(zhe)(zhe)種改變(bian)將使每個(ge)(ge)人(ren)都(dou)可(ke)以(yi)命(ming)令計算(suan)機(ji)來(lai)解(jie)決問題。而在(zai)此(ci)之前,這(zhe)(zhe)是只(zhi)有(you)程(cheng)(cheng)序(xu)(xu)員(yuan)(yuan)才(cai)能接觸(chu)的(de)領(ling)域(yu),現(xian)在(zai)每個(ge)(ge)人(ren)都(dou)可(ke)以(yi)是程(cheng)(cheng)序(xu)(xu)員(yuan)(yuan),生(sheng)成式(shi)(shi)AI也因此(ci)將會重(zhong)塑幾乎所(suo)有(you)行(xing)業。
如果(guo)拆解背后的原理來(lai)看,ChatGPT依(yi)然使用了(le)Transformer架構,而Transformer能以大(da)規(gui)模并(bing)行(xing)的方(fang)式,從數(shu)據的關系和(he)依(yi)賴性(xing)中學習上(shang)下文和(he)含義,并(bing)因此涌現出(chu)了(le)一些(xie)令人意(yi)想不到的能力(li)。而這種大(da)規(gui)模的并(bing)行(xing)計算(suan),對計算(suan)能力(li)提出(chu)了(le)超高(gao)的要求。

英偉達提供的DGX配(pei)(pei)有(you)8個H100 GPU模(mo)組,相互協同(tong)工作后相當于一個巨型GPU,而(er)每個H100都配(pei)(pei)有(you)Transformer引(yin)擎(qing),旨在快速處理類似ChatGPT這樣的大(da)模(mo)型。有(you)意(yi)思的是(shi),黃仁勛(xun)還(huan)表(biao)示,全(quan)球首(shou)款DGX就(jiu)是(shi)由他親手交給的OpenAI,甚至還(huan)在上(shang)面簽了自己的名字。

此外(wai),相比于現在更加(jia)偏(pian)向(xiang)通用(yong)領域的(de)生(sheng)成式AI,未來(lai)(lai)(lai),一些(xie)專(zhuan)業領域的(de)公司還需要(yao)使(shi)用(yong)其(qi)(qi)專(zhuan)有(you)數(shu)據來(lai)(lai)(lai)構建和定制(zhi)(zhi)模(mo)(mo)型。今天(tian),英偉(wei)達宣布推出一系(xi)列云服務,使(shi)企業能(neng)夠構建、改進(jin)和運行(xing)自(zi)定義(yi)大型語言模(mo)(mo)型和生(sheng)成式AI模(mo)(mo)型,使(shi)用(yong)自(zi)己的(de)專(zhuan)有(you)數(shu)據進(jin)行(xing)訓練,并為各自(zi)領域的(de)特定任務進(jin)行(xing)調整。黃(huang)仁勛表示(shi):“NVIDIA AI Foundations讓(rang)企業可以使(shi)用(yong)自(zi)己的(de)數(shu)據定制(zhi)(zhi)基礎模(mo)(mo)型,以生(sheng)成人類最寶貴的(de)資源——智(zhi)慧和創造(zao)力。”其(qi)(qi)中,Nemo可用(yong)于構建定制(zhi)(zhi)的(de)文本(ben)(ben)轉(zhuan)文本(ben)(ben)模(mo)(mo)型,Picasso是一項視覺(jue)語言模(mo)(mo)型制(zhi)(zhi)作(zuo)服務,面向(xiang)希望(wang)使(shi)用(yong)授權內容或(huo)專(zhuan)有(you)內容的(de)用(yong)戶,BioNemo則可以用(yong)來(lai)(lai)(lai)設計新分子,甚(shen)至構建ProGPT這樣的(de)蛋白質大模(mo)(mo)型。

如今,隨著各類生(sheng)成式(shi)(shi)(shi)AI和大型語言模型的不斷出(chu)現(xian),初創公司都在(zai)(zai)競(jing)相構建具有顛(dian)覆(fu)性(xing)的產品和商業模式(shi)(shi)(shi),而現(xian)在(zai)(zai)的老牌公司則在(zai)(zai)尋求應對(dui)之法,避免落得(de)個被顛(dian)覆(fu)的下場。為(wei)此(ci),黃仁勛表示,英(ying)偉(wei)(wei)達(da)宣布(bu)推(tui)出(chu)NVIDIA DGX Cloud,使(shi)得(de)客(ke)戶能夠(gou)更(geng)簡單快(kuai)捷地訪(fang)問NVIDIA AI,為(wei)迫切需(xu)要(yao)使(shi)用生(sheng)成式(shi)(shi)(shi)AI的客(ke)戶提(ti)供了(le)在(zai)(zai)全球云端(duan)即時訪(fang)問NVIDIA AI的機會。同時,英(ying)偉(wei)(wei)達(da)通過與微軟Azure、Google GCP和Oracle OCl合作,將英(ying)偉(wei)(wei)達(da)的生(sheng)態(tai)系統(tong)引(yin)入(ru)到(dao)了(le)云服務(wu)提(ti)供商,使(shi)得(de)英(ying)偉(wei)(wei)達(da)觸及(ji)的范(fan)圍得(de)以擴展,也(ye)與更(geng)多企業建立了(le)雙贏的合作伙伴(ban)關系。

專為大模型推出的新品
雖然當晚(wan)的(de)GTC活動(dong)中,沒有推出采(cai)用(yong)英偉達的(de)任(ren)何(he)新(xin)GPU或GPU架構,但(dan)該公司卻宣布推出全新(xin)的(de)推理(li)平臺,包含(han)四種配(pei)置L4、L40、H100NVL、GRACE-HOPPER,使用(yong)了一個體系架構和同一個軟件棧。

針對AI視(shi)(shi)頻(pin)工作負載,英偉達(da)推出(chu)了L4平臺,針對視(shi)(shi)頻(pin)解碼和(he)轉碼、視(shi)(shi)頻(pin)內容審(shen)核以及視(shi)(shi)頻(pin)通話功能,如:背景替換、重新打光、眼神交流(liu)等(deng)方面(mian)進行了優化(hua),一臺8-GPU L4服務器將取代一百多(duo)臺用(yong)于(yu)處理AI視(shi)(shi)頻(pin)的雙(shuang)插槽CPU服務器。
針(zhen)對Omniverse、圖形(xing)渲染(ran)以及文(wen)本(ben)轉圖像和文(wen)本(ben)轉視頻等生(sheng)成式AI,英(ying)偉達宣布推出(chu)L40,其性(xing)能是英(ying)偉達最受(shou)歡迎(ying)的云(yun)推理GPU T4的10倍。
在(zai)高(gao)端市場中,英偉達(da)推出專門針對大型(xing)語言模(mo)型(xing)的H100加速器變體——H100 NVL。據黃(huang)仁勛介紹,H100 NVL最(zui)重要的是(shi)其2個H100 PCIe板已經橋接(jie)在(zai)一起,組合(he)的雙GPU卡(ka)提(ti)供(gong)了188GB的HBM3 內存,即每張卡(ka)具有94GB內存,超(chao)過了迄今為(wei)止任(ren)何其他英偉達(da)硬件提(ti)供(gong)的GPU內存。
Grace-Hopper是英偉達推(tui)出的新的超級芯片,通過提供900GB/秒(miao)的高速(su)一致性芯片到(dao)芯片接(jie)口(kou),非常適(shi)合處理大(da)型(xing)數據(ju)集, 適(shi)用(yong)于(yu)推(tui)薦系統和大(da)型(xing)語言模型(xing)的AI數據(ju)庫。如今(jin),利用(yong)大(da)容量(liang)內存,CPU會存儲和查詢巨(ju)型(xing)嵌(qian)入(ru)表,然后將結果傳(chuan)(chuan)輸(shu)到(dao) GPU進行(xing)推(tui)理,而借助(zhu)于(yu)Grace-Hopper則可以查詢嵌(qian)入(ru)表,并將結果直接(jie)傳(chuan)(chuan)輸(shu)到(dao)Hopper,速(su)度比PCIE快7倍。
Omniverse變革世界的方方面面
如今(jin),半導體行(xing)業(ye)正(zheng)(zheng)在投(tou)資(zi)5000億美元(yuan)來(lai)建(jian)造84個新晶圓廠(chang),到2030年(nian)時,汽(qi)車(che)制造商還將建(jian)造300家(jia)工廠(chang)來(lai)生產2億輛(liang)電動汽(qi)車(che),電池(chi)制造商也(ye)正(zheng)(zheng)在建(jian)造100多家(jia)特大型工廠(chang)。通過使用(yong)英偉達Omniverse平(ping)臺,讓各個行(xing)業(ye)先以虛(xu)擬的方式(shi)設計、構(gou)建(jian)、運(yun)營和優化實體產品和工廠(chang),在真正(zheng)(zheng)的實體工廠(chang)建(jian)成之前,以數字方式(shi)進行(xing)整合,從而(er)避免在最(zui)后(hou)時刻出現意(yi)外、變更訂(ding)單和工廠(chang)延遲開工等情況,為全球(qiu)工廠(chang)節省數十億美元(yuan)。

眾所周知,Omniverse是一(yi)個工(gong)業數字化平臺旨在搭建數字化和(he)物理(li)實體之間(jian)的橋梁,其(qi)基于物理(li)性質,反映物理(li)定律,采用生成式AI來加速(su)創(chuang)建虛擬世界。黃仁勛(xun)表(biao)示,當(dang)前已有近30萬名創(chuang)作者和(he)設計師(shi)下(xia)載了(le)Omniverse,今年英偉(wei)達(da)也在每個領域(yu)都對Omniverse進(jin)行(xing)了(le)重大更新。
同樣,英偉(wei)達(da)也(ye)宣布(bu)推出NVIDIA Omniverse Cloud,這是一(yi)項完全托(tuo)管(guan)的云(yun)服務,據黃仁勛介紹(shao),Omniverse Cloud將(jiang)被托(tuo)管(guan)在Azure中,并正在將(jiang)Omniverse Cloud連接到Microsoft 365生產力(li)套件當中,其中包括(kuo)Teams、OneDrive等,甚至還有Azure loT Digital Twins服務。

最后,黃仁勛還表示,Omniverse不是一種工具,而是一個USD網絡和共享數據庫,可以連接、合成和模擬使用工具創建的3D資產,將一個平臺的生態和所有其他平臺的生態連接到一起,這或許才是真正的元宇宙雛形。

寫在最后
從1993年創辦英(ying)偉達時算起,黃仁(ren)(ren)勛已經擔(dan)任CEO整整30年了(le)(le),他也從30歲(sui)步入了(le)(le)60歲(sui)。在黃仁(ren)(ren)勛的(de)帶領(ling)下,如今的(de)英(ying)偉達已經成長為全球市(shi)值第一(yi)(yi)高(gao)的(de)圖形計算公司。在今天的(de)GTC大會上,可以看(kan)到(dao)英(ying)偉達的(de)業(ye)務范圍在進一(yi)(yi)步擴(kuo)張,甚至進入到(dao)了(le)(le)量子計算和光刻機(ji)領(ling)域。展望未來,黃仁(ren)(ren)勛表示(shi)現在依然(ran)精(jing)力充沛,還想為英(ying)偉達再工作(zuo)40年,或許40年后他會變成機(ji)器人,但他希望在足夠長的(de)時間內享受這一(yi)(yi)切。