對AMD而言,近兩年算是喜憂參半的兩年。
洗心(xin)革(ge)面的(de)(de)英(ying)特爾,帶來了(le)重整(zheng)旗(qi)鼓后的(de)(de)第十二代酷睿處(chu)理器(qi)。全新的(de)(de)高性能(neng)混合架構,將(jiang)性能(neng)內核和效(xiao)率內核相互結合,讓(rang)處(chu)理器(qi)性能(neng)、生產力和創作(zuo)力較之以往實現了(le)飛躍,將(jiang)AMD的(de)(de)常規處(chu)理器(qi)產品(pin)壓得喘不(bu)過(guo)氣。
但另一方(fang)面,得益于大(da)型(xing)游(you)戲對三級緩存的(de)充(chong)分利(li)用,AMD 3D V-Cache堆疊(die)緩存近兩年大(da)放異(yi)彩(cai)。最新發布的(de)R7 7800X3D更是憑借相對領先的(de)性能、更低的(de)理論功耗和(he)更高的(de)性價比大(da)殺四(si)方(fang),和(he)i9-13900打得難分高下。
(圖源:AMD)
作為PC行業的霸主,英特(te)爾顯(xian)然不會任(ren)由(you)AMD這(zhe)樣占有技術優勢(shi)。
4月(yue)24日訊(xun),英特爾2020年(nian)12月(yue)的專利(li)顯示,該公(gong)司下(xia)一代CPU架(jia)構又(you)稱「Meteor Lake架(jia)構」將(jiang)具(ju)有封裝(zhuang)緩存功能,預計L4緩存將(jiang)成為基礎區塊(kuai)的一部(bu)分(fen),可以(yi)(yi)被下(xia)一代CPU的任何構建(jian)塊(kuai)訪問。該消息在(zai)近期發布的Linux Patch補(bu)丁中得以(yi)(yi)證實,相關(guan)產(chan)品最快會(hui)在(zai)今(jin)年(nian)下(xia)半年(nian)正式發布。
(圖源:英特爾)
如果說,AMD是在片上緩存設計的當下做功夫,那么英特爾盯上的可能是片上緩存設計的未來。
首先,緩存是什么?
在CPU行(xing)業(ye)中,緩(huan)存(cun)即Cache Memory,指的(de)是可以(yi)和CPU/集成(cheng)GPU進行(xing)高速(su)數(shu)據交換的(de)存(cun)儲器。
當然這(zhe)種(zhong)概(gai)念(nian),在(zai)早年(nian)(nian)PC行業是不存在(zai)的。維基百(bai)科顯(xian)示(shi),早年(nian)(nian)間(指1980年(nian)(nian)前)的CPU普(pu)遍采用馮·諾依曼架構。這(zhe)是一(yi)(yi)個非常簡單的結構,內(nei)存、CPU 和I/O都根(gen)據一(yi)(yi)個主時鐘(zhong)以鎖步方式發生,CPU直(zhi)接從(cong)主存儲器中讀取(qu)數據,借此解決了當時計算機存儲容量太小,運算速度過慢的問題。
(圖源:程序員大本營,馮·諾依曼架構)
然而(er),隨著時間推移(yi),CPU和內存(cun)的發展速度出現了嚴重不對(dui)等(deng)的情況。
為了解決CPU速率(lv)和主存(cun)(cun)訪問速率(lv)差距(ju)過大的問題,IBM的Maurice Wilkes在(zai)1965年提出了緩(huan)存(cun)(cun)的概(gai)念,即在(zai)兩者之間插入一塊速度(du)比內存(cun)(cun)更快的高(gao)(gao)速緩(huan)存(cun)(cun)。只要將近期 CPU 要用的信息(xi)調入緩(huan)存(cun)(cun),CPU 便可以直接從緩(huan)存(cun)(cun)中獲取(qu)信息(xi),從而(er)提高(gao)(gao)訪問速度(du)。
至于落實到消費級市場上,則需要再往后推移。
1989年,英特爾發布了Intel i486處理器,這顆CPU創新性地集成了浮點運算處理器和多重管線,而且在X86系列中首次使用了 RISC(精簡指令集)技術,可以在一個時鐘周期內執行一條指令,最重要的是,它還擁有8KB的L1 Cache,使整個芯片的性能得到大幅度提升。
(圖源:維基)
盡管在(zai)后續數十年時間里,緩(huan)存的具體(ti)概念歷經了幾次變(bian)化,但整體(ti)架構(gou)在(zai)1990年代后期便趨于穩定(ding)。
目前市面上(shang)常見的(de)(de)(de)CPU Cache通常分(fen)為三級(ji)(ji)緩(huan)存(cun):L1 Cache、L2 Cache、L3 Cache,級(ji)(ji)別越低的(de)(de)(de)離CPU核心越近,訪(fang)問(wen)速度也快(kuai),但是存(cun)儲容(rong)量相對(dui)就會越小。其(qi)中,在(zai)多核心的(de)(de)(de)CPU里,每個核心都有(you)各自的(de)(de)(de)L1/L2Cache,而(er)L3 Cache是所有(you)核心共享(xiang)使用的(de)(de)(de)。
然后出現的,便是我們今天要講的四級緩存(L4 Cache)。
不過四級緩存這個概念(nian),并非第一次出現在市面上。
為了滿(man)足多個處理器之間的協(xie)同需(xu)求,進入2010年代后,IBM開(kai)始嘗試性地在System z11大型機的NUMA互連芯片組中添加了L4緩(huan)存。
最有趣的(de)是,他們(men)在近兩年高調(diao)宣布取消(xiao)L3/L4物理緩存(cun),將所有緩存(cun)都用eDRAM來實現(xian)——由此實現(xian)了至高32MB的(de)L2緩存(cun) ,256MB的(de)共享L3緩存(cun)以(yi)及8GB共享L4緩存(cun)。
英特爾這邊,則是在四代酷睿Haswell架構處理器上搭載了eDRAM,作為CPU和iGPU的L4四級緩存。
舉個(ge)例子,當時的(de)頂級移動端CPU——i7-4950QH,便在常規的(de)三(san)級緩(huan)存(cun)以外,額外搭(da)(da)載了一塊針對(dui)iris Pro系列核(he)顯的(de)128MB緩(huan)存(cun)芯(xin)片,英特爾(er)希望以此(ci)來(lai)緩(huan)解核(he)顯對(dui)于內存(cun)本身的(de)占用,和(he)AMD APU搭(da)(da)載的(de)A系列核(he)顯抗(kang)衡的(de)同時,提升CPU的(de)運行(xing)效(xiao)率。
遺憾的(de)是,因為當時(shi)設計不成(cheng)熟的(de)原因,英特爾配(pei)備的(de)這(zhe)塊(kuai)四(si)級緩(huan)(huan)存(cun)幾乎沒(mei)有用(yong)武之地(di),除了核(he)顯在運行(xing)(xing)游戲(xi)時(shi)會產(chan)生比(bi)較積(ji)極的(de)調度,以(yi)及提升挖礦能(neng)(neng)力以(yi)外,在CPU運行(xing)(xing)軟件的(de)時(shi)候,大部(bu)分情(qing)況下,各種應用(yong)程序還是會主動調用(yong)三級緩(huan)(huan)存(cun),在性能(neng)(neng)上并沒(mei)有什么優勢。
(圖源:快科技,i7-4750QH實測)
正因如此,這項配置延續到Coffee Lake 9代酷睿便沒了下文。
在吸(xi)取教訓(xun)后,如今(jin)英特爾已經準備好代號為(wei)Adamantine L4的高速緩存,希(xi)望(wang)從另外一個(ge)角度推動四級緩存的普及。
根據外媒VideoCardz發現的(de)(de)專利表(biao)明,英特爾的(de)(de)Adamantine緩存將提供比(bi)任何(he)典(dian)型緩存(如L3緩存等)更快(kuai)的(de)(de)訪(fang)問速度,不僅可以改善(shan)CPU和內存之間(jian)的(de)(de)傳輸效率,還(huan)可以改善(shan)CPU和安全控(kong)制器(qi)之間(jian)的(de)(de)通信(xin),甚(shen)至在重置時保留緩存中的(de)(de)數據以縮短加載時間(jian)。
不僅如此,因為(wei)eDRAM的(de)特(te)性,Adamantine緩存不必再拘泥于現有的(de)容(rong)量(liang)限制,英特(te)爾Meteor Lake的(de)Adamantine緩存甚(shen)至可以擴展到“GB”級別(bie)。即(ji)便是目前測試的(de)大(da)小:128MB到512MB,也(ye)已經是傳統三緩的(de)數倍,甚(shen)至可以和(he)AMD 3D V-Cache同(tong)臺較量(liang)。
而這,正是英特爾目前想要實現的效果。
也(ye)就是說,四級緩存(cun)的(de)時代要來了?
在我看來,即便英特爾方面野心勃勃,但是想要革新目前的PC緩存機制并沒有那么簡單。
首先,應用的(de)(de)適(shi)配程度始終是(shi)(shi)個問題。即便是(shi)(shi)目前大熱的(de)(de)AMD 3D V-Cache堆疊緩存,也僅有在部分非常(chang)吃緩存容(rong)量的(de)(de)大型3A游戲(xi)/MMO網絡游戲(xi)上面,才能體現出(chu)明顯(xian)的(de)(de)優勢,在高(gao)分辨(bian)率(lv)的(de)(de)情(qing)況(kuang)下,甚至可能出(chu)現游戲(xi)性能被主頻和核心數(shu)更多的(de)(de)英特爾(er)處理器超(chao)越的(de)(de)情(qing)況(kuang)。
其次,則在于產品(pin)的(de)(de)(de)成(cheng)本問題。即便Adamantine緩存真的(de)(de)(de)像英(ying)特爾所述(shu),速度更(geng)快、延遲(chi)更(geng)低,但它必然需要更(geng)大的(de)(de)(de)面積(ji)和(he)更(geng)復(fu)雜的(de)(de)(de)設計,也會(hui)增(zeng)加處理器的(de)(de)(de)功耗和(he)發(fa)熱(re),從而影響散熱(re)和(he)電池續航(參考AMD 3D V-Cache過熱(re)),最(zui)終導致硬件成(cheng)本的(de)(de)(de)成(cheng)倍增(zeng)加。
不管怎(zen)么說,對普通用戶而言(yan),一款產品(pin)是否值得(de)購買,是要從性能(neng)(neng)、功(gong)能(neng)(neng)、價(jia)(jia)格等各(ge)個方(fang)面來決策選擇的(de)。隨著(zhu)計算機(ji)技(ji)術(shu)的(de)不斷進步,未(wei)來必然會出現更多(duo)層次的(de)緩(huan)(huan)存(cun)設(she)計,即便因為價(jia)(jia)格問題(ti)無法快(kuai)速(su)普及,像Adamantine緩(huan)(huan)存(cun)這種在工(gong)程(cheng)上(shang)付出了較大努(nu)力的(de)產品(pin),還(huan)是值得(de)相當程(cheng)度的(de)肯定的(de)。
英(ying)特(te)爾能否再度(du)引領緩(huan)存(cun)技(ji)術的(de)未(wei)來?或許只(zhi)有時(shi)間能給我們(men)答案。