6 月 27 日至 28 日,2023 亞(ya)馬(ma)遜云(yun)科(ke)技中國峰(feng)會(下文稱“峰(feng)會”)于上海順(shun)利召(zhao)開(kai)。在本(ben)次峰(feng)會上,我們似乎找尋(xun)到(dao)了(le)云(yun)計算領域(yu)競爭對手(shou)均日漸成熟(shu),而(er)亞(ya)馬(ma)遜云(yun)科(ke)技卻能一(yi)直保持領先地位的原因——過去的十(shi)幾年里,亞(ya)馬(ma)遜云(yun)科(ke)技“基于客戶需(xu)求,快速進行產品更新(xin)與技術迭代(dai)”的 Day one 理念,一(yi)直不斷地追求基礎(chu)架(jia)構(gou)層面的創新(xin)。
6 月 28 日上(shang)午,亞(ya)馬遜云(yun)科技(ji)大中(zhong)華區產(chan)品(pin)部總(zong)經(jing)理陳曉建(jian)進行了(le)以《專注創新(xin),擺(bai)脫基礎架(jia)構束(shu)縛》為主題(ti)的演(yan)講,在演(yan)講中(zhong)他分享了(le)亞(ya)馬遜云(yun)科技(ji)眾多(duo)應用案例實踐,闡明了(le)亞(ya)馬遜云(yun)科技(ji)在云(yun)基礎架(jia)構方面(mian)的能力與(yu)創新(xin)及在全球布(bu)局方面(mian)做(zuo)出的努力。
一、企業亟需提高“用云”性價比
隨(sui)著企(qi)(qi)(qi)業(ye)數字化轉型(xing)的需(xu)求(qiu)(qiu)增(zeng)加、市(shi)場(chang)競爭的加劇,企(qi)(qi)(qi)業(ye)需(xu)要(yao)將業(ye)務和數據遷移到云上(shang)(shang),以實(shi)現更高效的生(sheng)產和服務,以適應市(shi)場(chang)的變化。所以我們(men)也觀(guan)察到越來越多的企(qi)(qi)(qi)業(ye)開始(shi)上(shang)(shang)云,然而(er)上(shang)(shang)云的門檻并(bing)不(bu)低,需(xu)要(yao)考(kao)慮(lv)的東西非常多,比如技(ji)術能力(li)、安(an)全合規風險、成本費用(yong)、用(yong)戶體(ti)驗(yan)等,很多企(qi)(qi)(qi)業(ye) CTO 表示,“想上(shang)(shang)云,但是有心而(er)力(li)不(bu)足”,大多企(qi)(qi)(qi)業(ye)目前提出了(le)亟需(xu)降(jiang)低云服務使用(yong)門檻、提高“用(yong)云”性價比的需(xu)求(qiu)(qiu)。
為了提高企業云服務使用的性價比,亞馬遜云科技為用戶提供全面和深入的算力支持,提供包括 Intel、AMD、 英偉達和自研的 CPU 及加速芯片產(chan)品,這其中最值得(de)一提的就(jiu)是(shi)亞馬遜云科技的四個自研芯片:Nitro、Graviton、Inferentia、Trainium。
Nitro 是(shi)亞(ya)馬(ma)(ma)遜云(yun)(yun)科技的第(di)(di)(di)一(yi)款自(zi)研芯(xin)片產品,Nitro 主要有(you)三(san)個亮點:第(di)(di)(di)一(yi),做了(le)高度(du)(du)輕(qing)量(liang)化的虛擬化;第(di)(di)(di)二,實(shi)現網絡層(ceng)面的數(shu)據(ju)通信和(he)存儲的隔離;第(di)(di)(di)三(san),實(shi)現了(le)硬件級(ji)別的加密。有(you)了(le) Nitro 之后,亞(ya)馬(ma)(ma)遜云(yun)(yun)科技能(neng)夠大大增強(qiang) EC2 整個實(shi)例應用的安全性,每(mei)個單(dan)元可以(yi)獨立發展(zhan),也(ye)確(que)保 EC2 所有(you)實(shi)例運(yun)行的穩定(ding)。 因為 Nitro 的出現,亞(ya)馬(ma)(ma)遜云(yun)(yun)科技大大降(jiang)低了(le)推出一(yi)個新 EC2 實(shi)例工作(zuo)的復雜(za)性,使(shi)得(de)其保持一(yi)個非常快的增長的速度(du)(du),進一(yi)步降(jiang)低客戶成本,從而(er)幫助企業達到(dao)降(jiang)本增效的目標。最新一(yi)代 Nitro V5 芯(xin)片相比(bi)之前的芯(xin)片性能(neng)有(you)大幅的提(ti)升,包括更快的轉發率(lv),包括更低的延遲,每(mei)瓦特(te)性能(neng)提(ti)升 40%。
基于(yu)(yu) ARM 架構(gou)的通用處理(li)器(qi)芯(xin)片(pian)(pian) Graviton 自 2018 年起,亞馬遜(xun)云科(ke)技(ji)陸續推出(chu)三(san)代(dai)(dai) Graviton 服務器(qi)芯(xin)片(pian)(pian),在(zai)去年的 re:lnvent 全(quan)球大(da)會上(shang),亞馬遜(xun)云科(ke)技(ji)推出(chu)了自研的、基于(yu)(yu) ARM 架構(gou)的高(gao)性能(neng)(neng)計(ji)算服務器(qi) CPU 芯(xin)片(pian)(pian) Graviton3E 芯(xin)片(pian)(pian)。縱觀(guan) Graviton 系列芯(xin)片(pian)(pian)的升級歷(li)程(cheng),Graviton3 計(ji)算性能(neng)(neng)提高(gao) 25%,浮(fu)點性能(neng)(neng)提高(gao) 2 倍,加(jia)密(mi)工作負載性能(neng)(neng)加(jia)快 2 倍;Graviton3E 特別(bie)關(guan)注向量計(ji)算的性能(neng)(neng),跟(gen)前一代(dai)(dai)相比高(gao) 35%,這個性能(neng)(neng)提升對于(yu)(yu)像 HPC 高(gao)性能(neng)(neng)計(ji)算這樣的應(ying)用來說(shuo)是非常重(zhong)要的。
從具(ju)體案例來看,在(zai) HPL(線性(xing)(xing)代數的(de)測量工(gong)具(ju))上 Graviton3E 性(xing)(xing)能(neng)提升 35%,在(zai) GROMACS(分子運動)上性(xing)(xing)能(neng)提升 12%,在(zai)金融期權定價的(de)工(gong)作負載上性(xing)(xing)能(neng)提升 30%;同(tong)時,Graviton3E 和類似的(de) X86 的(de) EC2 實例相比,Graviton3E 還能(neng)節省 60% 的(de)能(neng)耗。
如(ru)今 Graviton 系(xi)列芯片的優秀性能(neng)表現已經得到(dao)了(le)充分(fen)驗證(zheng),本屆(jie)峰會上(shang),陳曉建講到(dao)的世界一級方程(cheng)式錦(jin)標賽(sai)(sai)(下文簡稱“F1”)案例便充分(fen)體現了(le)亞馬遜云科(ke)技在(zai)算(suan)力(li)(li)資(zi)源、數據(ju)存儲方面(mian)的能(neng)力(li)(li)。F1 利用 Graviton3 運行(xing)空氣動力(li)(li)學模(mo)擬(ni),可(ke)(ke)以(yi)用比以(yi)往快 70% 的速度開發新一代賽(sai)(sai)車(che)(che),賽(sai)(sai)車(che)(che)壓力(li)(li)損失可(ke)(ke)以(yi)從 50% 降低到(dao) 15% ,這使超車(che)(che)更容易(yi),為車(che)(che)迷可(ke)(ke)以(yi)帶(dai)來更多賽(sai)(sai)場(chang)的纏斗。此外,F1 通過 5000 多次單車(che)(che)和多車(che)(che)模(mo)擬(ni),收集(ji)了(le)超過 5.5 億個數據(ju)點,幫助他們進行(xing)下一代賽(sai)(sai)車(che)(che)的優化(hua)。用 F1 團隊表示,“Graviton3 讓系(xi)統性能(neng)快了(le) 40%,可(ke)(ke)以(yi)晚(wan)間運行(xing)模(mo)擬(ni),第二天早上(shang)就(jiu)能(neng)得出結果。”
在機(ji)器(qi)學(xue)習技(ji)術探索賽道中,目前亞馬遜云科(ke)技(ji)已經發展(zhan)出三代不同的(de)機(ji)器(qi)學(xue)習芯(xin)片(pian)。在訓練方面,亞馬遜云科(ke)技(ji)先后推出的(de)加速芯(xin)片(pian) Inferentia 和(he)(he)(he) Trainium 覆蓋了訓練和(he)(he)(he)推理的(de)場(chang)景,能為企(qi)業提(ti)供最佳的(de)性價(jia)比(bi)。因此,許多領(ling)先的(de) 生成式 AI 初創公司,例如(ru) AI21 Labs、Hugging Face、Runway 和(he)(he)(he) Stability AI 都選(xuan)擇 Inferentia 和(he)(he)(he) Trainium 作為他(ta)們整個研發和(he)(he)(he)應用的(de)平(ping)臺。
在(zai)機(ji)器學習訓(xun)練中,最重要的(de)(de)指標是訓(xun)練效率和性價比。以 HuggingFace BERT 模型為例,基于加速芯片 Trainium 的(de)(de) Trn1 實(shi)例的(de)(de)性能表(biao)現(xian)非(fei)常(chang)不錯,從訓(xun)練吞吐(tu)(tu)量(liang)(liang)角(jiao)度看,其與同(tong)類型 GPU 實(shi)例相比,在(zai)單節點(dian)情況(kuang)下,可實(shi)現(xian) 1.2 倍(bei)吞吐(tu)(tu)量(liang)(liang)的(de)(de)提(ti)升;在(zai)多節點(dian)情況(kuang)下,實(shi)現(xian) 1.5 倍(bei)吞吐(tu)(tu)量(liang)(liang)的(de)(de)提(ti)升;從成(cheng)本角(jiao)度,單節點(dian)實(shi)現(xian)了 1.8 倍(bei)成(cheng)本降(jiang)低,集群的(de)(de)成(cheng)本降(jiang)低了 2.3 倍(bei)。
隨著模(mo)型越(yue)來(lai)越(yue)復雜,很多時候(hou)靠一個單點的(de)計算訓練是(shi)無法滿足用戶的(de)需求,在很多時候(hou)都需要(yao)一個分布(bu)式的(de)訓練,比如需要(yao)非(fei)常(chang)大規模(mo)的(de)集群,通過 Trainium 便可以(yi)(yi)構建一個超(chao)大的(de)集群,它可以(yi)(yi)有 3 萬張的(de) Trainium 芯片,使企業可以(yi)(yi)獲得云上 6 ExaFlops 的(de)超(chao)算級(ji)(ji)性能。這背后涉及(ji)很多創新,比如更快(kuai)的(de) EFA 網(wang)絡以(yi)(yi)及(ji) PB 級(ji)(ji)別的(de)無阻塞網(wang)絡互聯等。
在(zai)(zai)(zai)機(ji)器(qi)學(xue)習推理(li)中,推理(li)往往要(yao)考慮延(yan)遲(chi)(chi)和吞吐(tu),企業需要(yao)更(geng)高的(de)(de)吞吐(tu)力來(lai)(lai)(lai)帶來(lai)(lai)(lai)更(geng)優的(de)(de)性價比,但是(shi)往往更(geng)高的(de)(de)吞吐(tu)率會帶來(lai)(lai)(lai)更(geng)高延(yan)遲(chi)(chi),所(suo)以開(kai)發(fa)者往往要(yao)在(zai)(zai)(zai)延(yan)遲(chi)(chi)和吞吐(tu)中權衡。Inferentia2 的(de)(de)設計就考慮到了兼顧吞吐(tu)和延(yan)遲(chi)(chi)的(de)(de)優化,如果拿一個基于 Inferentia2 的(de)(de)實(shi)例(li)做測試,以自然語言(yan)處理(li)領域常見的(de)(de) BERT 模型為例(li),在(zai)(zai)(zai) Inferentia2 上可實(shi)現(xian)高達 3 倍的(de)(de)吞吐(tu)提升,8.1 倍的(de)(de)延(yan)遲(chi)(chi)降低(di),4 倍的(de)(de)成本節約(yue),使得企業開(kai)發(fa)者二者兼而有之。
另外值得一(yi)提(ti)的(de)是(shi),Inferentia2 在(zai)大語言模(mo)(mo)型(xing)(xing)中(zhong)的(de)表現(xian)也非常的(de)突出。拿一(yi)個(ge) OPT 模(mo)(mo)型(xing)(xing)來(lai)做(zuo)測試,中(zhong)等(deng)規模(mo)(mo)的(de) OPT 模(mo)(mo)型(xing)(xing) OPT-30B 為例(li),相較于通(tong)用(yong)的(de) EC2 GPU 實(shi)例(li),Inferentia2 可實(shi)現(xian) 65% 的(de)吞(tun)吐量提(ti)升,推理(li)成本可降低 52%;660 億參數級別的(de) OPT-66B,通(tong)用(yong) GPU 實(shi)例(li)已經顯示內存不足的(de)情況下, 而在(zai) Inferentia2 上還可以實(shi)現(xian)每秒 351 個(ge) token 數的(de)吞(tun)吐量。
二、“AI 創新”使算力需求井噴、運維復雜性增加
隨(sui)著(zhu) AI 大(da)模(mo)型(xing)(xing)的發展,大(da)模(mo)型(xing)(xing)應用(yong)規模(mo)呈(cheng)爆發式增(zeng)長,加(jia)速了未來計(ji)算(suan)(suan)時(shi)(shi)代的來臨,引發了新的生產(chan)力革命,但同時(shi)(shi)也導(dao)致算(suan)(suan)力供(gong)不應求,在這(zhe)個(ge)過程(cheng)中,算(suan)(suan)力直(zhi)接反映了數據處理能力的強弱,用(yong)戶不僅需(xu)要更(geng)高性價比硬件的解(jie)決方(fang)案,他們還需(xu)要云(yun)(yun)廠商提供(gong)高度(du)彈性化的伸縮。與此同時(shi)(shi),巨大(da)算(suan)(suan)力的增(zeng)加(jia),使(shi)企業(ye)云(yun)(yun)運(yun)維(wei)成本大(da)大(da)增(zeng)加(jia),如何降低(di)云(yun)(yun)運(yun)維(wei)的復(fu)雜性也是企業(ye)目前面臨的難題。
為了應對彈性算(suan)力的(de)(de)需求,亞馬遜云科技提供超過 600 種(zhong)不同(tong)的(de)(de)計算(suan)實(shi)例(li),處理器、存儲、網絡及各種(zhong)周邊(bian)服務均可與計算(suan)很好地結合(he),以(yi)積木(mu)的(de)(de)方式形成豐富的(de)(de)、靈活的(de)(de)計算(suan)實(shi)例(li)資源,滿足多種(zhong)不同(tong)算(suan)力要求。
要知(zhi)道,從(cong)存(cun)(cun)(cun)儲(chu)層面,當數據(ju)規模達到(dao) PB、EB 級(ji)(ji)別時,數據(ju)的存(cun)(cun)(cun)儲(chu)方(fang)式(shi)非常重要。用戶的數據(ju)存(cun)(cun)(cun)儲(chu)可分為熱、溫、冷(leng)、凍四種(zhong)類型,每種(zhong)類型的存(cun)(cun)(cun)儲(chu)成本和性能(neng)不同,都需(xu)要平(ping)衡。所以(yi),亞馬(ma)遜(xun)云(yun)科(ke)技提(ti)供多達八種(zhong)的存(cun)(cun)(cun)儲(chu)級(ji)(ji)別,包括(kuo)高性能(neng)計算(suan)(suan)、機器學習(xi)和通用計算(suan)(suan)等,企業根據(ju)需(xu)要選(xuan)擇(ze)最(zui)合理的存(cun)(cun)(cun)儲(chu)級(ji)(ji)別。
這其中最(zui)具有(you)代表性(xing)的案例(li)就是《阿(a)凡達》的制作公司 Weta Digital,其在(zai)開發《阿(a)凡達 1》時,他們(men)自(zi)建了(le)(le)一個占地 10000 平方英尺的機(ji)房,構建 4000 臺物理服(fu)務器(qi)和(he) 35000 個處理器(qi)核(he)心(xin)。然而,在(zai)開發《阿(a)凡達 2 – 水之道(dao)》時,他們(men)原有(you)的集群已經無(wu)法滿足需求。于(yu)是,亞馬遜云科技為 Weta Digital 提(ti)供了(le)(le)從基礎(chu)架構算(suan)力資源到(dao)云上制作堆(dui)棧、機(ji)器(qi)學習堆(dui)棧的一系(xi)列(lie)服(fu)務,Weta Digital 使用了(le)(le)包(bao)括 GPU 實例(li)和(he) Spot 實例(li)在(zai)內的多種計算(suan)實例(li)以提(ti)供強(qiang)大的伸(shen)縮性(xing)和(he)優(you)秀(xiu)的性(xing)價比。
然而對(dui)于亞(ya)馬(ma)遜(xun)(xun)云(yun)(yun)科技來(lai)說,僅僅對(dui)企(qi)業進行多(duo)種(zhong)多(duo)樣的(de)(de)芯片和(he)高(gao)伸(shen)縮性的(de)(de)資(zi)源供給是遠遠不(bu)夠的(de)(de),亞(ya)馬(ma)遜(xun)(xun)云(yun)(yun)科技還為(wei)企(qi)業提供了(le) Serverless 來(lai)降(jiang)低云(yun)(yun)運維的(de)(de)復(fu)雜性。亞(ya)馬(ma)遜(xun)(xun)云(yun)(yun)科技在 2014 年發布 Lambda 以來(lai),已經相繼發布了(le) 105 多(duo)種(zhong) Serverless 新技術,包括解(jie)決 Java 應用冷(leng)啟動問題的(de)(de) Lambda SnapStart、可(ke)視化編輯器(qi) Application Composer 等。用戶可(ke)以根據應用的(de)(de)類(lei)型來(lai)選擇(ze)不(bu)同(tong)的(de)(de)彈性和(he)計算顆粒度。
全托管的(de)(de) Serverless 使得(de)開發(fa)者可以專(zhuan)注于業務開發(fa),而不是(shi)基(ji)礎設施的(de)(de)運維,也讓系統能很容易的(de)(de)實現快速(su)伸縮(suo)。為(wei)此,陳曉建在(zai)峰會(hui)上特(te)別舉了(le)一(yi)個(ge) Second Dinner 打造年度(du)最佳移動游戲(xi)《Marvel Snap》的(de)(de)案例。《Marvel Snap》被 Second Dinner 工程副總裁稱為(wei)“這(zhe)是(shi)我(wo)們有史以來運營過(guo)的(de)(de)最順(shun)利、最成功(gong)的(de)(de)游戲(xi),正是(shi)因為(wei)我(wo)們選擇了(le)亞馬(ma)遜(xun)云科技”。
Second Dinner 采用(yong)亞(ya)馬(ma)遜(xun)云(yun)科技的(de) Serverless 架(jia)構來開(kai)發(fa)、構建和運(yun)行 Marvel Snap 游戲。整(zheng)個游戲沒有(you)使用(yong)任(ren)何 EC2 計算實(shi)例或(huo)容器,而是由事件(jian)(jian)驅動(dong)架(jia)構實(shi)現(xian)。這種方法(fa)不(bu)僅幫助用(yong)戶節省(sheng)成本、加快應(ying)用(yong)開(kai)發(fa)速度,還減(jian)少了(le)(le)(le)安全方面的(de)隱患。亞(ya)馬(ma)遜(xun)云(yun)科技的(de) Serverless 后臺架(jia)構為其提供了(le)(le)(le)完整(zheng)的(de)功能、安全和資源管理。最終(zhong),Marvel Snap 在(zai)啟動(dong)時沒有(you)出(chu)現(xian)任(ren)何后端(duan)錯誤事件(jian)(jian),這在(zai)游戲行業是前所(suo)未有(you)的(de)。此外,Marvel Snap 的(de)開(kai)發(fa)人員在(zai)系統非常早期的(de)測(ce)(ce)試(shi)階段,就已經通過(guo) Serverless 實(shi)現(xian)了(le)(le)(le)每分鐘 14 萬請求的(de)壓力測(ce)(ce)試(shi),要知道,這在(zai)云(yun)主(zhu)機的(de)時代是無法(fa)實(shi)現(xian)的(de),而這在(zai)亞(ya)馬(ma)遜(xun)云(yun)科技的(de)幫助下實(shi)現(xian)了(le)(le)(le)“不(bu)可能”。
三、企業正在把握全球性機遇,追求多元化市場
放眼全球(qiu)企(qi)(qi)業(ye)(ye)上(shang)(shang)云現(xian)狀,當(dang)下大多數(shu)企(qi)(qi)業(ye)(ye)只是簡單地(di)將原來的(de)系統搬(ban)到(dao)(dao)云上(shang)(shang),盡管降低了成本(ben),但(dan)并沒(mei)有(you)完全開(kai)發出云上(shang)(shang)的(de)潛力。搬(ban)到(dao)(dao)云上(shang)(shang)并不算(suan)是真正的(de)“上(shang)(shang)云”,最終還要(yao)讓企(qi)(qi)業(ye)(ye)系統和業(ye)(ye)務(wu)(wu)在云上(shang)(shang)跑起來才是硬道理。很多企(qi)(qi)業(ye)(ye)漸漸的(de)也(ye)意(yi)識到(dao)(dao)了這個問題,所以來自全球(qiu)各地(di)的(de)企(qi)(qi)業(ye)(ye)上(shang)(shang)云需(xu)求(qiu)和企(qi)(qi)業(ye)(ye)業(ye)(ye)務(wu)(wu)出海(hai)熱對(dui)云廠商提出了更高要(yao)求(qiu),這就不僅(jin)需(xu)要(yao)云廠商的(de)業(ye)(ye)務(wu)(wu)服(fu)務(wu)(wu)范圍覆蓋全球(qiu),同(tong)時還需(xu)要(yao)能(neng)夠快速(su)進行(xing)部(bu)署、高可用(yong)的(de)服(fu)務(wu)(wu)及(ji)相關業(ye)(ye)務(wu)(wu)對(dui)于各個國家和地(di)區的(de)業(ye)(ye)務(wu)(wu)合規需(xu)求(qiu)。
陳曉(xiao)建(jian)在(zai)本屆峰會(hui)上表(biao)示,全球(qiu)布局已經成(cheng)(cheng)為(wei)很(hen)多(duo)企(qi)業(ye)的(de)(de)戰略,然而云廠商想要(yao)完成(cheng)(cheng)全球(qiu)布局一(yi)定(ding)需要(yao)滿足企(qi)業(ye)對云服務(wu)的(de)(de)三個要(yao)求,即“無處不在(zai)的(de)(de)云服務(wu)”、“快速部署(shu)穩定(ding)系(xi)統(tong)”、“提供安全可靠的(de)(de)全球(qiu)基礎設施”,他通過亞馬遜云科技已經在(zai)過去驗證(zheng)過的(de)(de)成(cheng)(cheng)功案(an)例(li)舉(ju)證(zheng)來驗證(zheng)自己(ji)的(de)(de)觀點。
關(guan)于(yu)第(di)一(yi)個(ge)(ge)要求(qiu)“無處不在(zai)的(de)云(yun)(yun)(yun)服(fu)務”,讓創新快(kuai)速抵達每一(yi)個(ge)(ge)角落是(shi)亞(ya)(ya)馬(ma)(ma)遜(xun)云(yun)(yun)(yun)科(ke)技(ji)的(de)使命(ming)。陳曉建(jian)拿 OPPO 舉例,OPPO 的(de)手機業務遍布全(quan)球(qiu),擁有數百個(ge)(ge)云(yun)(yun)(yun)上 VPC 和本地資源需(xu)要連(lian)接(jie),由于(yu)不同國(guo)家有不同的(de)安全(quan)合(he)規要求(qiu),這(zhe)(zhe)增(zeng)加(jia)了全(quan)球(qiu)組(zu)網的(de)難(nan)度,OPPO 希望全(quan)球(qiu)業務獨(du)立(li)運作,實(shi)現區(qu)域(yu)合(he)規自(zi)治(zhi),同時擁有統一(yi)的(de)管理。于(yu)是(shi) OPPO 選擇通(tong)過使用(yong)亞(ya)(ya)馬(ma)(ma)遜(xun)云(yun)(yun)(yun)科(ke)技(ji)的(de) CloudWAN 廣域(yu)網服(fu)務,通(tong)過本地網絡(luo)提供(gong)商連(lian)接(jie)到亞(ya)(ya)馬(ma)(ma)遜(xun)云(yun)(yun)(yun)科(ke)技(ji),并(bing)(bing)通(tong)過中(zhong)(zhong)央控(kong)制面板和網絡(luo)策略在(zai)幾分鐘(zhong)內建(jian)立(li)覆(fu)蓋全(quan)球(qiu)的(de)專(zhuan)用(yong)網絡(luo)。同時 OPPO 借助(zhu)完(wan)整的(de)網絡(luo)視圖,可(ke)以直觀地了解整個(ge)(ge)網絡(luo)的(de)運行狀(zhuang)況、安全(quan)和性能。另外值(zhi)得一(yi)提的(de)一(yi)個(ge)(ge)案例是(shi),AXIOM 使用(yong) Amazon SnowCone 來支持(chi)太空實(shi)驗,成功環繞地球(qiu) 240 次。目前亞(ya)(ya)馬(ma)(ma)遜(xun)云(yun)(yun)(yun)科(ke)技(ji)的(de)技(ji)術已(yi)經可(ke)以在(zai)太空這(zhe)(zhe)種(zhong)極(ji)端環境中(zhong)(zhong)收集、處理數據(ju),并(bing)(bing)做出(chu)實(shi)時決策。
關于(yu)第二個(ge)要(yao)求(qiu)“快(kuai)速部(bu)署(shu)穩定系統”,亞(ya)馬遜(xun)云(yun)科技每個(ge)區(qu)域都由(you)多個(ge)可(ke)用(yong)區(qu)組成,單(dan)一(yi)(yi)可(ke)用(yong)區(qu)的故(gu)障(zhang)會影(ying)(ying)響其他可(ke)用(yong)區(qu)的業(ye)務,但通(tong)過解耦控制面(mian)與(yu)數據面(mian),可(ke)以提高整(zheng)體穩定性。蜂窩架(jia)構將系統分割成微小、獨立、隔(ge)離的單(dan)元,有效控制故(gu)障(zhang)影(ying)(ying)響。隨機分片進(jin)一(yi)(yi)步優化蜂窩架(jia)構,通(tong)過隨機分配(pei)客戶訪問,使單(dan)個(ge)單(dan)元故(gu)障(zhang)不影(ying)(ying)響整(zheng)個(ge)系統。我們還(huan)通(tong)過運營(ying)模型和(he)部(bu)署(shu)機制保證云(yun)的彈(dan)性,并(bing)使用(yong) COE 糾錯流程防止問題再次(ci)發(fa)生。
拿中集(ji)(ji)集(ji)(ji)團(tuan)來舉例,中集(ji)(ji)集(ji)(ji)團(tuan)使用(yong)(yong)(yong)亞馬(ma)遜(xun)云科技(ji)的(de)(de)服務實(shi)(shi)現(xian)了(le)(le) 82 個企業級應用(yong)(yong)(yong)的(de)(de)上線,包括 SAP、倉儲系統(tong)、CRM、SRM 和費(fei)控(kong)系統(tong)等,并(bing)實(shi)(shi)現(xian)了(le)(le) 20% 的(de)(de)成(cheng)本節約。原 SAP 系統(tong)存在延(yan)(yan)遲問題(ti),需容(rong)災,造(zao)成(cheng)資源占用(yong)(yong)(yong)。亞馬(ma)遜(xun)云科技(ji)為(wei)其設計了(le)(le)新一代 SAP 架(jia)構,應用(yong)(yong)(yong)和數據庫在同一可用(yong)(yong)(yong)區,延(yan)(yan)遲極低至 0.1 毫秒以內(nei);容(rong)災方面,RPO 為(wei) 0,RTO 不超 15 分鐘,資源成(cheng)本下降 18.7%。這(zhe)套全新的(de)(de) SAP 架(jia)構讓中集(ji)(ji)集(ji)(ji)團(tuan)獲得(de)了(le)(le)更強大的(de)(de)風(feng)險(xian)控(kong)制能力(li),業務連(lian)續性得(de)到保證。
關于第(di)三個要求(qiu)“提(ti)供安全(quan)(quan)(quan)可(ke)靠的(de)全(quan)(quan)(quan)球(qiu)基礎(chu)設施”,亞(ya)馬遜(xun)云(yun)(yun)科(ke)技幾乎滿足(zu)全(quan)(quan)(quan)球(qiu)所有國家和(he)地區的(de)合(he)(he)(he)法合(he)(he)(he)規(gui)(gui)的(de)要求(qiu)。比(bi)如生物醫療、聯邦認證以(yi)(yi)及金融等(deng)行業,又(you)比(bi)如 HIPAA、FedRAMP 和(he) PCI 這(zhe)樣高標準的(de)合(he)(he)(he)規(gui)(gui)要求(qiu)。拿全(quan)(quan)(quan)球(qiu)電子支付終(zhong)端(duan)領(ling)先(xian)供應商(shang) PAX 百富來舉(ju)例,其(qi)在(zai)遷移(yi)多個重要 SaaS 應用至云(yun)(yun)上時(shi),發(fa)現多供應商(shang)的(de)安全(quan)(quan)(quan)服務標準不統一(yi),無法滿足(zu)支付安全(quan)(quan)(quan)要求(qiu),且難以(yi)(yi)集(ji)成和(he)管(guan)理。亞(ya)馬遜(xun)云(yun)(yun)科(ke)技便為其(qi)提(ti)供了(le)安全(quan)(quan)(quan)合(he)(he)(he)規(gui)(gui)服務(如 Amazon CloudHSM、Security Hub)以(yi)(yi)幫其(qi)保障用戶支付信(xin)息安全(quan)(quan)(quan)和(he)業務安全(quan)(quan)(quan),滿足(zu) PCI 合(he)(he)(he)規(gui)(gui)要求(qiu),并支持(chi)國際業務拓展。使用亞(ya)馬遜(xun)云(yun)(yun)科(ke)技的(de)產品(pin)使百富的(de)產品(pin)交付周期縮短(duan) 40%,降低架構(gou)搭(da)建及運(yun)維壓(ya)力,節(jie)省 20% 成本。
陳曉建提(ti)(ti)到的(de)以上三個方面(mian),對企(qi)業用云(yun)需求進行了完整概(gai)括,而這也是云(yun)廠(chang)商幫助(zhu)企(qi)業降(jiang)低用云(yun)門檻、實(shi)現云(yun)基礎架構(gou)創(chuang)新的(de)重要發展方向(xiang)。云(yun)廠(chang)商需要從區域覆蓋、安全(quan)和(he)技術成本等方面(mian)進行全(quan)維(wei)度(du)的(de)升級,提(ti)(ti)供更好的(de)云(yun)計算產品和(he)服(fu)務(wu),來(lai)滿足(zu)企(qi)業的(de)“既(ji)要、又要”。
四、云廠商需要專注“創新”,擺脫基礎架構束縛
目前企(qi)業愈加(jia)難以滿足日益增長(chang)的客戶對快速、可靠和(he)安全(quan)服務(wu)的期望,在提高自(zi)身(shen)系統的處理能力和(he)存儲能力的過(guo)程中(zhong),面對著巨大(da)的算力需(xu)求(qiu)和(he)成(cheng)本過(guo)高的可伸縮(suo)且(qie)安全(quan)的 IT 基礎架構。
云計算基(ji)礎設(she)施的(de)穩定和(he)可靠(kao),是云廠商的(de)核心(xin)競爭力(li)(li)。然而,云計算作(zuo)為數字產業的(de)新(xin)基(ji)建(jian),面臨(lin)著行業高(gao)速增長的(de)機遇,同時也(ye)在(zai)(zai)(zai)諸多(duo)領域存在(zai)(zai)(zai)著挑戰,比(bi)如(ru) AI 就是一(yi)次巨大(da)(da)的(de)浪潮,在(zai)(zai)(zai)全球范圍(wei)內都帶來(lai)了巨大(da)(da)的(de)市場(chang)機遇和(he)發(fa)展潛(qian)力(li)(li),但目(mu)前云基(ji)礎架構還面臨(lin)著把數據留在(zai)(zai)(zai)本(ben)地、延遲(chi)和(he)帶寬問題和(he)連接穩健性(xing)等問題。
如果上(shang)升到云計(ji)算整個領域的(de)(de)(de)(de)發展(zhan)的(de)(de)(de)(de)探討,站在(zai)(zai)(zai)終端用(yong)戶角(jiao)度去看,在(zai)(zai)(zai)使用(yong)產品的(de)(de)(de)(de)過程中,用(yong)戶實際更關(guan)注(zhu)的(de)(de)(de)(de)是使用(yong)體(ti)驗(yan),當(dang)前基礎(chu)設施要滿足用(yong)戶順暢的(de)(de)(de)(de)體(ti)驗(yan)需求,即算力噴發下產生的(de)(de)(de)(de)需求,需要在(zai)(zai)(zai)數據存儲(chu)、數據節(jie)點通信(xin)及指令調度等層面進行一定的(de)(de)(de)(de)創新(xin)(xin)(xin);站在(zai)(zai)(zai)企(qi)業(ye)開發者的(de)(de)(de)(de)角(jiao)度去看,高效開發、低成(cheng)本(ben)運(yun)(yun)維是開發者最關(guan)注(zhu)的(de)(de)(de)(de)問(wen)題,在(zai)(zai)(zai)云基礎(chu)架構體(ti)系(xi)中,工(gong)具鏈的(de)(de)(de)(de)使用(yong)、性(xing)能調優(you)方式、性(xing)能工(gong)具的(de)(de)(de)(de)創新(xin)(xin)(xin)是未來主(zhu)要發展(zhan)點。此外服務的(de)(de)(de)(de)部署、管理、跟蹤(zong)、調試等各個環節(jie)管理和運(yun)(yun)維工(gong)具的(de)(de)(de)(de)創新(xin)(xin)(xin),以及企(qi)業(ye)如何降低運(yun)(yun)營成(cheng)本(ben)也云計(ji)算廠商持(chi)續研(yan)究并創新(xin)(xin)(xin)的(de)(de)(de)(de)課題。
所以,未來只有軟硬一體的生態化發展,才能幫助行業更好地完善基礎設施,從而為企業數字化轉型、降本增效的大目標實現保駕護航,而這一點亞馬遜云科技做到了。亞馬遜云科技的網絡安全芯片 Nitro 系列、服務器芯片 Graviton 系列、人工智能(AI)推理(li)芯片 Inferentia、AI 訓練芯片 Trainium 系列的四(si)大自研芯片業務線,從高(gao)性(xing)能計算、至廣(guang)至深的云計算實例選擇(ze)、存儲、網絡安(an)全(quan)、可(ke)靠(kao)等方面都(dou)顯示出了(le)絕對(dui)(dui)的性(xing)價比及絕對(dui)(dui)優秀(xiu)的能力。
同(tong)時,我們從亞馬(ma)遜(xun)云科技(ji)的(de)每一個實例與(yu)(yu)案(an)例中也可以看到(dao),亞馬(ma)遜(xun)云科技(ji)這(zhe)些(xie)年來從技(ji)術上做的(de)創新(xin)與(yu)(yu)幫助全(quan)球(qiu)范(fan)圍內的(de)客戶(hu)完(wan)成技(ji)術創新(xin),為(wei)的(de)就是突破當下云基礎架構的(de)“束(shu)縛”,不斷探(tan)索新(xin)的(de)云計算技(ji)術和應用(yong)模式,實現業務創新(xin)和發(fa)展(zhan),這(zhe)為(wei)行業內的(de)其他(ta)廠商起到(dao)了(le)“帶(dai)頭(tou)羊(yang)”作用(yong)。希望(wang)亞馬(ma)遜(xun)云科技(ji)在未(wei)來可以與(yu)(yu)全(quan)球(qiu)更多企業共同(tong)推(tui)動云計算的(de)發(fa)展(zhan),為(wei)行業發(fa)展(zhan)不斷注(zhu)入新(xin)動力。