6 月 27 日(ri)至 28 日(ri),2023 亞(ya)馬(ma)(ma)遜(xun)云(yun)(yun)科技(ji)中國峰(feng)會(下文(wen)稱“峰(feng)會”)于上(shang)海(hai)順利(li)召開。在本次峰(feng)會上(shang),我們(men)似乎找尋到(dao)了云(yun)(yun)計算領域競(jing)爭對手均日(ri)漸成(cheng)熟,而(er)亞(ya)馬(ma)(ma)遜(xun)云(yun)(yun)科技(ji)卻能(neng)一(yi)直保持(chi)領先地位的原(yuan)因——過(guo)去的十幾(ji)年里,亞(ya)馬(ma)(ma)遜(xun)云(yun)(yun)科技(ji)“基(ji)于客戶需求,快速進行產(chan)品(pin)更新(xin)與(yu)技(ji)術迭代(dai)”的 Day one 理(li)念,一(yi)直不(bu)斷地追求基(ji)礎架構層面(mian)的創(chuang)新(xin)。
6 月(yue) 28 日(ri)上(shang)午,亞馬(ma)遜云(yun)(yun)科技(ji)大中(zhong)華區產品部總經理陳曉建(jian)進行了(le)(le)以《專(zhuan)注創新,擺脫基(ji)礎架(jia)構束(shu)縛》為(wei)主(zhu)題的(de)演講,在(zai)演講中(zhong)他分享了(le)(le)亞馬(ma)遜云(yun)(yun)科技(ji)眾多(duo)應用案例(li)實踐,闡明(ming)了(le)(le)亞馬(ma)遜云(yun)(yun)科技(ji)在(zai)云(yun)(yun)基(ji)礎架(jia)構方(fang)面(mian)的(de)能力(li)與創新及在(zai)全球布局方(fang)面(mian)做出的(de)努力(li)。
一、企業亟需提高“用云”性價比
隨著企(qi)(qi)業(ye)數字(zi)化轉型(xing)的(de)(de)(de)需(xu)(xu)求增加、市場競爭的(de)(de)(de)加劇,企(qi)(qi)業(ye)需(xu)(xu)要將(jiang)業(ye)務和數據遷移到(dao)云上,以實現更高效的(de)(de)(de)生產和服(fu)務,以適應市場的(de)(de)(de)變化。所以我(wo)們也觀(guan)察到(dao)越來越多(duo)的(de)(de)(de)企(qi)(qi)業(ye)開始上云,然(ran)而上云的(de)(de)(de)門檻并(bing)不(bu)(bu)低,需(xu)(xu)要考慮的(de)(de)(de)東西非常多(duo),比如技術能力、安全合規風險、成本(ben)費用(yong)、用(yong)戶體(ti)驗(yan)等,很(hen)多(duo)企(qi)(qi)業(ye) CTO 表示,“想上云,但是有心(xin)而力不(bu)(bu)足”,大多(duo)企(qi)(qi)業(ye)目前提出(chu)了亟需(xu)(xu)降低云服(fu)務使用(yong)門檻、提高“用(yong)云”性價比的(de)(de)(de)需(xu)(xu)求。
為了提高企業云服務使用的性價比,亞馬遜云科技為用戶提供全面和深入的算力支持,提供包括 Intel、AMD、 英偉達和自研的 CPU 及加速芯片產品,這(zhe)其中最值得一提的就是亞馬遜云(yun)科技的四個自研(yan)芯片(pian):Nitro、Graviton、Inferentia、Trainium。
Nitro 是亞馬遜云(yun)科(ke)(ke)技(ji)的(de)(de)(de)(de)第一(yi)款自研芯(xin)片產(chan)品,Nitro 主要有三(san)個(ge)亮(liang)點:第一(yi),做了(le)(le)高度輕量化的(de)(de)(de)(de)虛擬化;第二,實(shi)現(xian)網絡層(ceng)面的(de)(de)(de)(de)數據通信和存儲(chu)的(de)(de)(de)(de)隔離(li);第三(san),實(shi)現(xian)了(le)(le)硬件級別的(de)(de)(de)(de)加密(mi)。有了(le)(le) Nitro 之(zhi)后,亞馬遜云(yun)科(ke)(ke)技(ji)能(neng)夠大(da)(da)大(da)(da)增強 EC2 整(zheng)個(ge)實(shi)例(li)應用的(de)(de)(de)(de)安(an)全性,每(mei)個(ge)單元可以獨立發(fa)展,也確(que)保(bao) EC2 所有實(shi)例(li)運行的(de)(de)(de)(de)穩定(ding)。 因為 Nitro 的(de)(de)(de)(de)出(chu)現(xian),亞馬遜云(yun)科(ke)(ke)技(ji)大(da)(da)大(da)(da)降(jiang)低了(le)(le)推出(chu)一(yi)個(ge)新 EC2 實(shi)例(li)工(gong)作的(de)(de)(de)(de)復雜(za)性,使得其保(bao)持(chi)一(yi)個(ge)非常快的(de)(de)(de)(de)增長的(de)(de)(de)(de)速度,進一(yi)步(bu)降(jiang)低客戶成本,從而幫助企業達到降(jiang)本增效的(de)(de)(de)(de)目(mu)標。最新一(yi)代 Nitro V5 芯(xin)片相比之(zhi)前的(de)(de)(de)(de)芯(xin)片性能(neng)有大(da)(da)幅(fu)的(de)(de)(de)(de)提(ti)升(sheng),包(bao)括更快的(de)(de)(de)(de)轉發(fa)率,包(bao)括更低的(de)(de)(de)(de)延遲,每(mei)瓦(wa)特性能(neng)提(ti)升(sheng) 40%。
基于(yu) ARM 架構的(de)(de)通用處理器芯片(pian) Graviton 自(zi) 2018 年起,亞(ya)馬(ma)遜云科(ke)技陸續推出(chu)三代 Graviton 服務(wu)器芯片(pian),在(zai)去年的(de)(de) re:lnvent 全球大會上,亞(ya)馬(ma)遜云科(ke)技推出(chu)了自(zi)研的(de)(de)、基于(yu) ARM 架構的(de)(de)高(gao)性(xing)(xing)能計(ji)(ji)算(suan)服務(wu)器 CPU 芯片(pian) Graviton3E 芯片(pian)。縱觀 Graviton 系(xi)列芯片(pian)的(de)(de)升級(ji)歷(li)程(cheng),Graviton3 計(ji)(ji)算(suan)性(xing)(xing)能提(ti)高(gao) 25%,浮點(dian)性(xing)(xing)能提(ti)高(gao) 2 倍(bei),加(jia)(jia)密工(gong)作(zuo)負載性(xing)(xing)能加(jia)(jia)快 2 倍(bei);Graviton3E 特別關注向(xiang)量計(ji)(ji)算(suan)的(de)(de)性(xing)(xing)能,跟(gen)前一代相(xiang)比(bi)高(gao) 35%,這個性(xing)(xing)能提(ti)升對于(yu)像 HPC 高(gao)性(xing)(xing)能計(ji)(ji)算(suan)這樣的(de)(de)應用來說是非常重要的(de)(de)。
從具體案例來看,在 HPL(線性代數(shu)的(de)測量工具)上 Graviton3E 性能(neng)提(ti)升 35%,在 GROMACS(分子(zi)運動)上性能(neng)提(ti)升 12%,在金融期權定價的(de)工作(zuo)負載上性能(neng)提(ti)升 30%;同時,Graviton3E 和類似的(de) X86 的(de) EC2 實(shi)例相(xiang)比,Graviton3E 還能(neng)節省 60% 的(de)能(neng)耗。
如今 Graviton 系(xi)列芯片(pian)的(de)(de)(de)優秀性能(neng)(neng)表現(xian)已經(jing)得(de)到(dao)(dao)了(le)充分驗證(zheng),本屆峰(feng)會上(shang),陳曉建講到(dao)(dao)的(de)(de)(de)世界一級方(fang)程式錦標賽(下文簡(jian)稱“F1”)案(an)例便充分體現(xian)了(le)亞馬遜云科技在算(suan)力資源、數據(ju)存儲(chu)方(fang)面的(de)(de)(de)能(neng)(neng)力。F1 利用 Graviton3 運(yun)行(xing)(xing)空氣動力學模擬,可以(yi)用比以(yi)往(wang)快 70% 的(de)(de)(de)速度開(kai)發新一代賽車(che),賽車(che)壓(ya)力損失可以(yi)從 50% 降低(di)到(dao)(dao) 15% ,這(zhe)使超車(che)更容易(yi),為車(che)迷可以(yi)帶來(lai)更多賽場的(de)(de)(de)纏斗。此外,F1 通過(guo) 5000 多次單車(che)和多車(che)模擬,收(shou)集了(le)超過(guo) 5.5 億(yi)個數據(ju)點,幫助他們進行(xing)(xing)下一代賽車(che)的(de)(de)(de)優化。用 F1 團隊表示(shi),“Graviton3 讓系(xi)統性能(neng)(neng)快了(le) 40%,可以(yi)晚(wan)間(jian)運(yun)行(xing)(xing)模擬,第二天早上(shang)就(jiu)能(neng)(neng)得(de)出結果(guo)。”
在(zai)機器學(xue)習技術探索賽道中,目前(qian)亞(ya)馬(ma)(ma)遜云(yun)科技已經(jing)發展出三代(dai)不(bu)同的(de)(de)機器學(xue)習芯片。在(zai)訓(xun)練方面,亞(ya)馬(ma)(ma)遜云(yun)科技先(xian)后推出的(de)(de)加速芯片 Inferentia 和 Trainium 覆(fu)蓋了訓(xun)練和推理的(de)(de)場景,能為企業提供最佳的(de)(de)性價比。因(yin)此,許多(duo)領(ling)先(xian)的(de)(de) 生成(cheng)式 AI 初創公司,例如 AI21 Labs、Hugging Face、Runway 和 Stability AI 都選擇 Inferentia 和 Trainium 作(zuo)為他們整(zheng)個研發和應用的(de)(de)平臺。
在(zai)機器學習訓(xun)練(lian)中,最重要的(de)指(zhi)標是訓(xun)練(lian)效率和性價比。以 HuggingFace BERT 模型為例,基于加速(su)芯片 Trainium 的(de) Trn1 實(shi)(shi)例的(de)性能表現非常不錯,從訓(xun)練(lian)吞吐(tu)(tu)量(liang)角度(du)看(kan),其(qi)與同類型 GPU 實(shi)(shi)例相比,在(zai)單(dan)(dan)節點情況下(xia),可實(shi)(shi)現 1.2 倍(bei)吞吐(tu)(tu)量(liang)的(de)提(ti)升;在(zai)多節點情況下(xia),實(shi)(shi)現 1.5 倍(bei)吞吐(tu)(tu)量(liang)的(de)提(ti)升;從成本(ben)(ben)角度(du),單(dan)(dan)節點實(shi)(shi)現了(le) 1.8 倍(bei)成本(ben)(ben)降低,集(ji)群的(de)成本(ben)(ben)降低了(le) 2.3 倍(bei)。
隨(sui)著模型越(yue)來越(yue)復雜,很多(duo)時候靠一個(ge)單點的(de)(de)計算(suan)(suan)訓練(lian)是(shi)無法滿足用戶的(de)(de)需求,在(zai)很多(duo)時候都需要一個(ge)分布(bu)式的(de)(de)訓練(lian),比(bi)如需要非常大(da)規模的(de)(de)集群(qun)(qun),通過 Trainium 便(bian)可以(yi)構建一個(ge)超(chao)大(da)的(de)(de)集群(qun)(qun),它可以(yi)有 3 萬張的(de)(de) Trainium 芯片,使(shi)企業可以(yi)獲(huo)得云上 6 ExaFlops 的(de)(de)超(chao)算(suan)(suan)級性(xing)能(neng)。這背后涉及很多(duo)創(chuang)新,比(bi)如更(geng)快的(de)(de) EFA 網絡以(yi)及 PB 級別的(de)(de)無阻塞網絡互聯(lian)等。
在(zai)機(ji)器學習(xi)推(tui)理中(zhong),推(tui)理往(wang)往(wang)要考慮(lv)延(yan)遲和(he)吞(tun)吐,企業需要更高的(de)(de)(de)(de)吞(tun)吐力來帶(dai)來更優(you)的(de)(de)(de)(de)性價(jia)比,但是往(wang)往(wang)更高的(de)(de)(de)(de)吞(tun)吐率會帶(dai)來更高延(yan)遲,所以開(kai)發者往(wang)往(wang)要在(zai)延(yan)遲和(he)吞(tun)吐中(zhong)權衡。Inferentia2 的(de)(de)(de)(de)設計就考慮(lv)到了(le)兼顧吞(tun)吐和(he)延(yan)遲的(de)(de)(de)(de)優(you)化,如果拿(na)一個基于 Inferentia2 的(de)(de)(de)(de)實(shi)例做測試,以自然語言處理領域常見的(de)(de)(de)(de) BERT 模型為例,在(zai) Inferentia2 上可實(shi)現高達 3 倍的(de)(de)(de)(de)吞(tun)吐提升,8.1 倍的(de)(de)(de)(de)延(yan)遲降(jiang)低(di),4 倍的(de)(de)(de)(de)成(cheng)本節約,使得企業開(kai)發者二者兼而有之。
另外(wai)值得一提的(de)(de)(de)是(shi),Inferentia2 在(zai)大語言模(mo)型(xing)(xing)中的(de)(de)(de)表現也非常(chang)的(de)(de)(de)突出。拿一個(ge) OPT 模(mo)型(xing)(xing)來做測(ce)試,中等(deng)規模(mo)的(de)(de)(de) OPT 模(mo)型(xing)(xing) OPT-30B 為例(li),相較于通用的(de)(de)(de) EC2 GPU 實(shi)(shi)例(li),Inferentia2 可(ke)實(shi)(shi)現 65% 的(de)(de)(de)吞吐量(liang)提升,推理(li)成本(ben)可(ke)降低 52%;660 億(yi)參數(shu)(shu)級(ji)別的(de)(de)(de) OPT-66B,通用 GPU 實(shi)(shi)例(li)已經顯(xian)示內存不足的(de)(de)(de)情況下, 而在(zai) Inferentia2 上還(huan)可(ke)以實(shi)(shi)現每秒 351 個(ge) token 數(shu)(shu)的(de)(de)(de)吞吐量(liang)。
二、“AI 創新”使算力需求井噴、運維復雜性增加
隨著 AI 大(da)(da)模(mo)(mo)型的(de)(de)(de)發展,大(da)(da)模(mo)(mo)型應(ying)用(yong)規模(mo)(mo)呈爆發式增長(chang),加速了(le)未來(lai)計(ji)算時代的(de)(de)(de)來(lai)臨,引發了(le)新(xin)的(de)(de)(de)生(sheng)產力(li)(li)革命,但同時也導致算力(li)(li)供(gong)不應(ying)求(qiu),在這(zhe)個過程中(zhong),算力(li)(li)直(zhi)接反映了(le)數據處(chu)理能力(li)(li)的(de)(de)(de)強弱,用(yong)戶不僅需要更高性價比(bi)硬件(jian)的(de)(de)(de)解決方案,他們(men)還需要云廠商提供(gong)高度(du)彈性化的(de)(de)(de)伸縮。與此同時,巨大(da)(da)算力(li)(li)的(de)(de)(de)增加,使企(qi)業云運(yun)維成(cheng)本大(da)(da)大(da)(da)增加,如(ru)何降低云運(yun)維的(de)(de)(de)復雜性也是企(qi)業目前(qian)面(mian)臨的(de)(de)(de)難(nan)題。
為了應(ying)對彈性算(suan)(suan)力(li)的(de)(de)需求,亞馬遜云科技(ji)提供超過 600 種不(bu)同的(de)(de)計(ji)(ji)算(suan)(suan)實例,處理器(qi)、存儲、網絡及(ji)各種周邊服務均(jun)可與計(ji)(ji)算(suan)(suan)很好地結合,以(yi)積木的(de)(de)方式形成豐富的(de)(de)、靈活的(de)(de)計(ji)(ji)算(suan)(suan)實例資源,滿足多種不(bu)同算(suan)(suan)力(li)要求。
要知道,從存(cun)(cun)儲(chu)層面,當數(shu)據規模達到 PB、EB 級別(bie)(bie)時,數(shu)據的(de)存(cun)(cun)儲(chu)方式非常(chang)重要。用戶的(de)數(shu)據存(cun)(cun)儲(chu)可分為(wei)熱、溫、冷、凍四種類(lei)型,每種類(lei)型的(de)存(cun)(cun)儲(chu)成本和性(xing)能不(bu)同(tong),都需要平衡。所以,亞馬遜云科技提(ti)供多達八(ba)種的(de)存(cun)(cun)儲(chu)級別(bie)(bie),包括高性(xing)能計算、機器學習(xi)和通用計算等,企(qi)業(ye)根(gen)據需要選擇最合理的(de)存(cun)(cun)儲(chu)級別(bie)(bie)。
這其中最具有代表性的(de)案(an)例(li)(li)就是(shi)《阿(a)凡(fan)達》的(de)制作公司 Weta Digital,其在開發《阿(a)凡(fan)達 1》時(shi),他們(men)自(zi)建(jian)了(le)一個占(zhan)地 10000 平(ping)方英尺的(de)機房,構(gou)建(jian) 4000 臺(tai)物理服務器和 35000 個處理器核心。然(ran)而,在開發《阿(a)凡(fan)達 2 – 水之道》時(shi),他們(men)原有的(de)集群已經無法滿(man)足需求。于是(shi),亞馬遜云科技為 Weta Digital 提(ti)(ti)供了(le)從(cong)基(ji)礎架(jia)構(gou)算(suan)力資源(yuan)到云上(shang)制作堆(dui)棧、機器學(xue)習堆(dui)棧的(de)一系列(lie)服務,Weta Digital 使用了(le)包括 GPU 實(shi)(shi)例(li)(li)和 Spot 實(shi)(shi)例(li)(li)在內的(de)多(duo)種(zhong)計算(suan)實(shi)(shi)例(li)(li)以提(ti)(ti)供強大的(de)伸縮性和優秀(xiu)的(de)性價比。
然而對于(yu)亞馬(ma)(ma)遜云(yun)(yun)科(ke)技來(lai)說,僅僅對企業(ye)進行(xing)多(duo)(duo)種多(duo)(duo)樣的芯片和高(gao)伸縮性的資源(yuan)供給是遠遠不夠的,亞馬(ma)(ma)遜云(yun)(yun)科(ke)技還為(wei)企業(ye)提供了 Serverless 來(lai)降(jiang)低云(yun)(yun)運維的復(fu)雜性。亞馬(ma)(ma)遜云(yun)(yun)科(ke)技在 2014 年發(fa)布 Lambda 以來(lai),已經相繼發(fa)布了 105 多(duo)(duo)種 Serverless 新技術,包括解決 Java 應(ying)用冷啟動問題(ti)的 Lambda SnapStart、可視化編輯器 Application Composer 等。用戶可以根(gen)據應(ying)用的類型來(lai)選擇不同的彈性和計算顆(ke)粒度。
全托管(guan)的(de) Serverless 使得開發者可以(yi)專注(zhu)于業務開發,而不是(shi)(shi)基礎設施的(de)運(yun)維,也讓系統能很容易的(de)實現快速伸縮。為此(ci),陳曉建在峰(feng)會上特別(bie)舉(ju)了(le)一個(ge) Second Dinner 打造年(nian)度最佳移動游(you)戲《Marvel Snap》的(de)案例。《Marvel Snap》被 Second Dinner 工程副總裁(cai)稱(cheng)為“這是(shi)(shi)我(wo)們(men)有史以(yi)來運(yun)營過的(de)最順利、最成功的(de)游(you)戲,正是(shi)(shi)因為我(wo)們(men)選擇(ze)了(le)亞馬遜云(yun)科技”。
Second Dinner 采(cai)用(yong)亞(ya)馬遜(xun)云(yun)科(ke)(ke)技(ji)(ji)的(de)(de) Serverless 架(jia)構來開(kai)發(fa)、構建和運行 Marvel Snap 游戲(xi)。整個游戲(xi)沒有使用(yong)任何 EC2 計算實例或容器,而是(shi)由(you)事件(jian)驅(qu)動(dong)架(jia)構實現。這種方(fang)法不(bu)僅(jin)幫助(zhu)用(yong)戶(hu)節(jie)省(sheng)成本、加(jia)快應用(yong)開(kai)發(fa)速度,還減(jian)少了(le)(le)安全方(fang)面(mian)的(de)(de)隱患。亞(ya)馬遜(xun)云(yun)科(ke)(ke)技(ji)(ji)的(de)(de) Serverless 后臺架(jia)構為其提(ti)供了(le)(le)完整的(de)(de)功能、安全和資(zi)源(yuan)管理(li)。最(zui)終(zhong),Marvel Snap 在啟動(dong)時(shi)沒有出現任何后端錯誤(wu)事件(jian),這在游戲(xi)行業是(shi)前(qian)所未有的(de)(de)。此外,Marvel Snap 的(de)(de)開(kai)發(fa)人員在系(xi)統非常早期的(de)(de)測試(shi)階段,就已經通(tong)過 Serverless 實現了(le)(le)每分鐘 14 萬請求的(de)(de)壓力測試(shi),要知道,這在云(yun)主機的(de)(de)時(shi)代是(shi)無法實現的(de)(de),而這在亞(ya)馬遜(xun)云(yun)科(ke)(ke)技(ji)(ji)的(de)(de)幫助(zhu)下實現了(le)(le)“不(bu)可能”。
三、企業正在把握全球性機遇,追求多元化市場
放眼全球(qiu)企(qi)(qi)(qi)(qi)業(ye)上(shang)(shang)云(yun)(yun)現狀,當下大多數(shu)企(qi)(qi)(qi)(qi)業(ye)只(zhi)是(shi)簡單(dan)地(di)將原來的(de)(de)(de)系(xi)統搬到(dao)云(yun)(yun)上(shang)(shang),盡(jin)管降低了(le)(le)成本,但并沒有完全開(kai)發(fa)出云(yun)(yun)上(shang)(shang)的(de)(de)(de)潛力。搬到(dao)云(yun)(yun)上(shang)(shang)并不算是(shi)真正(zheng)的(de)(de)(de)“上(shang)(shang)云(yun)(yun)”,最終還要(yao)讓企(qi)(qi)(qi)(qi)業(ye)系(xi)統和(he)業(ye)務(wu)在云(yun)(yun)上(shang)(shang)跑(pao)起來才是(shi)硬道(dao)理(li)。很多企(qi)(qi)(qi)(qi)業(ye)漸漸的(de)(de)(de)也(ye)意識到(dao)了(le)(le)這個問題,所以來自全球(qiu)各地(di)的(de)(de)(de)企(qi)(qi)(qi)(qi)業(ye)上(shang)(shang)云(yun)(yun)需(xu)(xu)求和(he)企(qi)(qi)(qi)(qi)業(ye)業(ye)務(wu)出海熱對(dui)云(yun)(yun)廠商(shang)提(ti)出了(le)(le)更高要(yao)求,這就不僅需(xu)(xu)要(yao)云(yun)(yun)廠商(shang)的(de)(de)(de)業(ye)務(wu)服務(wu)范(fan)圍(wei)覆蓋全球(qiu),同時還需(xu)(xu)要(yao)能夠快速進行部署(shu)、高可用的(de)(de)(de)服務(wu)及相關業(ye)務(wu)對(dui)于各個國家和(he)地(di)區(qu)的(de)(de)(de)業(ye)務(wu)合規需(xu)(xu)求。
陳(chen)曉(xiao)建(jian)在本屆峰(feng)會上(shang)表(biao)示,全球(qiu)布局已經成(cheng)為(wei)很多企業(ye)的(de)(de)戰略,然(ran)而(er)云(yun)(yun)廠商想要(yao)完成(cheng)全球(qiu)布局一定需要(yao)滿足企業(ye)對云(yun)(yun)服(fu)務(wu)(wu)的(de)(de)三個要(yao)求(qiu),即“無處不在的(de)(de)云(yun)(yun)服(fu)務(wu)(wu)”、“快速部署(shu)穩定系統”、“提供安全可靠的(de)(de)全球(qiu)基(ji)礎設施”,他通過亞馬遜云(yun)(yun)科技已經在過去驗證(zheng)過的(de)(de)成(cheng)功案例舉證(zheng)來驗證(zheng)自己的(de)(de)觀點(dian)。
關(guan)于(yu)(yu)第(di)一個(ge)(ge)要(yao)求(qiu)“無(wu)處不(bu)在的(de)(de)云(yun)(yun)服(fu)務(wu)”,讓創新快速(su)抵達(da)每(mei)一個(ge)(ge)角落(luo)是(shi)亞(ya)馬(ma)遜(xun)云(yun)(yun)科技(ji)的(de)(de)使(shi)命。陳曉建(jian)拿(na) OPPO 舉例,OPPO 的(de)(de)手機業(ye)務(wu)遍布(bu)全球(qiu)(qiu),擁(yong)有數(shu)百個(ge)(ge)云(yun)(yun)上(shang) VPC 和本(ben)地(di)(di)資(zi)源需(xu)要(yao)連接,由于(yu)(yu)不(bu)同國家有不(bu)同的(de)(de)安全合(he)規要(yao)求(qiu),這增(zeng)加了全球(qiu)(qiu)組網(wang)的(de)(de)難度,OPPO 希望全球(qiu)(qiu)業(ye)務(wu)獨(du)立運作,實(shi)現區域合(he)規自治,同時(shi)(shi)擁(yong)有統一的(de)(de)管理(li)。于(yu)(yu)是(shi) OPPO 選擇通過(guo)使(shi)用亞(ya)馬(ma)遜(xun)云(yun)(yun)科技(ji)的(de)(de) CloudWAN 廣域網(wang)服(fu)務(wu),通過(guo)本(ben)地(di)(di)網(wang)絡(luo)提(ti)供商連接到亞(ya)馬(ma)遜(xun)云(yun)(yun)科技(ji),并通過(guo)中(zhong)央控制面板和網(wang)絡(luo)策(ce)略在幾分鐘內(nei)建(jian)立覆蓋(gai)全球(qiu)(qiu)的(de)(de)專用網(wang)絡(luo)。同時(shi)(shi) OPPO 借助完(wan)整的(de)(de)網(wang)絡(luo)視圖,可(ke)以直觀(guan)地(di)(di)了解(jie)整個(ge)(ge)網(wang)絡(luo)的(de)(de)運行(xing)狀況、安全和性能。另外值得一提(ti)的(de)(de)一個(ge)(ge)案例是(shi),AXIOM 使(shi)用 Amazon SnowCone 來支(zhi)持太空(kong)(kong)實(shi)驗,成(cheng)功環(huan)(huan)繞地(di)(di)球(qiu)(qiu) 240 次。目(mu)前亞(ya)馬(ma)遜(xun)云(yun)(yun)科技(ji)的(de)(de)技(ji)術已經(jing)可(ke)以在太空(kong)(kong)這種極端環(huan)(huan)境(jing)中(zhong)收集、處理(li)數(shu)據,并做(zuo)出實(shi)時(shi)(shi)決策(ce)。
關于第二個(ge)要求“快速(su)部(bu)署穩定系統”,亞馬遜云(yun)科技每個(ge)區域都由(you)多個(ge)可(ke)(ke)用(yong)(yong)區組(zu)成,單(dan)一可(ke)(ke)用(yong)(yong)區的故(gu)障(zhang)會影響(xiang)其他可(ke)(ke)用(yong)(yong)區的業(ye)務,但(dan)通(tong)過解耦控(kong)(kong)制面(mian)(mian)與數據(ju)面(mian)(mian),可(ke)(ke)以提高整體穩定性(xing)。蜂窩架構將系統分(fen)割成微小(xiao)、獨(du)立、隔離的單(dan)元(yuan),有效(xiao)控(kong)(kong)制故(gu)障(zhang)影響(xiang)。隨(sui)機分(fen)片進一步優化(hua)蜂窩架構,通(tong)過隨(sui)機分(fen)配客戶訪問,使單(dan)個(ge)單(dan)元(yuan)故(gu)障(zhang)不影響(xiang)整個(ge)系統。我們還通(tong)過運營(ying)模型和部(bu)署機制保證(zheng)云(yun)的彈性(xing),并使用(yong)(yong) COE 糾(jiu)錯流程防止問題再次發生(sheng)。
拿中集(ji)集(ji)團(tuan)來舉例,中集(ji)集(ji)團(tuan)使用(yong)(yong)(yong)亞馬遜云科技的(de)(de)服務實現(xian)了 82 個企業級應用(yong)(yong)(yong)的(de)(de)上線,包括(kuo) SAP、倉(cang)儲系(xi)統、CRM、SRM 和費控(kong)系(xi)統等,并實現(xian)了 20% 的(de)(de)成本節約。原(yuan) SAP 系(xi)統存在延遲問題(ti),需容(rong)災,造成資源占(zhan)用(yong)(yong)(yong)。亞馬遜云科技為其設計了新(xin)一(yi)代 SAP 架構,應用(yong)(yong)(yong)和數據庫在同(tong)一(yi)可用(yong)(yong)(yong)區(qu),延遲極低至 0.1 毫秒以內;容(rong)災方面,RPO 為 0,RTO 不超 15 分(fen)鐘,資源成本下降 18.7%。這套(tao)全新(xin)的(de)(de) SAP 架構讓中集(ji)集(ji)團(tuan)獲(huo)得(de)了更強大的(de)(de)風險控(kong)制能力,業務連續性得(de)到保證。
關于第(di)三個要(yao)(yao)求(qiu)“提供(gong)(gong)安(an)全(quan)可靠的全(quan)球基(ji)礎設施”,亞(ya)馬(ma)遜(xun)云(yun)科技幾乎滿足(zu)全(quan)球所有國家和地(di)區的合法合規的要(yao)(yao)求(qiu)。比如(ru)生(sheng)物醫療、聯邦認證以(yi)及金融(rong)等行業,又比如(ru) HIPAA、FedRAMP 和 PCI 這樣高(gao)標準的合規要(yao)(yao)求(qiu)。拿全(quan)球電子支(zhi)付(fu)終端領先(xian)供(gong)(gong)應(ying)商(shang) PAX 百富(fu)來舉例,其在遷移(yi)多(duo)個重要(yao)(yao) SaaS 應(ying)用(yong)至云(yun)上(shang)時,發(fa)現(xian)多(duo)供(gong)(gong)應(ying)商(shang)的安(an)全(quan)服務(wu)標準不統一(yi),無法滿足(zu)支(zhi)付(fu)安(an)全(quan)要(yao)(yao)求(qiu),且難以(yi)集成(cheng)和管(guan)理。亞(ya)馬(ma)遜(xun)云(yun)科技便為(wei)其提供(gong)(gong)了安(an)全(quan)合規服務(wu)(如(ru) Amazon CloudHSM、Security Hub)以(yi)幫(bang)其保障用(yong)戶支(zhi)付(fu)信息安(an)全(quan)和業務(wu)安(an)全(quan),滿足(zu) PCI 合規要(yao)(yao)求(qiu),并支(zhi)持國際業務(wu)拓展。使用(yong)亞(ya)馬(ma)遜(xun)云(yun)科技的產品(pin)使百富(fu)的產品(pin)交(jiao)付(fu)周期縮短 40%,降低架(jia)構搭建及運維(wei)壓力,節省(sheng) 20% 成(cheng)本。
陳(chen)曉建提到的(de)以上三個方面(mian),對企業用云需求進(jin)行了完整概(gai)括,而這也(ye)是云廠商(shang)(shang)幫助企業降低用云門檻、實現云基(ji)礎架構(gou)創新的(de)重要(yao)(yao)發展方向(xiang)。云廠商(shang)(shang)需要(yao)(yao)從區域覆蓋(gai)、安全和(he)技(ji)術成本等(deng)方面(mian)進(jin)行全維度(du)的(de)升級,提供更好的(de)云計算產品(pin)和(he)服務,來(lai)滿足企業的(de)“既要(yao)(yao)、又要(yao)(yao)”。
四、云廠商需要專注“創新”,擺脫基礎架構束縛
目前(qian)企業愈加難以滿(man)足日(ri)益(yi)增(zeng)長的(de)(de)客戶對快速、可靠和安全服務的(de)(de)期望,在(zai)提高自身系統(tong)的(de)(de)處理能(neng)力(li)和存(cun)儲能(neng)力(li)的(de)(de)過(guo)程(cheng)中,面對著巨大的(de)(de)算(suan)力(li)需求和成本過(guo)高的(de)(de)可伸縮且安全的(de)(de) IT 基礎架構。
云計(ji)算基礎設施的穩定和(he)可靠(kao),是(shi)云廠商的核心競爭(zheng)力。然(ran)而,云計(ji)算作(zuo)為數字產業的新(xin)基建,面臨(lin)著行業高速增長的機遇,同時也在(zai)諸多領域(yu)存在(zai)著挑戰,比(bi)如(ru) AI 就是(shi)一次(ci)巨大的浪潮,在(zai)全球范圍內(nei)都帶來了(le)巨大的市(shi)場(chang)機遇和(he)發(fa)展潛力,但目前云基礎架(jia)構還面臨(lin)著把數據(ju)留(liu)在(zai)本地、延遲和(he)帶寬問(wen)題和(he)連接穩健性等問(wen)題。
如(ru)果(guo)上(shang)升到云(yun)(yun)計算(suan)整個(ge)領域(yu)的(de)(de)(de)(de)發展的(de)(de)(de)(de)探討,站(zhan)在終端用戶角(jiao)度(du)去看,在使(shi)用產品的(de)(de)(de)(de)過程中(zhong),用戶實際(ji)更關(guan)(guan)注的(de)(de)(de)(de)是(shi)(shi)使(shi)用體驗,當前基礎(chu)設施要(yao)滿(man)足(zu)用戶順暢的(de)(de)(de)(de)體驗需(xu)求(qiu),即算(suan)力噴發下產生的(de)(de)(de)(de)需(xu)求(qiu),需(xu)要(yao)在數據(ju)存儲、數據(ju)節點通信及(ji)指令調(diao)度(du)等層面進(jin)行一定(ding)的(de)(de)(de)(de)創新(xin)(xin);站(zhan)在企業開發者(zhe)的(de)(de)(de)(de)角(jiao)度(du)去看,高效(xiao)開發、低成(cheng)本運維(wei)(wei)是(shi)(shi)開發者(zhe)最關(guan)(guan)注的(de)(de)(de)(de)問題,在云(yun)(yun)基礎(chu)架構體系(xi)中(zhong),工(gong)(gong)具鏈的(de)(de)(de)(de)使(shi)用、性能調(diao)優方式、性能工(gong)(gong)具的(de)(de)(de)(de)創新(xin)(xin)是(shi)(shi)未來主(zhu)要(yao)發展點。此(ci)外服(fu)務的(de)(de)(de)(de)部署、管理、跟蹤(zong)、調(diao)試等各個(ge)環(huan)節管理和(he)運維(wei)(wei)工(gong)(gong)具的(de)(de)(de)(de)創新(xin)(xin),以及(ji)企業如(ru)何降低運營成(cheng)本也云(yun)(yun)計算(suan)廠商持續研究并創新(xin)(xin)的(de)(de)(de)(de)課題。
所以,未來只有軟硬一體的生態化發展,才能幫助行業更好地完善基礎設施,從而為企業數字化轉型、降本增效的大目標實現保駕護航,而這一點亞馬遜云科技做到了。亞馬遜云科技的網絡安全芯片 Nitro 系列、服務器芯片 Graviton 系列、人工智能(AI)推(tui)理(li)芯片 Inferentia、AI 訓練芯片 Trainium 系(xi)列的(de)(de)四大(da)自研芯片業(ye)務(wu)線,從高(gao)性(xing)(xing)能計(ji)算、至(zhi)廣至(zhi)深的(de)(de)云計(ji)算實例選擇(ze)、存儲、網絡(luo)安全、可(ke)靠(kao)等方面都顯示出了(le)絕對(dui)的(de)(de)性(xing)(xing)價(jia)比及絕對(dui)優(you)秀的(de)(de)能力(li)。
同(tong)時,我(wo)們從(cong)亞(ya)馬遜云科技(ji)(ji)的(de)(de)(de)(de)每一個實例與案例中也可(ke)以看(kan)到,亞(ya)馬遜云科技(ji)(ji)這(zhe)些年來從(cong)技(ji)(ji)術(shu)上做的(de)(de)(de)(de)創(chuang)新與幫助全球范圍內(nei)的(de)(de)(de)(de)客戶完成技(ji)(ji)術(shu)創(chuang)新,為(wei)的(de)(de)(de)(de)就是突破當下云基礎架構的(de)(de)(de)(de)“束縛”,不(bu)斷(duan)探索新的(de)(de)(de)(de)云計(ji)算技(ji)(ji)術(shu)和(he)應用模式,實現業(ye)務創(chuang)新和(he)發(fa)展,這(zhe)為(wei)行業(ye)內(nei)的(de)(de)(de)(de)其(qi)他(ta)廠商(shang)起(qi)到了“帶頭羊”作用。希(xi)望亞(ya)馬遜云科技(ji)(ji)在未(wei)來可(ke)以與全球更多企業(ye)共(gong)同(tong)推動(dong)(dong)云計(ji)算的(de)(de)(de)(de)發(fa)展,為(wei)行業(ye)發(fa)展不(bu)斷(duan)注入新動(dong)(dong)力。