亞馬(ma)遜云科技宣布與Hugging Face進(jin)一(yi)步合作,以加(jia)速對大(da)語言模型和視覺模型的(de)訓(xun)練、精調和部(bu)署(shu),促(cu)進(jin)生成(cheng)式AI應用的(de)創(chuang)建。生成(cheng)式AI應用可以執行各種任務,包括文(wen)(wen)本摘要、問題回答、代碼(ma)生成(cheng)、圖(tu)像創(chuang)建以及撰(zhuan)寫論文(wen)(wen)和文(wen)(wen)章。
亞馬遜云科技在生成式AI創新方面擁有深厚歷史。例如,亞馬遜使用AI技術為Amazon Alexa用戶提供對話體驗,每周用戶互動次數達到數十億次,同時也越來越多地使用生成式AI來支持新體驗,如“Create with Alexa”功能。此外,作為亞馬遜搜索(Amazon Search)的一個小組,M5可以幫助亞馬遜各地團隊將大模型應用到他們的應用程序中,并訓練大模型以提升Amazon.com網站的搜索結果。亞馬遜云科技持續在機器學習(ML)的所有領域中創新,包括基礎設施、Amazon SageMaker相關工具和開箱即用的AI服務,比如Amazon CodeWhisperer,它嵌入到程序員使用的IDE中,通過注釋來生成建議代碼,以提高開發人員的生產力。為加速機器視覺與大語言模型的訓練和推理,亞馬遜云科技還推出了自研訓練芯片 Amazon Trainium與(yu)推理(li)芯(xin)片Amazon Inferentia。
Hugging Face之所以選擇亞馬(ma)遜云科技作為(wei)首選云供應(ying)商,是因為(wei)它(ta)提供了靈活、可選的全(quan)球領先(xian)性能工具,例如(ru)Amazon SageMaker、Amazon Trainium和Amazon Inferentia,滿(man)足了Hugging Face模型訓練、精調和部署(shu)需求。依賴于此,開(kai)發人員使用(yong)Hugging Face可以輕(qing)松優化性能并降低(di)成本,從而更(geng)快地將(jiang)生(sheng)成式(shi)AI應(ying)用(yong)投入到生(sheng)產環境。
“AI的(de)未來已經到來,但并(bing)非每個人(ren)都能(neng)平等(deng)享(xiang)用AI。”Hugging Face首席執行官(guan)Clement Delangue表(biao)示,“可(ke)訪問性(xing)和透明性(xing)是以明智和負責任的(de)方式使用這些(xie)新(xin)功能(neng),從而共享(xiang)成(cheng)果(guo)和創造新(xin)工具的(de)關鍵。Amazon SageMaker和亞馬遜云科技定制芯片會幫助我們(men)的(de)團(tuan)隊(dui)和更大的(de)機器(qi)學習社(she)區,將最新(xin)研究(jiu)成(cheng)果(guo)轉(zhuan)化為人(ren)人(ren)都可(ke)構建的(de)、公開的(de)可(ke)復制模型。”
高性能且兼具成本效益的生成式AI
大語言模型(xing)和(he)視覺模型(xing)的(de)構建(jian)、訓練和(he)部署是一個昂貴且耗時的(de)過程(cheng),需要深厚的(de)機器(qi)學習專業(ye)知識(shi)的(de)支持(chi)。這兩類模型(xing)非常(chang)復雜,可能包含數千(qian)億個參數,因(yin)此(ci)在很大程(cheng)度上,許多開(kai)發人員無法使用生成(cheng)式AI。
為了(le)彌補這一(yi)差(cha)距,Hugging Face與(yu)亞(ya)馬(ma)遜(xun)云(yun)科技(ji)建立合作,讓(rang)開發人員更(geng)易通(tong)過(guo)訪(fang)問亞(ya)馬(ma)遜(xun)云(yun)科技(ji)的(de)服務,來應用(yong)(yong)部署Hugging Face模(mo)型(xing),尤其是(shi)那些生成(cheng)式AI模(mo)型(xing)。這樣做的(de)好(hao)處是(shi):可(ke)(ke)以更(geng)快(kuai)地訓練(lian)與(yu)擴(kuo)展低(di)延(yan)遲和(he)(he)(he)高通(tong)量的(de)推理(li)任務。例(li)(li)(li)如,由Amazon Trainium支持的(de)Amazon Elastic Compute Cloud (Amazon EC2) Trn1實例(li)(li)(li)提供了(le)更(geng)快(kuai)的(de)訓練(lian)時間,與(yu)基于GPU的(de)實例(li)(li)(li)相(xiang)(xiang)比(bi),可(ke)(ke)節省(sheng)高達50%的(de)訓練(lian)成(cheng)本。而(er)由最新一(yi)代(dai)Amazon Inferentia芯片支持的(de)Amazon EC2 Inf2實例(li)(li)(li),旨在(zai)部署最新一(yi)代(dai)大語言模(mo)型(xing)和(he)(he)(he)視(shi)覺模(mo)型(xing)。相(xiang)(xiang)比(bi)Inf1實例(li)(li)(li),Inf2 實例(li)(li)(li)吞(tun)吐量提升了(le)4倍,延(yan)遲降低(di)了(le)10倍。Amazon SageMaker為ML提供工(gong)具(ju)和(he)(he)(he)工(gong)作流,開發人員可(ke)(ke)以通(tong)過(guo)Amazon SageMaker等托管服務使用(yong)(yong)Amazon Trainium和(he)(he)(he)Amazon Inferentia,亦或在(zai)Amazon EC2上自行管理(li)。
“生(sheng)成(cheng)式AI蘊藏(zang)著改變整個行(xing)業的巨大潛力,但其(qi)成(cheng)本和所(suo)需的專(zhuan)業知識使該技術無法為(wei)除少數(shu)公司(si)之(zhi)外的所(suo)有公司(si)所(suo)用(yong)。”亞(ya)馬遜(xun)云科技首席執行(xing)官Adam Selipsky表示(shi),“Hugging Face和亞(ya)馬遜(xun)云科技讓(rang)用(yong)戶更易訪問流行(xing)的機器學習(xi)模型,以(yi)最高(gao)的性能和最低(di)的成(cheng)本創(chuang)建自己的生(sheng)成(cheng)式AI應用(yong)。此次合作(zuo)充(chong)分說明,生(sheng)成(cheng)式AI公司(si)和亞(ya)馬遜(xun)云科技的合作(zuo)可以(yi)讓(rang)更多客戶對創(chuang)新技術觸(chu)手可及。”
即刻開始使用
客戶可以通過(guo)三種方式在亞(ya)馬遜云(yun)科(ke)技(ji)平臺(tai)上調(diao)用Hugging Face模(mo)型,如使(shi)用SageMaker JumpStart、Hugging Face亞(ya)馬遜云(yun)科(ke)技(ji)深(shen)度學習(xi)容(rong)器(qi)( DLC),或者根據(ju)教程(cheng)將已(yi)有(you)模(mo)型部(bu)署到Amazon Trainium或Amazon Inferentia。Hugging Face DLC包含了優化的(de)transformer、數(shu)據(ju)集和標記器(qi)庫,使(shi)用戶將大規模(mo)地精調(diao)和部(bu)署生成式AI應用程(cheng)序的(de)時間從幾周縮短到幾小時,并且(qie)只需極(ji)少的(de)代碼更改。SageMaker JumpStart和Hugging Face DLC在提(ti)供Amazon SageMaker服(fu)務(wu)的(de)所(suo)有(you)區域上均可使(shi)用,無需額外費用。