采用機器(qi)(qi)學(xue)習(xi)的(de)(de)(de)(de)新范式(shi)賦能業務不(bu)斷探索(suo)已經播種了(le)幾十(shi)年。但隨著足夠的(de)(de)(de)(de)可伸縮算力的(de)(de)(de)(de)就位、海(hai)量數(shu)據的(de)(de)(de)(de)爆炸,以及機器(qi)(qi)學(xue)習(xi)技術的(de)(de)(de)(de)快速進步,各(ge)行各(ge)業的(de)(de)(de)(de)客戶開(kai)始對業務進行重塑。最(zui)近(jin),像(xiang)ChatGPT這(zhe)樣的(de)(de)(de)(de)生(sheng)成式(shi)AI應(ying)用引起了(le)廣泛的(de)(de)(de)(de)關注(zhu),引發了(le)諸多想(xiang)象。我(wo)們正處在一個(ge)令(ling)人激動的(de)(de)(de)(de)機器(qi)(qi)學(xue)習(xi)被大(da)規模采用的(de)(de)(de)(de)轉(zhuan)折點上,我(wo)們也相(xiang)信生(sheng)成式(shi)AI將會(hui)重塑大(da)量客戶體驗和應(ying)用程序。
20多年來,人工智能和機器學習一直是亞馬遜關注的焦點。亞馬遜提供給客戶的很多功能都是由機器學習驅動的,例如我們的電商推薦引擎、運營中心撿貨機器人的路徑選擇,以及我們的供應鏈、預測和產能規劃。Prime Air(亞馬遜無人機)和Amazon Go(亞馬遜線下無人零售實體店,消費者可以自選商品后直接離開,無需現場排隊付款結算)中的計算機視覺技術都使用了深度學習。Alexa每周回應客戶數十億次關于管理智能家居、購物、獲取信息(xi)和娛樂的請(qing)求(qiu),這也(ye)得益于(yu)來自 30 多(duo)種不(bu)同的機(ji)器學習系統的支(zhi)持。亞馬遜有數千(qian)名工程師專注(zhu)于(yu)機(ji)器學習研(yan)究,這既是我(wo)們的寶貴(gui)資產,也(ye)是我(wo)們現(xian)在(zai)最(zui)關注(zhu)的理念,和面(mian)向未來的實力(li)之所在(zai)。
在(zai)亞馬遜(xun)云科技(ji)(ji),我(wo)(wo)(wo)們(men)(men)致力(li)于(yu)不(bu)(bu)斷(duan)降(jiang)低機(ji)(ji)(ji)器(qi)(qi)(qi)學(xue)(xue)習(xi)的(de)(de)(de)(de)(de)使用(yong)(yong)門(men)檻(jian)。我(wo)(wo)(wo)們(men)(men)已經幫助超過(guo)10萬家來自(zi)各行(xing)(xing)各業的(de)(de)(de)(de)(de)不(bu)(bu)同(tong)規模(mo)的(de)(de)(de)(de)(de)客(ke)(ke)戶(hu)使用(yong)(yong)機(ji)(ji)(ji)器(qi)(qi)(qi)學(xue)(xue)習(xi)進(jin)行(xing)(xing)創(chuang)新(xin)。我(wo)(wo)(wo)們(men)(men)在(zai)人工智能(neng)(neng)和(he)(he)(he)(he)機(ji)(ji)(ji)器(qi)(qi)(qi)學(xue)(xue)習(xi)堆棧(zhan)的(de)(de)(de)(de)(de)三個層(ceng)級都(dou)擁有至(zhi)深(shen)至(zhi)廣的(de)(de)(de)(de)(de)產品組合。長期(qi)以(yi)(yi)來,我(wo)(wo)(wo)們(men)(men)不(bu)(bu)斷(duan)投入、持(chi)續(xu)創(chuang)新(xin),為(wei)機(ji)(ji)(ji)器(qi)(qi)(qi)學(xue)(xue)習(xi)提(ti)供高性能(neng)(neng)、可伸縮的(de)(de)(de)(de)(de)基(ji)礎(chu)設(she)施,和(he)(he)(he)(he)極具性價比的(de)(de)(de)(de)(de)機(ji)(ji)(ji)器(qi)(qi)(qi)學(xue)(xue)習(xi)訓(xun)練和(he)(he)(he)(he)推(tui)(tui)理(li);我(wo)(wo)(wo)們(men)(men)研(yan)發(fa)了Amazon SageMaker,為(wei)所有開(kai)發(fa)人員構建、訓(xun)練和(he)(he)(he)(he)部署(shu)模(mo)型提(ti)供最大(da)的(de)(de)(de)(de)(de)便利(li);我(wo)(wo)(wo)們(men)(men)還推(tui)(tui)出了大(da)量服務(wu),使客(ke)(ke)戶(hu)通過(guo)簡單的(de)(de)(de)(de)(de)API調用(yong)(yong)就可添加AI功(gong)能(neng)(neng)到應用(yong)(yong)程序中,如(ru)圖像識別、預測和(he)(he)(he)(he)智能(neng)(neng)搜索。得益于(yu)此,Intuit、湯森路透、阿斯利(li)康、法拉利(li)、德甲聯(lian)賽、3M和(he)(he)(he)(he)寶(bao)馬等客(ke)(ke)戶(hu),以(yi)(yi)及全球數(shu)(shu)(shu)千家初創(chuang)企業和(he)(he)(he)(he)政府機(ji)(ji)(ji)構正在(zai)通過(guo)機(ji)(ji)(ji)器(qi)(qi)(qi)學(xue)(xue)習(xi)進(jin)行(xing)(xing)數(shu)(shu)(shu)字化轉型,帶動產業升級,重新(xin)定(ding)義機(ji)(ji)(ji)器(qi)(qi)(qi)學(xue)(xue)習(xi)的(de)(de)(de)(de)(de)使命(ming)。我(wo)(wo)(wo)們(men)(men)同(tong)樣致力(li)于(yu)推(tui)(tui)動生成(cheng)式(shi)AI技(ji)(ji)術的(de)(de)(de)(de)(de)普惠(hui)化:我(wo)(wo)(wo)們(men)(men)將這(zhe)些技(ji)(ji)術從(cong)研(yan)究和(he)(he)(he)(he)實(shi)驗(yan)領域釋放出來,不(bu)(bu)只是(shi)少(shao)數(shu)(shu)(shu)初創(chuang)公(gong)司和(he)(he)(he)(he)資金(jin)雄(xiong)厚的(de)(de)(de)(de)(de)大(da)型科技(ji)(ji)公(gong)司,而是(shi)讓更(geng)多(duo)公(gong)司都(dou)能(neng)(neng)從(cong)中受益。因此,我(wo)(wo)(wo)今天非常興奮宣布數(shu)(shu)(shu)項(xiang)創(chuang)新(xin),幫助我(wo)(wo)(wo)們(men)(men)的(de)(de)(de)(de)(de)客(ke)(ke)戶(hu)更(geng)簡單、更(geng)容易地(di)在(zai)業務(wu)中使用(yong)(yong)生成(cheng)式(shi)AI。
生成式AI和基礎模型
生成(cheng)(cheng)式AI是人工(gong)智(zhi)能的(de)(de)(de)(de)一(yi)(yi)種,能夠創造新(xin)內容和(he)想法,包(bao)括對話(hua)(hua)、故(gu)事、圖(tu)像、視頻和(he)音(yin)樂。與(yu)所(suo)有人工(gong)智(zhi)能技術(shu)一(yi)(yi)樣,生成(cheng)(cheng)式AI的(de)(de)(de)(de)能力(li)由機器(qi)(qi)學習模(mo)(mo)(mo)型(xing)提(ti)供。這(zhe)(zhe)些模(mo)(mo)(mo)型(xing)是基于(yu)(yu)大(da)量數(shu)(shu)據進行預(yu)(yu)先訓練(lian)的(de)(de)(de)(de)大(da)模(mo)(mo)(mo)型(xing),通常(chang)被稱(cheng)為基礎模(mo)(mo)(mo)型(xing)(Foundation Models)。機器(qi)(qi)學習的(de)(de)(de)(de)最新(xin)進展(zhan)(特(te)(te)別是基于(yu)(yu)transformer的(de)(de)(de)(de)神經網(wang)絡架構的(de)(de)(de)(de)發(fa)明(ming))直(zhi)接(jie)帶來這(zhe)(zhe)一(yi)(yi)類模(mo)(mo)(mo)型(xing)的(de)(de)(de)(de)爆發(fa)式增(zeng)長,這(zhe)(zhe)類模(mo)(mo)(mo)型(xing)通常(chang)包(bao)含數(shu)(shu)十億(yi)(yi)個(ge)參(can)數(shu)(shu)或變量。2019年最大(da)的(de)(de)(de)(de)預(yu)(yu)訓練(lian)模(mo)(mo)(mo)型(xing)是3.3億(yi)(yi)個(ge)參(can)數(shu)(shu)。現在,最大(da)的(de)(de)(de)(de)模(mo)(mo)(mo)型(xing)包(bao)含的(de)(de)(de)(de)參(can)數(shu)(shu)超過(guo)5千億(yi)(yi)個(ge),相當于(yu)(yu)幾年間增(zeng)加了(le)1600倍。如(ru)今的(de)(de)(de)(de)基礎模(mo)(mo)(mo)型(xing),例(li)如(ru)大(da)型(xing)語言模(mo)(mo)(mo)型(xing)GPT3.5或BLOOM,以及(ji)由Stability AI開發(fa)的(de)(de)(de)(de)文(wen)生圖(tu)模(mo)(mo)(mo)型(xing)Stable Diffusion,可(ke)以執(zhi)行跨(kua)多個(ge)領(ling)域的(de)(de)(de)(de)多種任(ren)(ren)務(wu)(wu),例(li)如(ru)撰寫博客(ke)文(wen)章、生成(cheng)(cheng)圖(tu)像、解決算(suan)術(shu)問題、對話(hua)(hua)聊天,基于(yu)(yu)文(wen)檔回答問題等。基礎模(mo)(mo)(mo)型(xing)的(de)(de)(de)(de)規模(mo)(mo)(mo)和(he)面(mian)向通用場景的(de)(de)(de)(de)性質使(shi)其不同于(yu)(yu)傳統的(de)(de)(de)(de)機器(qi)(qi)學習模(mo)(mo)(mo)型(xing),后者通常(chang)僅執(zhi)行特(te)(te)定的(de)(de)(de)(de)任(ren)(ren)務(wu)(wu),例(li)如(ru)分析文(wen)本觀點、分類圖(tu)像和(he)預(yu)(yu)測(ce)趨勢等。
基(ji)礎模(mo)(mo)(mo)型(xing)包含大(da)量(liang)參數(shu),能夠學習(xi)復雜的(de)概念(nian),因此(ci)可(ke)以(yi)執行更多任務。通過(guo)基(ji)于(yu)(yu)互聯網規模(mo)(mo)(mo)的(de)、各種形式和(he)模(mo)(mo)(mo)態的(de)海量(liang)數(shu)據(ju)(ju)(ju)進行預先訓(xun)(xun)練,基(ji)礎模(mo)(mo)(mo)型(xing)學會(hui)在各種語境中應用所習(xi)得的(de)知識。盡管預訓(xun)(xun)練基(ji)礎模(mo)(mo)(mo)型(xing)所帶來(lai)的(de)功能和(he)可(ke)能性已(yi)足夠令人(ren)驚嘆(tan),而真(zhen)正讓(rang)客戶(hu)為此(ci)興奮(fen)不已(yi)的(de)是,這(zhe)些通用模(mo)(mo)(mo)型(xing)也可(ke)以(yi)被定制化(hua)加工,執行專屬于(yu)(yu)其(qi)業(ye)(ye)務領域的(de)特定功能,幫助業(ye)(ye)務建立差(cha)異化(hua)競爭優勢,與從零(ling)開始訓(xun)(xun)練模(mo)(mo)(mo)型(xing)相比,僅需使用一小部(bu)分數(shu)據(ju)(ju)(ju)和(he)計算資源(yuan)。定制化(hua)的(de)基(ji)礎模(mo)(mo)(mo)型(xing)可(ke)以(yi)帶來(lai)獨有的(de)顧(gu)客體驗,體現公司(si)的(de)觀點(dian)、風格和(he)服務,適用于(yu)(yu)眾多消費者行業(ye)(ye),如(ru)(ru)金融銀行、旅(lv)行和(he)醫療等。例如(ru)(ru),一家金融公司(si)如(ru)(ru)果(guo)需要使用所有相關交(jiao)易自動生(sheng)成活動日報以(yi)供內部(bu)流通,它(ta)可(ke)以(yi)使用包括(kuo)既往(wang)報告在內的(de)專有數(shu)據(ju)(ju)(ju)來(lai)定制模(mo)(mo)(mo)型(xing),以(yi)便基(ji)礎模(mo)(mo)(mo)型(xing)了解如(ru)(ru)何閱讀報告和(he)使用哪(na)些數(shu)據(ju)(ju)(ju)來(lai)生(sheng)成日報。
基(ji)礎(chu)模型擁有(you)巨大的(de)潛(qian)力,但(dan)我(wo)們仍處在(zai)初級階段。ChatGPT率(lv)先吸引了(le)客(ke)戶對生(sheng)成(cheng)式AI的(de)關注。對生(sheng)成(cheng)式AI展(zhan)開(kai)研究的(de)人(ren)很快(kuai)意(yi)識(shi)到,多(duo)家公司已經(jing)在(zai)基(ji)礎(chu)模型上耕耘多(duo)年(nian),可(ke)用(yong)(yong)的(de)基(ji)礎(chu)模型也有(you)很多(duo),且(qie)各有(you)各的(de)優(you)勢和(he)特點(dian)。在(zai)過(guo)去的(de)數(shu)年(nian)間,我(wo)們都親歷了(le)技術的(de)快(kuai)速發展(zhan),機器學習的(de)演進也是(shi)日新(xin)月異。我(wo)們期待未(wei)來會(hui)涌現(xian)全新(xin)的(de)體系(xi)和(he)架構(gou),而基(ji)礎(chu)模型的(de)多(duo)樣化會(hui)推動(dong)新(xin)一波的(de)創新(xin)浪潮。此前聞(wen)所未(wei)聞(wen)的(de)新(xin)應用(yong)(yong)體驗在(zai)今天已經(jing)成(cheng)為現(xian)實。很多(duo)客(ke)戶都在(zai)詢問我(wo)們,如何(he)快(kuai)速利用(yong)(yong)當今以及未(wei)來可(ke)能(neng)出現(xian)的(de)技術,如何(he)快(kuai)速使用(yong)(yong)基(ji)礎(chu)模型和(he)生(sheng)成(cheng)式AI立(li)刻為公司業(ye)務大幅提升生(sheng)產效率(lv)和(he)變革產品與服務。
推出Amazon Bedrock和Amazon Titan模型:借助基礎模型構建和擴展生成式AI應用程序的最簡單途徑
客(ke)戶(hu)向我(wo)們(men)(men)講述(shu)了他們(men)(men)現在的(de)(de)主要(yao)需(xu)求。首先,他們(men)(men)需(xu)要(yao)能(neng)(neng)直接找到并訪問高(gao)性(xing)能(neng)(neng)基(ji)(ji)礎模型(xing),這(zhe)些模型(xing)需(xu)要(yao)能(neng)(neng)夠(gou)給出最匹(pi)配(pei)業務場景(jing)的(de)(de)優秀反饋結果。其次(ci),客(ke)戶(hu)希(xi)(xi)望(wang)(wang)無縫與(yu)應(ying)(ying)用程(cheng)(cheng)序集(ji)成(cheng),且無需(xu)管理(li)大量基(ji)(ji)礎設(she)施(shi)集(ji)群,也不會(hui)增加過(guo)高(gao)的(de)(de)成(cheng)本。最后,客(ke)戶(hu)希(xi)(xi)望(wang)(wang)能(neng)(neng)夠(gou)輕松上手,基(ji)(ji)于基(ji)(ji)礎模型(xing),利用自己的(de)(de)數據(可(ke)(ke)多可(ke)(ke)少(shao))構建差異化(hua)的(de)(de)應(ying)(ying)用程(cheng)(cheng)序。由于客(ke)戶(hu)進行定(ding)制(zhi)化(hua)的(de)(de)數據是非常有價值(zhi)的(de)(de) IP,因此需(xu)要(yao)在處理(li)過(guo)程(cheng)(cheng)中確保數據安(an)全(quan)和隱私保護。同時,客(ke)戶(hu)還希(xi)(xi)望(wang)(wang)能(neng)(neng)控(kong)制(zhi)數據共享和使(shi)用。
聽(ting)取了(le)客(ke)戶(hu)(hu)的(de)(de)(de)(de)所有反饋,今天(tian)我們(men)很高興宣布推(tui)出Amazon Bedrock。這項新服務(wu)允許(xu)用(yong)(yong)戶(hu)(hu)通(tong)過API訪(fang)(fang)問來自AI21 Labs、Anthropic、Stability AI和亞馬(ma)遜的(de)(de)(de)(de)基(ji)(ji)(ji)(ji)礎(chu)(chu)(chu)(chu)模型(xing)(xing)。Bedrock是客(ke)戶(hu)(hu)使用(yong)(yong)基(ji)(ji)(ji)(ji)礎(chu)(chu)(chu)(chu)模型(xing)(xing)構建和擴展(zhan)生(sheng)成(cheng)式AI應用(yong)(yong)程序(xu)的(de)(de)(de)(de)最簡單方(fang)法,為(wei)所有開發者降低(di)使用(yong)(yong)門檻。在Bedrock上,用(yong)(yong)戶(hu)(hu)可(ke)以(yi)通(tong)過可(ke)擴展(zhan)、可(ke)靠且安(an)全的(de)(de)(de)(de)亞馬(ma)遜云科(ke)技托管服務(wu),訪(fang)(fang)問從文本(ben)到圖像的(de)(de)(de)(de)一系列強大(da)的(de)(de)(de)(de)基(ji)(ji)(ji)(ji)礎(chu)(chu)(chu)(chu)模型(xing)(xing),以(yi)及我們(men)今天(tian)發布的(de)(de)(de)(de)Amazon Titan基(ji)(ji)(ji)(ji)礎(chu)(chu)(chu)(chu)模型(xing)(xing)。Amazon Titan基(ji)(ji)(ji)(ji)礎(chu)(chu)(chu)(chu)模型(xing)(xing)目前(qian)(qian)包(bao)括(kuo)了(le)兩個全新的(de)(de)(de)(de)大(da)語(yu)言(yan)模型(xing)(xing)。憑(ping)借Bedrock所帶(dai)來的(de)(de)(de)(de)無(wu)服務(wu)器體(ti)驗,客(ke)戶(hu)(hu)可(ke)以(yi)輕(qing)松找到適合自身業務(wu)的(de)(de)(de)(de)模型(xing)(xing),快速上手,在確保數據安(an)全和隱私保護的(de)(de)(de)(de)前(qian)(qian)提下,使用(yong)(yong)自有數據基(ji)(ji)(ji)(ji)于基(ji)(ji)(ji)(ji)礎(chu)(chu)(chu)(chu)模型(xing)(xing)進行(xing)定(ding)制,并使用(yong)(yong)他們(men)已經熟(shu)悉的(de)(de)(de)(de)亞馬(ma)遜云科(ke)技工具和能(neng)力,將定(ding)制化模型(xing)(xing)集成(cheng)并部署到他們(men)的(de)(de)(de)(de)應用(yong)(yong)程序(xu)中,同(tong)時(shi)無(wu)需管理(li)(li)任(ren)何基(ji)(ji)(ji)(ji)礎(chu)(chu)(chu)(chu)設施。比如,客(ke)戶(hu)(hu)可(ke)以(yi)將基(ji)(ji)(ji)(ji)礎(chu)(chu)(chu)(chu)模型(xing)(xing)與Amazon SageMaker機器學習(xi)功能(neng)集成(cheng),使用(yong)(yong)Experiments測試不同(tong)模型(xing)(xing)和使用(yong)(yong)Pipelines大(da)規模管理(li)(li)基(ji)(ji)(ji)(ji)礎(chu)(chu)(chu)(chu)模型(xing)(xing)等。
客(ke)戶也可(ke)(ke)(ke)使(shi)用Bedrock訪(fang)問一些當前最領先(xian)的(de)(de)可(ke)(ke)(ke)用基(ji)礎模(mo)(mo)(mo)型。這(zhe)將包括AI21 Labs開發的(de)(de)Jurassic-2多(duo)語(yu)(yu)種(zhong)大(da)語(yu)(yu)言模(mo)(mo)(mo)型系列,能(neng)夠(gou)根據自(zi)然語(yu)(yu)言指令生成文(wen)(wen)本內(nei)容,目(mu)前支持西班牙語(yu)(yu)、法語(yu)(yu)、德語(yu)(yu)、葡萄牙語(yu)(yu)、意大(da)利語(yu)(yu)和(he)荷蘭語(yu)(yu)。還有Anthropic開發的(de)(de)大(da)語(yu)(yu)言模(mo)(mo)(mo)型Claude,它是基(ji)于Anthropic對于訓(xun)練誠實(shi)和(he)負(fu)責任的(de)(de)AI(responsible AI)系統的(de)(de)大(da)量研(yan)究,能(neng)夠(gou)執行多(duo)種(zhong)對話(hua)和(he)文(wen)(wen)本處理任務。客(ke)戶還可(ke)(ke)(ke)以通過Bedrock輕(qing)松訪(fang)問Stability AI開發的(de)(de)文(wen)(wen)生圖基(ji)礎模(mo)(mo)(mo)型Stable Diffusion,這(zhe)是文(wen)(wen)生圖領域目(mu)前最流行的(de)(de)模(mo)(mo)(mo)型,能(neng)夠(gou)生成獨(du)特、寫實(shi)、高清(qing)的(de)(de)圖像、藝術作品(pin)、商標和(he)其它設計圖。
Bedrock最(zui)重(zhong)要的(de)(de)(de)(de)能(neng)力之一(yi)是極其容(rong)易定制模(mo)型。客戶只需向(xiang)Bedrock展(zhan)示(shi)(shi)(shi)Amazon S3中的(de)(de)(de)(de)幾個標注(zhu)好的(de)(de)(de)(de)數據(ju)示(shi)(shi)(shi)例,Bedrock就可以(yi)(yi)針對特定任(ren)務(wu)微調模(mo)型,最(zui)少(shao)僅需20個示(shi)(shi)(shi)例即可,而無需標注(zhu)大量(liang)數據(ju)。假設(she)一(yi)位時裝(zhuang)零售(shou)行(xing)業的(de)(de)(de)(de)內(nei)容(rong)營銷(xiao)(xiao)經理(li),想為即將推出的(de)(de)(de)(de)手提包新(xin)品(pin)(pin)系列開發新(xin)的(de)(de)(de)(de)、針對目標用(yong)戶的(de)(de)(de)(de)廣告(gao)創(chuang)意。他(ta)向(xiang)Bedrock提供了(le)一(yi)些(xie)標注(zhu)過(guo)的(de)(de)(de)(de)表現(xian)最(zui)佳的(de)(de)(de)(de)既(ji)往營銷(xiao)(xiao)廣告(gao)示(shi)(shi)(shi)例,以(yi)(yi)及新(xin)品(pin)(pin)的(de)(de)(de)(de)相關描述,Bedrock將能(neng)自動為這些(xie)新(xin)品(pin)(pin)生成(cheng)有效的(de)(de)(de)(de)社交媒體推文(wen)內(nei)容(rong)、展(zhan)示(shi)(shi)(shi)廣告(gao)和(he)產品(pin)(pin)網頁。沒(mei)有任(ren)何客戶數據(ju)被(bei)用(yong)于訓練底(di)層模(mo)型。所有數據(ju)都進行(xing)了(le)加(jia)密,且不會離開客戶的(de)(de)(de)(de)虛擬私(si)有網絡(VPC),因此客戶完全(quan)(quan)可以(yi)(yi)確信獲得數據(ju)安全(quan)(quan)和(he)隱私(si)保護。
Bedrock目(mu)前提供有限預(yu)覽,Coda等客戶的(de)開發團(tuan)隊(dui)對使用Bedrock充滿期(qi)(qi)待。Coda的(de)聯合(he)創始人兼CEO Shishir Mehrotra表示:“作為亞馬(ma)遜云(yun)科技的(de)長期(qi)(qi)客戶,我(wo)(wo)們對Amazon Bedrock帶來的(de)高(gao)品質、可擴(kuo)展(zhan)性和(he)性能充滿期(qi)(qi)待。我(wo)(wo)們所有的(de)據已經(jing)存儲在亞馬(ma)遜云(yun)科技上,我(wo)(wo)們能夠利(li)用Bedrock快(kuai)速采用生成(cheng)式AI,并能充分(fen)保證我(wo)(wo)們數據的(de)安全(quan)和(he)隱私。目(mu)前,包括(kuo)Uber、紐約(yue)時報(bao)、Square在內(nei)的(de)成(cheng)千上萬(wan)個團(tuan)隊(dui)都在采用Coda,因此(ci),可靠性與可擴(kuo)展(zhan)性十(shi)分(fen)重要。”
一些客(ke)(ke)戶已經(jing)預覽了亞馬遜(xun)全(quan)新的(de)(de)Titan基(ji)礎模(mo)(mo)(mo)型,在未來幾個(ge)(ge)月內(nei)(nei),我們會進(jin)一步擴展(zhan)其可用(yong)范圍。我們將首先發(fa)布(bu)兩(liang)個(ge)(ge)Titan模(mo)(mo)(mo)型。第一個(ge)(ge)是針對(dui)(dui)總結(jie)、文(wen)(wen)本生(sheng)成(如(ru)原創(chuang)博客(ke)(ke))、分類、開放式(shi)問答和(he)信息提取等(deng)任務的(de)(de)生(sheng)成式(shi)大(da)語(yu)(yu)(yu)言(yan)模(mo)(mo)(mo)型。第二個(ge)(ge)是文(wen)(wen)本嵌入(ru)(ru)(embeddings)大(da)語(yu)(yu)(yu)言(yan)模(mo)(mo)(mo)型,能(neng)夠將文(wen)(wen)本輸(shu)入(ru)(ru)(字詞(ci)、短語(yu)(yu)(yu)甚至是大(da)篇幅文(wen)(wen)章)翻(fan)譯成包含語(yu)(yu)(yu)義的(de)(de)數字表(biao)達(即embeddings 嵌入(ru)(ru)編(bian)碼(ma))。雖然(ran)這種大(da)語(yu)(yu)(yu)言(yan)模(mo)(mo)(mo)型不生(sheng)成文(wen)(wen)本,但(dan)對(dui)(dui)個(ge)(ge)性化推薦和(he)搜索(suo)等(deng)應(ying)用(yong)程序(xu)卻(que)大(da)有(you)裨(bi)益,因(yin)為(wei)(wei)相(xiang)對(dui)(dui)于匹配文(wen)(wen)字,對(dui)(dui)比(bi)編(bian)碼(ma)可以(yi)幫助模(mo)(mo)(mo)型反饋更相(xiang)關、更符合情(qing)境的(de)(de)結(jie)果。實際(ji)上,Amazon.com的(de)(de)產品搜索(suo)能(neng)力就(jiu)是采用(yong)了類似的(de)(de)文(wen)(wen)本嵌入(ru)(ru)模(mo)(mo)(mo)型,能(neng)夠幫助客(ke)(ke)戶更好(hao)地查找所需的(de)(de)商品。為(wei)(wei)了持續(xu)推動(dong)使(shi)用(yong)負責任AI的(de)(de)最佳實踐,Titan基(ji)礎模(mo)(mo)(mo)型可以(yi)識別和(he)刪除客(ke)(ke)戶提交(jiao)給定制模(mo)(mo)(mo)型的(de)(de)數據中的(de)(de)有(you)害內(nei)(nei)容,拒絕用(yong)戶輸(shu)入(ru)(ru)不當內(nei)(nei)容,過(guo)濾模(mo)(mo)(mo)型中包含不當內(nei)(nei)容的(de)(de)輸(shu)出結(jie)果,如(ru)仇恨言(yan)論、臟話和(he)語(yu)(yu)(yu)言(yan)暴力。
任(ren)何規模的企業(ye)都可(ke)以通過Bedrock訪問(wen)基(ji)礎(chu)模型,加速機器學習在組(zu)織內部的應(ying)用(yong),并憑借其(qi)輕(qing)(qing)松上手(shou)的特性,構建自己(ji)的生成式AI應(ying)用(yong)程(cheng)序。我(wo)們相信,Bedrock將是基(ji)礎(chu)模型普惠(hui)化進(jin)程(cheng)中的一大步。埃森哲、德勤、Infosys和Slalom等合作伙伴都在構建最佳實踐,幫(bang)助(zhu)企業(ye)借助(zhu)生成式AI實現快速發(fa)展。C3AI和Pega等獨立軟(ruan)件開發(fa)商(ISV)對于利(li)用(yong)Bedrock輕(qing)(qing)松訪問(wen)大量(liang)基(ji)礎(chu)模型,兼(jian)具安全(quan)性、隱私性和可(ke)靠(kao)性充滿(man)期待。
宣布Amazon EC2 Trn1n和Amazon EC2 Inf2實例正式可用:最具成本效益的生成式AI云基礎設施
無論運行、構建還是定制基礎模型,客戶都需要高性能、低成本且為機器學習專門構建的基礎設施。過去五年,亞馬遜云科技持續加大在自研芯片方面(mian)的(de)(de)(de)投(tou)入,不斷突破(po)性能和價格的(de)(de)(de)極(ji)限,以支持對此有極(ji)高要求的(de)(de)(de)機器學(xue)習訓練與推理等(deng)工(gong)作(zuo)負載。亞馬(ma)遜云科技Trainium和Inferentia芯片可以提供在(zai)云上(shang)訓練模(mo)型和運行(xing)推理的(de)(de)(de)最低成本(ben)。正是因(yin)為我們在(zai)成本(ben)和性能方面(mian)的(de)(de)(de)優勢(shi),像(xiang) AI21 Labs、Anthropic、Cohere、Grammarly、Hugging Face、Runway、Stability AI 等(deng)領先(xian)的(de)(de)(de)AI初創公(gong)司都(dou)選擇運行(xing)在(zai)亞馬(ma)遜云科技上(shang)。
由Trainium支持的Trn1計(ji)(ji)算實(shi)例與(yu)其他任(ren)何EC2實(shi)例相比,都可(ke)(ke)(ke)以(yi)(yi)節省高達50%的訓(xun)練(lian)(lian)成本(ben),并(bing)經過優(you)化,可(ke)(ke)(ke)以(yi)(yi)在與(yu)高達800Gbps的第二代EFA(彈性結構適配器)網(wang)絡(luo)(luo)相連(lian)的多個服務(wu)器上分發訓(xun)練(lian)(lian)任(ren)務(wu)。客戶可(ke)(ke)(ke)以(yi)(yi)在超大規模集群(qun)(UltraClusters)中部署(shu)Trn1實(shi)例,數量可(ke)(ke)(ke)以(yi)(yi)擴展(zhan)(zhan)到(dao)在同一可(ke)(ke)(ke)用區中3萬個Trainium芯片(pian),相當于超過6 exaflops的計(ji)(ji)算能(neng)力,并(bing)具有PB級網(wang)絡(luo)(luo)。許多亞馬(ma)遜(xun)云(yun)科(ke)技客戶,包括Helixon、Money Forward和(he)亞馬(ma)遜(xun)的搜索團隊,都使用Trn1實(shi)例將(jiang)訓(xun)練(lian)(lian)最(zui)大規模的深度學習模型所需的時間(jian)從幾(ji)個月縮短到(dao)幾(ji)周甚至幾(ji)天,并(bing)且降低了成本(ben)。800 Gbps的帶(dai)寬(kuan)已(yi)經很(hen)大,但我們仍不(bu)斷(duan)創(chuang)新、拓展(zhan)(zhan)帶(dai)寬(kuan)。今天我們宣布全新的、網(wang)絡(luo)(luo)優(you)化型Trn1n實(shi)例正(zheng)式(shi)可(ke)(ke)(ke)用,它可(ke)(ke)(ke)以(yi)(yi)提供1600 Gbps的網(wang)絡(luo)(luo)帶(dai)寬(kuan),專為大型網(wang)絡(luo)(luo)密集型模型設計(ji)(ji),其性能(neng)比Trn1高出20%。
今天(tian),基礎模(mo)型(xing)花費的(de)時(shi)(shi)(shi)間和金錢主要用(yong)于訓練(lian),這是因為許多客(ke)戶(hu)才剛(gang)(gang)剛(gang)(gang)開始將基礎模(mo)型(xing)部署到生(sheng)(sheng)產中。但是,未來,當基礎模(mo)型(xing)進入大規模(mo)部署時(shi)(shi)(shi),大部分成(cheng)(cheng)本(ben)將用(yong)于運行模(mo)型(xing)和進行推理。客(ke)戶(hu)通常會定期訓練(lian)模(mo)型(xing),于是生(sheng)(sheng)產應用(yong)程序會不斷(duan)生(sheng)(sheng)成(cheng)(cheng)預測(稱(cheng)為推理)——每小時(shi)(shi)(shi)可能生(sheng)(sheng)成(cheng)(cheng)數百(bai)萬(wan)預測。而(er)且這些預測需要實(shi)時(shi)(shi)(shi)發生(sheng)(sheng),這就需要極低延(yan)遲和高吞吐量的(de)網絡。Alexa就是一個(ge)典(dian)型(xing)的(de)例子,它每分鐘(zhong)都會接受數百(bai)萬(wan)次請求,處(chu)理這些請求占所有計算成(cheng)(cheng)本(ben)的(de)40%。
我(wo)(wo)們相信,未來(lai)大部分機器學習成(cheng)本(ben)將(jiang)來(lai)自運行推理。因(yin)而,幾年之前,當(dang)我(wo)(wo)們開始研發新型芯片(pian)時(shi),就已經將(jiang)推理優化(hua)型芯片(pian)置于(yu)首(shou)位(wei)。2018年,我(wo)(wo)們發布了首(shou)款推理專用(yong)(yong)芯片(pian)Inferentia。每年,亞馬遜(xun)都運用(yong)(yong)Inferentia運行數萬(wan)億(yi)次推理,并(bing)節省數億(yi)美元成(cheng)本(ben)。這是十分顯著的(de)(de)成(cheng)果,繼續創新的(de)(de)空間依然巨大,因(yin)為(wei)隨(sui)著越(yue)來(lai)越(yue)多的(de)(de)客戶將(jiang)生成(cheng)式AI集成(cheng)到他們的(de)(de)應用(yong)(yong)程序中,工作負載的(de)(de)規模(mo)和復雜性只會越(yue)來(lai)越(yue)大。
因此,我們今天(tian)宣(xuan)布由Amazon Inferentia2提(ti)(ti)供支(zhi)持的(de)(de)Inf2實(shi)例(li)正式可用(yong)(yong),這些實(shi)例(li)專門針對(dui)運行數(shu)千億(yi)個參數(shu)模(mo)(mo)(mo)型的(de)(de)大規模(mo)(mo)(mo)生成式AI應(ying)用(yong)(yong)程序進行了(le)優(you)化。與上(shang)一代(dai)相(xiang)比(bi),Inf2實(shi)例(li)不僅吞(tun)吐量(liang)提(ti)(ti)高了(le)4倍(bei),延遲降低了(le)10倍(bei),還可實(shi)現加速器(qi)之間的(de)(de)超高速連接以支(zhi)持大規模(mo)(mo)(mo)分布式推(tui)理。與同類(lei)Amazon EC2實(shi)例(li)相(xiang)比(bi),這些能力將推(tui)理性(xing)價比(bi)提(ti)(ti)高了(le)40%,并把(ba)云中的(de)(de)推(tui)理成本(ben)降到(dao)最低。與同類(lei)Amazon EC2實(shi)例(li)相(xiang)比(bi),Runway等客戶有(you)望(wang)利用(yong)(yong)Inf2將部分模(mo)(mo)(mo)型的(de)(de)吞(tun)吐量(liang)提(ti)(ti)升至原來的(de)(de)兩倍(bei)。受益于(yu)高性(xing)能和低成本(ben)的(de)(de)推(tui)理,Runway能夠引入(ru)更(geng)多功能,部署更(geng)復雜的(de)(de)模(mo)(mo)(mo)型,并最終為自己的(de)(de)數(shu)百萬用(yong)(yong)戶交付(fu)更(geng)優(you)質的(de)(de)體驗。
宣布Amazon CodeWhisperer正式可用,并面向個人開發者免費開放
我(wo)們深知,對(dui)客戶(hu)而(er)言,利用(yong)正(zheng)確(que)的(de)(de)(de)基(ji)礎模型進行(xing)構建,并(bing)在(zai)最(zui)優性能(neng)的(de)(de)(de)云基(ji)礎設施上大(da)規模運(yun)行(xing)生成式(shi)AI應(ying)用(yong)程序將(jiang)帶來顛(dian)覆性變革(ge)(ge)。同(tong)時,這也(ye)將(jiang)帶來革(ge)(ge)命性的(de)(de)(de)全新用(yong)戶(hu)體(ti)驗(yan)。當應(ying)用(yong)程序或系統具(ju)備內置的(de)(de)(de)生成式(shi)AI能(neng)力時,用(yong)戶(hu)可(ke)以(yi)獲得更自(zi)然、更流暢的(de)(de)(de)交互體(ti)驗(yan)。這就(jiu)如(ru)同(tong)今天手機的(de)(de)(de)人(ren)臉識(shi)別解鎖功能(neng),我(wo)們無需了解這一(yi)(yi)功能(neng)背后強大(da)的(de)(de)(de)機器(qi)學(xue)習模型,卻可(ke)以(yi)做到看一(yi)(yi)眼手機就(jiu)解鎖了。
我們預見到,編程將是生成(cheng)式(shi)AI技(ji)術得到快速(su)應用的(de)(de)領域之(zhi)一。今天,軟件開發者(zhe)需要花(hua)費(fei)大量時間(jian)編寫相當(dang)淺(qian)顯和(he)無(wu)差別的(de)(de)代(dai)碼(ma)。他們還需要花(hua)費(fei)不(bu)少(shao)時間(jian)學習復(fu)雜的(de)(de)新工具和(he)技(ji)術,而(er)這(zhe)些工具和(he)技(ji)術總在不(bu)斷演進。因此,開發者(zhe)真正用于(yu)開發創新的(de)(de)功能(neng)(neng)與服務(wu)的(de)(de)時間(jian)少(shao)之(zhi)又少(shao)。為應對這(zhe)一難題,開發者(zhe)會嘗試從網上復(fu)制(zhi)代(dai)碼(ma)片(pian)段再進行(xing)(xing)修(xiu)改,但可能(neng)(neng)無(wu)意(yi)中就復(fu)制(zhi)了無(wu)效代(dai)碼(ma),有安全隱患的(de)(de)代(dai)碼(ma),或(huo)對開源代(dai)碼(ma)的(de)(de)使用沒有進行(xing)(xing)有效的(de)(de)追溯。而(er)且這(zhe)種搜索(suo)和(he)復(fu)制(zhi)的(de)(de)方(fang)式(shi)也浪費(fei)了開發者(zhe)用于(yu)業務(wu)構(gou)建(jian)的(de)(de)時間(jian)。
生成(cheng)式 AI 可(ke)以通(tong)(tong)過“編(bian)(bian)寫(xie)(xie)”大(da)(da)部分無差別的(de)(de)(de)(de)(de)(de)代(dai)(dai)碼(ma)來大(da)(da)大(da)(da)減少這種繁重(zhong)的(de)(de)(de)(de)(de)(de)工作,讓開(kai)發(fa)(fa)人員能夠更(geng)快地編(bian)(bian)寫(xie)(xie)代(dai)(dai)碼(ma),同時(shi)讓他們(men)有時(shi)間專注在更(geng)具(ju)創造性的(de)(de)(de)(de)(de)(de)編(bian)(bian)程(cheng)工作上。 因此,我們(men)去年宣布推出了 Amazon CodeWhisperer 預(yu)覽版,這是(shi)一(yi)款 AI 編(bian)(bian)程(cheng)助(zhu)手,通(tong)(tong)過內嵌的(de)(de)(de)(de)(de)(de)基(ji)礎模型,可(ke)以根(gen)據(ju)開(kai)發(fa)(fa)者(zhe)(zhe)用自然語言(yan)描述的(de)(de)(de)(de)(de)(de)注釋和(he)(he)集成(cheng)開(kai)發(fa)(fa)環境(IDE)中的(de)(de)(de)(de)(de)(de)既有代(dai)(dai)碼(ma)實時(shi)生成(cheng)代(dai)(dai)碼(ma)建(jian)議(yi),從(cong)而提升(sheng)開(kai)發(fa)(fa)者(zhe)(zhe)的(de)(de)(de)(de)(de)(de)生產效率(lv)(lv)。開(kai)發(fa)(fa)人員只(zhi)需要向 CodeWhisperer 提出任(ren)務命令,例如(ru)“解析一(yi)個含有歌曲信(xin)息的(de)(de)(de)(de)(de)(de) CSV 字符(fu)串”,并要求它返回一(yi)個基(ji)于藝術家、標(biao)題和(he)(he)排(pai)行榜最(zui)高排(pai)名等數據(ju)的(de)(de)(de)(de)(de)(de)結構(gou)化列(lie)表,CodeWhisperer 就(jiu)可(ke)以解析字符(fu)串并返回指定(ding)的(de)(de)(de)(de)(de)(de)列(lie)表,從(cong)而極大(da)(da)提升(sheng)工作效率(lv)(lv)。CodeWhisperer 預(yu)覽版發(fa)(fa)布后得到了開(kai)發(fa)(fa)者(zhe)(zhe)們(men)的(de)(de)(de)(de)(de)(de)熱烈響應。我們(men)始(shi)終(zhong)相(xiang)信(xin),幫助(zhu)開(kai)發(fa)(fa)人員編(bian)(bian)寫(xie)(xie)代(dai)(dai)碼(ma)可(ke)能成(cheng)為未來幾年生成(cheng)式 AI 可(ke)以發(fa)(fa)揮(hui)巨大(da)(da)效力(li)的(de)(de)(de)(de)(de)(de)應用場景之一(yi)。 在預(yu)覽期間,我們(men)還進行了一(yi)項生產力(li)測試(shi),與未使(shi)用 CodeWhisperer 的(de)(de)(de)(de)(de)(de)參與者(zhe)(zhe)相(xiang)比,使(shi)用 CodeWhisperer 的(de)(de)(de)(de)(de)(de)參與者(zhe)(zhe)完(wan)成(cheng)任(ren)務的(de)(de)(de)(de)(de)(de)速度平均快57%,成(cheng)功率(lv)(lv)高 27%。這是(shi)開(kai)發(fa)(fa)人員生產力(li)的(de)(de)(de)(de)(de)(de)巨大(da)(da)飛躍,而我們(men)相(xiang)信(xin)這才僅(jin)僅(jin)是(shi)個開(kai)始(shi)。
今天,我們很高興宣布(bu) Amazon CodeWhisperer正(zheng)式可用,在適用 Python、Java、JavaScript、TypeScript 和 C#之外,新增支持Go、Kotlin、Rust、PHP 和 SQL等10 種(zhong)開發語言。開發者可以通過在VS Code、IntelliJ IDEA、Amazon Cloud9等集成(cheng)開發環境中(zhong)(zhong)的Amazon Toolkit 插件訪問(wen) CodeWhisperer。CodeWhisperer 也可在Amazon Lambda控制臺(tai)中(zhong)(zhong)使用。除了從數十億行公開代碼中(zhong)(zhong)學習之外,CodeWhisperer 也基于亞馬(ma)遜的代碼進行了訓練。 我們相信 CodeWhisperer 是目(mu)前(qian)為亞馬(ma)遜云服務(包括 Amazon EC2、Amazon Lambda和Amazon S3)生成(cheng)代碼的最(zui)(zui)準確、最(zui)(zui)快和最(zui)(zui)安全的方式。
如果生成式 AI 工具建(jian)(jian)議(yi)(yi)(yi)的代碼(ma)包含(han)隱藏的安全(quan)漏洞或(huo)未(wei)能負責任地處理(li)開源代碼(ma),開發(fa)人員則無法真正提(ti)(ti)高(gao)工作效率。CodeWhisperer是(shi)唯一具有(you)內置安全(quan)掃描功能(通過(guo)自(zi)動推理(li)實現)的 AI 編(bian)程助(zhu)手(shou),用(yong)于查找難以檢測的漏洞并提(ti)(ti)出補救建(jian)(jian)議(yi)(yi)(yi),例如十(shi)大開放式Web應用(yong)程序安全(quan)項目(OWASP)中的漏洞以及(ji)不符合加(jia)密庫最佳(jia)實踐的漏洞等(deng)。為(wei)了幫助(zhu)開發(fa)人員以負責任的方式開發(fa)代碼(ma),CodeWhisperer會過(guo)濾(lv)掉(diao)可(ke)(ke)(ke)(ke)能被認為(wei)有(you)偏見或(huo)不公平(ping)的代碼(ma)建(jian)(jian)議(yi)(yi)(yi),同時(shi),由于客戶可(ke)(ke)(ke)(ke)能需要對開源代碼(ma)源進行參考(kao)或(huo)獲得其使用(yong)許可(ke)(ke)(ke)(ke),CodeWhisperer 還是(shi)唯一可(ke)(ke)(ke)(ke)以對疑(yi)似開源代碼(ma)建(jian)(jian)議(yi)(yi)(yi)進行過(guo)濾(lv)和標記的編(bian)程助(zhu)手(shou)。
我們相信生成(cheng)式AI將改變開發者(zhe)的(de)(de)游戲(xi)規則(ze)(ze),因此希(xi)望它能為盡可能多(duo)(duo)的(de)(de)人(ren)所(suo)(suo)用。 所(suo)(suo)以(yi),CodeWhisperer對所(suo)(suo)有個人(ren)用戶免費,并不設任(ren)何資質或使(shi)用時長的(de)(de)限(xian)制(zhi)!任(ren)何人(ren)都可以(yi)通過郵箱賬戶在(zai)幾分鐘內(nei)注(zhu)冊 CodeWhisperer進行使(shi)用,而無需亞馬遜云服(fu)務賬號。對于企業客戶,我們則(ze)(ze)提供了(le)(le)CodeWhisperer 專業版,其中(zhong)包括(kuo)更(geng)多(duo)(duo)高(gao)級管(guan)理功(gong)能,如(ru)集成(cheng)了(le)(le)身份與訪問(wen)管(guan)理服(fu)務(IAM)的(de)(de)單點登錄 (SSO),以(yi)及(ji)使(shi)用更(geng)高(gao)限(xian)額(e)的(de)(de)安全掃描。
構(gou)建像(xiang) CodeWhisperer 這樣(yang)強大的(de)應(ying)(ying)用(yong)程序對開(kai)(kai)發(fa)(fa)人員和我(wo)們(men)所有的(de)客(ke)戶(hu)來說都(dou)是(shi)變(bian)革性的(de)。我(wo)們(men)還(huan)有更(geng)多創新性的(de)產品在規劃中,也(ye)期(qi)待更(geng)多的(de)客(ke)戶(hu)和開(kai)(kai)發(fa)(fa)者在亞馬遜(xun)云服務上構(gou)建更(geng)加創新和顛覆性的(de)生(sheng)(sheng)成(cheng)式(shi)AI應(ying)(ying)用(yong)。我(wo)們(men)的(de)使(shi)命是(shi),讓各(ge)種技能(neng)水平的(de)開(kai)(kai)發(fa)(fa)人員和各(ge)種規模的(de)組織都(dou)有機會使(shi)用(yong)生(sheng)(sheng)成(cheng)式(shi)AI進行創新。我(wo)們(men)相信,新一波機器學習技術(shu)創新才(cai)剛(gang)(gang)剛(gang)(gang)開(kai)(kai)始、方興未艾,未來還(huan)有無限(xian)可(ke)能(neng)。