谷歌推出第五代AI芯片：训练和运行AI模型的速度提高5倍

国产人妻精品区一区二区,国产农村妇女毛片精品久久,JAPANESE日本丰满少妇,日本公妇理伦a片,射精专区一区二区朝鲜

谷歌推出第五代AI芯片：訓練和運行AI模型的速度提高5倍

作者 | 澎湃新聞(wen)2023-09-01

谷歌第五代定制張量處理器(TPU)芯片TPU v5e用(yong)于大(da)模型(xing)訓練(lian)和推理(li)，訓練(lian)和運(yun)行AI模型(xing)的速度提高了5倍(bei)。與上一代(dai)芯(xin)片相(xiang)比，TPU v5e每一美(mei)元的訓練(lian)性(xing)能提高2倍(bei)，每一美(mei)元的推理(li)性(xing)能提高2.5倍(bei)。

谷歌第五代定(ding)制張量處理器(qi)(TPU)芯片TPU v5e用于大(da)模(mo)型訓練和推理，訓練和運行(xing)AI模(mo)型的速(su)度提高(gao)了5倍。

當地時間8月29日，谷歌在舊金山的年度云會議Google Cloud Next上發布了新的人工智能芯(xin)片，即第(di)五代定制張量處理(li)器(TPU)芯(xin)片TPU v5e，用于大(da)模型訓(xun)練和推(tui)(tui)理(li)。與上一(yi)代芯(xin)片相比，TPU v5e每一(yi)美(mei)元的(de)訓(xun)練性(xing)能提高(gao)(gao)2倍(bei)(bei)，每一(yi)美(mei)元的(de)推(tui)(tui)理(li)性(xing)能提高(gao)(gao)2.5倍(bei)(bei)。

TPU是谷(gu)歌為(wei)神經網絡設計(ji)的(de)(de)專用芯(xin)片(pian)，TPU經過(guo)優化可加快(kuai)機器學習模型(xing)的(de)(de)訓練和推(tui)斷速度，2016年推(tui)出第一代TPU，2021年發布第四代定制處(chu)理器TPU，2022年面向開(kai)發者提供。云TPU(Cloud TPU)是一項谷(gu)歌云服務，適合訓練需要進行大(da)量矩陣計(ji)算(suan)的(de)(de)大(da)型(xing)復雜深度學習模型(xing)，例如大(da)語言模型(xing)、蛋(dan)白質折疊建模和藥物研發等，幫(bang)助企(qi)業在實現(xian)AI工作負載時節(jie)省資(zi)金(jin)和時間。

此(ci)次(ci)推出(chu)的(de)(de)TPU v5e專為中(zhong)大型模(mo)型訓練(lian)(lian)和(he)推理所(suo)需的(de)(de)成本(ben)效(xiao)(xiao)益和(he)性(xing)能而構建。谷(gu)歌云表示，該(gai)版本(ben)芯(xin)片的(de)(de)開發(fa)重點(dian)是效(xiao)(xiao)率，與上(shang)一(yi)代TPU v4相比(bi)，TPU v5e每一(yi)美(mei)元(yuan)的(de)(de)訓練(lian)(lian)性(xing)能提高(gao)(gao)2倍，每一(yi)美(mei)元(yuan)的(de)(de)推理性(xing)能提高(gao)(gao)2.5倍，而成本(ben)不到TPU v4的(de)(de)一(yi)半，使得更(geng)多組織能夠訓練(lian)(lian)和(he)部署更(geng)大更(geng)復雜(za)的(de)(de)AI模(mo)型。客戶不需要通過(guo)犧牲性(xing)能或靈活性(xing)來獲得這些成本(ben)效(xiao)(xiao)益。谷(gu)歌云將TPU v5e描(miao)述為“超(chao)級(ji)計算機”，最(zui)多允許256個芯(xin)片互連，總帶寬超(chao)過(guo)400 Tb/s，支持八種不同的(de)(de)虛(xu)擬(ni)機配置，客戶可選(xuan)擇合適的(de)(de)配置服務(wu)于各(ge)種大語言模(mo)型和(he)生成式AI模(mo)型。根(gen)據速(su)度(du)基準測試，在TPU v5e上(shang)訓練(lian)(lian)和(he)運行AI模(mo)型時速(su)度(du)提高(gao)(gao)了(le)5倍。

據科技(ji)媒體TechCrunch報道，谷(gu)歌云(yun)計(ji)算(suan)和(he)機器學習基(ji)礎設施副總裁兼總經(jing)理馬克·洛邁爾(er)(Mark Lohmeyer) 表示，“這(zhe)是(shi)迄(qi)今為(wei)止最(zui)具(ju)成本效益(yi)且易于(yu)訪問的(de)(de)云(yun)TPU。” 洛邁爾(er)強調(diao)，谷(gu)歌云(yun)確(que)保用(yong)戶(hu)能(neng)(neng)夠將其(qi)TPU集群(qun)擴(kuo)展(zhan)到以前無法(fa)達(da)到的(de)(de)水平，讓客戶(hu)能(neng)(neng)夠輕松擴(kuo)展(zhan)他們的(de)(de)人(ren)工(gong)(gong)智(zhi)(zhi)能(neng)(neng)模(mo)型，超越單(dan)個TPU集群(qun)的(de)(de)物理邊界。也(ye)就是(shi)說(shuo)，單(dan)個大型人(ren)工(gong)(gong)智(zhi)(zhi)能(neng)(neng)工(gong)(gong)作(zuo)負(fu)載可以跨越多個物理TPU集群(qun)，擴(kuo)展(zhan)到數(shu)萬(wan)個芯片，并且經(jing)濟高效。“在云(yun)GPU和(he)云(yun)TPU方面，我(wo)們為(wei)客戶(hu)提供(gong)了很(hen)多選擇和(he)靈活性，以滿足我(wo)們看到的(de)(de)人(ren)工(gong)(gong)智(zhi)(zhi)能(neng)(neng)工(gong)(gong)作(zuo)負(fu)載的(de)(de)廣泛需求。”

除了新(xin)一代TPU，谷歌云還宣布將在下(xia)個月推出基于英偉達H100 GPU的A3系列虛擬機，作為(wei)GPU超級計算機進行交(jiao)付，為(wei)人工(gong)智能大模型(xing)提供(gong)動力。