9月1日,2022世界人工智能大會(WAIC 2022)正式開幕。1日下午,由深度學習技術及應用國家工程研究中心主辦的“AI開源開放與產業智能化高峰論壇”成功舉辦。百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰致開場辭,中國科學院何積豐院士、王懷民院士等多位專家共同探討AI開源開放的價值,分享AI與不同領域融合創新的實踐,為產業智能化建言獻策。
王海峰(feng)在致辭(ci)中提(ti)出,大(da)模型的產(chan)業模式(shi)(shi)將是“類臺(tai)積電(dian)”模式(shi)(shi)。大(da)模型加(jia)深度學習平(ping)臺(tai),貫通AI全產(chan)業鏈,是產(chan)業智能化(hua)的基座。

當(dang)前(qian),作為(wei)新一輪(lun)科(ke)技(ji)革(ge)命和產業變革(ge)的重要驅動(dong)力量,人(ren)工(gong)智(zhi)能技(ji)術呈現(xian)出很強的通用性,廣泛滲透進經(jing)濟(ji)生產活動(dong)的主要環節。大模型是近幾年(nian)人(ren)工(gong)智(zhi)能發展(zhan)的重要方向,具(ju)有(you)效果好、泛化(hua)性強、研發流程標準化(hua)的特(te)點(dian),進一步增強了人(ren)工(gong)智(zhi)能的通用性,為(wei)人(ren)工(gong)智(zhi)能進一步發展(zhan)帶(dai)來了新機遇。
與此同時,大模型研發也面臨著數(shu)據規模大、數(shu)據質量參差不齊、模型體積大、訓練難度高、算(suan)力需求大等(deng)一(yi)系列挑戰(zhan)。
在這樣的(de)背景下(xia),如(ru)何(he)加速大(da)(da)(da)模型的(de)產(chan)(chan)業(ye)落(luo)地,讓大(da)(da)(da)模型發(fa)揮更大(da)(da)(da)價值?在王(wang)海峰看來,具有(you)算(suan)法、算(suan)力和數據(ju)綜合優勢(shi)的(de)企業(ye)可以將模型生產(chan)(chan)的(de)復雜(za)過(guo)程封裝(zhuang)起來,通過(guo)低門檻(jian)、高效(xiao)率的(de)生產(chan)(chan)平臺,為(wei)千(qian)(qian)行百業(ye)提(ti)供大(da)(da)(da)模型服務。如(ru)此一來,大(da)(da)(da)數據(ju)、大(da)(da)(da)算(suan)力、大(da)(da)(da)模型能力僅需少數企業(ye)操(cao)心,千(qian)(qian)行百業(ye)直接應用(yong)AI模型即可。
王海峰以臺積電、三星等企業為例,進一步闡釋大模型的產業模式,可類比芯片行業的代工廠模式。他表示,“芯片制造工藝有很高的技術壁壘,有價格高昂的產線,能夠根據客戶需求,標準化、自動化地大批量生產芯片,形成規模經濟。同理,大模型生產企業在大模型能力、海量數據、大規模算力等方面具有優勢,能夠根據AI應用方的需求,自動化、標準化地進行多場景多領域的模型生產,當達到一定規模時,即可形成健康、可持續發展的大模型產業模式。”
大模型的(de)(de)(de)開(kai)發、訓練、推理(li)部署以及產(chan)業(ye)落(luo)地,離不開(kai)深(shen)(shen)度(du)學習(xi)(xi)平(ping)(ping)臺(tai)的(de)(de)(de)支撐。深(shen)(shen)度(du)學習(xi)(xi)平(ping)(ping)臺(tai)下接芯(xin)片(pian),上(shang)承應用,相當(dang)于智能時代的(de)(de)(de)“操作系(xi)統”。大模型加上(shang)深(shen)(shen)度(du)學習(xi)(xi)平(ping)(ping)臺(tai),可以貫通(tong)從硬件適(shi)配(pei)、模型訓練、推理(li)部署,到場(chang)景應用的(de)(de)(de)AI全產(chan)業(ye)鏈。
大模(mo)型的“類臺積電”產業模(mo)式,已經在(zai)百度的大模(mo)型實踐中得到驗(yan)證。
百度研制了(le)文(wen)心產業級知識增(zeng)強(qiang)大模型系列,包(bao)括以鵬(peng)城-百度·文心為代(dai)表的(de)基(ji)礎通用(yong)大(da)模(mo)(mo)型(xing)(xing)、生物計算領域(yu)大(da)模(mo)(mo)型(xing)(xing),以及能源、金融和航天行業(ye)大(da)模(mo)(mo)型(xing)(xing)等,還包括輔助大(da)模(mo)(mo)型(xing)(xing)適配場景應用(yong)的(de)工具和平(ping)臺,探索生態共建的(de)創意社區旸谷等。百度文心大(da)模(mo)(mo)型(xing)(xing)也作為今年WAIC “八大(da)鎮館之寶”之一(yi),在展區硬核亮相。

文心系列大(da)模(mo)型的成(cheng)功研(yan)制(zhi)和(he)應用(yong),背后(hou)是(shi)基于飛(fei)槳的有力支撐(cheng)。飛(fei)槳作為我國(guo)首(shou)個自(zi)主研(yan)發、開(kai)源開(kai)放的產業級深(shen)度學(xue)習(xi)平臺,集核心框架(jia)、產業級模(mo)型庫(ku)、開(kai)發套件和(he)工具組(zu)件,以及學(xue)習(xi)和(he)實訓社(she)區于一體,標準化、自(zi)動化地(di)支撐(cheng)大(da)模(mo)型生(sheng)產和(he)應用(yong)。
在大模型訓練方面,飛槳研發了端(duan)(duan)到端(duan)(duan)自適應分(fen)布式訓練技術,根據(ju)模型特性(xing)和(he)算力平臺特性(xing),自動選擇并行(xing)策略,實現(xian)端(duan)(duan)到端(duan)(duan)極致的性(xing)能優化(hua)。
在大模型(xing)(xing)(xing)推理方(fang)面,飛槳(jiang)打造(zao)了針對大模型(xing)(xing)(xing)的壓縮、推理、服務化全流(liu)程部(bu)署方(fang)案,能廣泛支持不同(tong)種類的模型(xing)(xing)(xing)結構,實現(xian)高速推理。同(tong)時(shi),飛槳(jiang)還提供自動模型(xing)(xing)(xing)壓縮工(gong)具,幫助節(jie)約算力(li)資(zi)源(yuan)。
文(wen)(wen)心(xin)大(da)模(mo)型基于(yu)飛槳平臺開源開放,共建生態,累計已(yi)有(you)超過1萬(wan)開發者(zhe),基于(yu)文(wen)(wen)心(xin)大(da)模(mo)型,創(chuang)建了3萬(wan)多個任務。目前,文(wen)(wen)心(xin)大(da)模(mo)型已(yi)廣泛應用于(yu)百度產(chan)(chan)品,顯(xian)著提(ti)升產(chan)(chan)品效(xiao)果和研發效(xiao)率(lv),并(bing)應用于(yu)金融(rong)、能源、醫療、制造、企業服(fu)務等領域,大(da)模(mo)型的生態初現崢嶸。
“大(da)模型的產(chan)業(ye)模式將是‘類臺(tai)積電’模式。大(da)模型加上深(shen)度學習平臺(tai),貫通AI全產(chan)業(ye)鏈,是產(chan)業(ye)智(zhi)能化的基座(zuo)。”王海(hai)峰最后總(zong)結。

