9月1日,2022世界人工智能大會(WAIC 2022)正式開幕。1日下午,由深度學習技術及應用國家工程研究中心主辦的“AI開源開放與產業智能化高峰論壇”成功舉辦。百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰致開場辭,中國科學院何積豐院士、王懷民院士等多位專家共同探討AI開源開放的價值,分享AI與不同領域融合創新的實踐,為產業智能化建言獻策。
王海峰在(zai)致辭中提(ti)出,大模型的(de)產(chan)業(ye)模式將是(shi)“類臺積電”模式。大模型加深度學(xue)習(xi)平臺,貫通(tong)AI全(quan)產(chan)業(ye)鏈,是(shi)產(chan)業(ye)智能化的(de)基座(zuo)。
當前(qian),作為新一輪科技革命(ming)和產業變革的(de)重要驅動力(li)量,人(ren)工智能技術呈現出很強(qiang)的(de)通(tong)用性(xing),廣泛(fan)滲透進經(jing)濟生產活動的(de)主要環(huan)節。大模(mo)型是(shi)近(jin)幾年人(ren)工智能發展(zhan)的(de)重要方向(xiang),具有效果好、泛(fan)化性(xing)強(qiang)、研發流程標(biao)準化的(de)特點,進一步增(zeng)強(qiang)了(le)人(ren)工智能的(de)通(tong)用性(xing),為人(ren)工智能進一步發展(zhan)帶來了(le)新機遇。
與此同時(shi),大(da)(da)(da)模(mo)型研發也面臨著數據規模(mo)大(da)(da)(da)、數據質量參(can)差不(bu)齊、模(mo)型體積(ji)大(da)(da)(da)、訓練難度高、算力需求(qiu)大(da)(da)(da)等一(yi)系列(lie)挑(tiao)戰(zhan)。
在這樣的背(bei)景下,如何加(jia)速大(da)(da)模型(xing)的產(chan)(chan)業落地,讓大(da)(da)模型(xing)發揮更大(da)(da)價值?在王(wang)海峰看來(lai),具有算(suan)法、算(suan)力和數據綜合優勢的企業可以將模型(xing)生產(chan)(chan)的復雜過(guo)程封裝起來(lai),通過(guo)低門檻(jian)、高效率的生產(chan)(chan)平臺(tai),為千行百業提供(gong)大(da)(da)模型(xing)服務(wu)。如此(ci)一(yi)來(lai),大(da)(da)數據、大(da)(da)算(suan)力、大(da)(da)模型(xing)能(neng)力僅需少(shao)數企業操心(xin),千行百業直接應用(yong)AI模型(xing)即可。
王海峰以臺積電、三星等企業為例,進一步闡釋大模型的產業模式,可類比芯片行業的代工廠模式。他表示,“芯片制造工藝有很高的技術壁壘,有價格高昂的產線,能夠根據客戶需求,標準化、自動化地大批量生產芯片,形成規模經濟。同理,大模型生產企業在大模型能力、海量數據、大規模算力等方面具有優勢,能夠根據AI應用方的需求,自動化、標準化地進行多場景多領域的模型生產,當達到一定規模時,即可形成健康、可持續發展的大模型產業模式。”
大(da)模型的(de)開發(fa)、訓練(lian)、推理部署以(yi)及(ji)產業落地,離(li)不開深度學習平臺的(de)支撐。深度學習平臺下接芯(xin)片(pian),上承應(ying)用(yong),相當(dang)于(yu)智能時代的(de)“操作系(xi)統(tong)”。大(da)模型加上深度學習平臺,可(ke)以(yi)貫通從(cong)硬件(jian)適(shi)配、模型訓練(lian)、推理部署,到場景(jing)應(ying)用(yong)的(de)AI全產業鏈。
大模(mo)(mo)型(xing)的(de)“類臺(tai)積電(dian)”產業模(mo)(mo)式,已經在百度的(de)大模(mo)(mo)型(xing)實踐中得到驗證。
百(bai)度(du)研(yan)制了(le)文心產業級知識(shi)增強(qiang)大(da)模(mo)型系列,包括以鵬城(cheng)-百(bai)度(du)·文心為代表的基礎(chu)通用(yong)大(da)(da)模(mo)型(xing)(xing)、生物計算領域大(da)(da)模(mo)型(xing)(xing),以及能源、金融和(he)航天行(xing)業大(da)(da)模(mo)型(xing)(xing)等(deng),還(huan)包括輔助大(da)(da)模(mo)型(xing)(xing)適配場景應用(yong)的工具和(he)平臺,探(tan)索生態(tai)共建的創(chuang)意社(she)區旸谷(gu)等(deng)。百(bai)度文心大(da)(da)模(mo)型(xing)(xing)也作為今年WAIC “八大(da)(da)鎮館之寶”之一(yi),在展區硬核亮相。
文心(xin)系列大(da)模(mo)型的成功研(yan)制和應用,背后是基(ji)于(yu)飛槳(jiang)的有力支撐。飛槳(jiang)作為我國首個自(zi)主研(yan)發(fa)、開(kai)源開(kai)放的產(chan)業(ye)級深度學(xue)習平臺,集(ji)核(he)心(xin)框架(jia)、產(chan)業(ye)級模(mo)型庫、開(kai)發(fa)套件(jian)和工(gong)具組件(jian),以及學(xue)習和實訓社區(qu)于(yu)一體(ti),標(biao)準(zhun)化(hua)、自(zi)動化(hua)地支撐大(da)模(mo)型生(sheng)產(chan)和應用。
在大模型訓(xun)練(lian)方面,飛槳研發了端(duan)到端(duan)自(zi)適應分布式訓(xun)練(lian)技術,根據模型特性和(he)算力平臺特性,自(zi)動(dong)選擇并行策略,實現(xian)端(duan)到端(duan)極致的性能優化(hua)。
在大模(mo)型(xing)推(tui)(tui)理(li)方面,飛槳打造了針對大模(mo)型(xing)的壓(ya)縮(suo)、推(tui)(tui)理(li)、服務(wu)化(hua)全流程部署(shu)方案(an),能廣(guang)泛支持不(bu)同種(zhong)類的模(mo)型(xing)結構,實現高(gao)速推(tui)(tui)理(li)。同時(shi),飛槳還(huan)提供自動模(mo)型(xing)壓(ya)縮(suo)工具,幫(bang)助(zhu)節(jie)約(yue)算力(li)資(zi)源。
文(wen)心(xin)大(da)模型基于(yu)飛槳平臺開源開放(fang),共建(jian)生態(tai),累計已(yi)有超(chao)過1萬開發者,基于(yu)文(wen)心(xin)大(da)模型,創建(jian)了(le)3萬多個任務。目前,文(wen)心(xin)大(da)模型已(yi)廣(guang)泛(fan)應用于(yu)百度產(chan)品,顯著提升產(chan)品效果和研發效率,并(bing)應用于(yu)金(jin)融、能源、醫療、制造、企業服務等領域(yu),大(da)模型的生態(tai)初現崢嶸。
“大(da)模(mo)(mo)型(xing)的產業模(mo)(mo)式(shi)將是(shi)‘類臺積(ji)電’模(mo)(mo)式(shi)。大(da)模(mo)(mo)型(xing)加上深度學習平臺,貫通AI全產業鏈,是(shi)產業智(zhi)能化的基座。”王海峰最(zui)后總結。