NLP大模型缺席,不趕“熱點”只談應用(yong)的華為,功夫在“山(shan)外(wai)”。
在沉寂兩年后,華為云官網近期上線了盤古系列AI大模型的最新消息,同時,華為云人工智能領域首席(xi)科(ke)學家(jia)田奇于(yu)今日在人(ren)工智能大模型技術高(gao)峰論壇(tan)上(shang)介(jie)紹(shao)了盤古(gu)系列大模型的進展及其應用,一時拉高(gao)了人(ren)們對這次演講的期待(dai)值。
恰是阿(a)里云“通義千問”大(da)模型(xing)公(gong)布的第二天,一時間業界也有“華為(wei)加入(ru)大(da)模型(xing)之爭”的猜測。有了期待值和預期,田奇今日的演(yan)講是否滿足了觀(guan)眾的好奇心呢?我們(men)接下來會在(zai)文章中回顧華為(wei)盤古大(da)模型(xing)的前世今生,以及華為(wei)在(zai)將盤古大(da)模型(xing)推(tui)向(xiang)公(gong)眾視野的演(yan)講中透露了哪些進展。
NLP大模型缺席,何時揭開面紗成謎
盤(pan)古大(da)模(mo)型(xing)(xing)的(de)(de)(de)歷史至今也(ye)才三年(nian)時間。2020年(nian)11月,盤(pan)古大(da)模(mo)型(xing)(xing)在(zai)華為(wei)云(yun)內部立(li)項成功,該模(mo)型(xing)(xing)也(ye)完成了與合作伙(huo)伴、高校的(de)(de)(de)合作搭(da)建。在(zai)開始打(da)造盤(pan)古大(da)模(mo)型(xing)(xing)的(de)(de)(de)時候(hou),華為(wei)內部團隊確立(li)了三項最關鍵(jian)的(de)(de)(de)核心設計(ji)原則:一(yi)是(shi)模(mo)型(xing)(xing)要大(da),可以(yi)(yi)吸(xi)收海(hai)量數據(ju);二(er)是(shi)網絡結構要強,能(neng)夠真(zhen)正發揮(hui)出模(mo)型(xing)(xing)的(de)(de)(de)性能(neng);三是(shi)要具有(you)優秀的(de)(de)(de)泛化能(neng)力,可以(yi)(yi)真(zhen)正落地(di)到各行(xing)各業的(de)(de)(de)工作場景。2021年(nian)4月,盤(pan)古大(da)模(mo)型(xing)(xing)正式對外發布。
華為(wei)云官網更新(xin)的最(zui)新(xin)消息顯示(shi),華為(wei)即將上(shang)線的“盤(pan)(pan)(pan)古(gu)系列(lie)AI大(da)模(mo)型(xing)(xing)”分別為(wei)NLP 大(da)模(mo)型(xing)(xing)、CV大(da)模(mo)型(xing)(xing)、科學計算大(da)模(mo)型(xing)(xing)(氣(qi)象(xiang)(xiang)大(da)模(mo)型(xing)(xing))。國盛(sheng)證券(quan)近(jin)期發布的研報中(zhong)表(biao)示(shi),盤(pan)(pan)(pan)古(gu) NLP 大(da)模(mo)型(xing)(xing)是(shi)(shi)業界首個千億參數的中(zhong)文預訓練大(da)模(mo)型(xing)(xing);盤(pan)(pan)(pan)古(gu)CV大(da)模(mo)型(xing)(xing)是(shi)(shi)業界最(zui)大(da) CV 大(da)模(mo)型(xing)(xing)、首次實(shi)現(xian)兼顧判(pan)別與生成能力、在 ImageNet 上(shang)小樣本學習(xi)能力上(shang)處于業界第一;盤(pan)(pan)(pan)古(gu)氣(qi)象(xiang)(xiang)大(da)模(mo)型(xing)(xing)則(ze)可提供秒級天氣(qi)預報,可應用(yong)于氣(qi)象(xiang)(xiang)、生物醫藥等領域。
但(dan)在(zai)會上,田奇對于(yu)NLP大(da)(da)(da)模(mo)型(xing)(xing)僅用(yong)一(yi)句話帶(dai)過其應(ying)用(yong)進展,他表(biao)示(shi)盤(pan)古(gu)(gu)NLP大(da)(da)(da)模(mo)型(xing)(xing)目(mu)前(qian)覆(fu)蓋的智能(neng)文檔檢(jian)索、智能(neng) ERP、小語種大(da)(da)(da)模(mo)型(xing)(xing)等落(luo)地領(ling)域,2022年(nian)華為剛交付了(le)一(yi)個阿拉伯語的千億參(can)數(shu)大(da)(da)(da)模(mo)型(xing)(xing)。半小時的演講聽下來像做了(le)一(yi)套盤(pan)古(gu)(gu)大(da)(da)(da)模(mo)型(xing)(xing)的面試介(jie)紹(shao)或者(zhe)入職(zhi)第一(yi)個月(yue)的職(zhi)業規劃(hua),讓(rang)人感覺“能(neng)摸(mo)到頭腦,但(dan)是不多(duo)”。有網友(you)對沒(mei)有盤(pan)古(gu)(gu)大(da)(da)(da)模(mo)型(xing)(xing)的演示(shi)表(biao)達了(le)強烈(lie)的不滿,但(dan)既(ji)然演講中NLP大(da)(da)(da)模(mo)型(xing)(xing)并(bing)非主角,那行業大(da)(da)(da)模(mo)型(xing)(xing)當場演示(shi)確實有些強人所(suo)難。也(ye)有網友(you)吐槽“都是些之前(qian)老的to B的東西重新拿(na)出來簡(jian)單介(jie)紹(shao)了(le)一(yi)下”。
作為盤古系列(lie)大(da)(da)模型(xing)中最受關注的大(da)(da)模型(xing),與ChatGPT等(deng)外國同類AI模型(xing)相比,盤古NLP大(da)(da)模型(xing)更注重針對中文語(yu)言的優化,該模型(xing)采用(yong)了(le)深度學習和自(zi)然語(yu)言處理技術,并使(shi)用(yong)了(le)大(da)(da)量的中文語(yu)料庫(ku)進(jin)行訓練。在應用(yong)方面,盤古大(da)(da)模型(xing)可以(yi)應用(yong)于智(zhi)能(neng)客服、機器(qi)翻譯、語(yu)音識別等(deng)多(duo)個領(ling)域,提供AI技術支(zhi)持。
從參(can)(can)數(shu)與數(shu)據(ju)堆量來看,百度(du)大(da)模(mo)型(xing)的參(can)(can)數(shu)為(wei)100億,而GPT-3達到了1750億,GPT-4尚不明確。根據(ju)前段時間華為(wei)發表的論文數(shu)據(ju)判斷,華為(wei)PanGu-Σ大(da)模(mo)型(xing)參(can)(can)數(shu)最多為(wei)1.085萬億,基于華為(wei)自研的MindSpore框架開發。PanGu-Σ大(da)模(mo)型(xing)在對話方面(mian),回答更(geng)貼(tie)近(jin)主題,也更(geng)準確。在參(can)(can)數(shu)角度(du),盤古大(da)模(mo)型(xing)可能已經接(jie)近(jin) GPT-3.5 的水平。
圖源:《PANGU-Σ: TOWARDS TRILLION PARAMETER LANGUAGE MODEL WITH SPARSE HETEROGENEOUS COMPUTING》
與其他(ta)廠商相比,華為的(de)優(you)勢或在于擁有完整的(de)產(chan)業鏈和較強的(de)算力調配(pei)能力。據介(jie)紹(shao),在訓(xun)練(lian)千億(yi)參(can)數的(de)盤(pan)古(gu)大模型時,華為團隊(dui)調用了超過2000塊的(de)昇(sheng)騰(teng)910,進(jin)行了超過2個(ge)月的(de)訓(xun)練(lian)。
圖(tu)源:《華為AI盤古大模型研究框架》,浙商證券
瞄準行業賦能,華為大模型堅定“AI for Industries”
目前(qian),全球人工智(zhi)能產(chan)(chan)業正處在AI工業化(hua)開發模(mo)式起(qi)步后的(de)快速發展階段,而大(da)(da)模(mo)型是(shi)最有希望將AI進(jin)行落地的(de)方(fang)向。大(da)(da)模(mo)型最重要的(de)優(you)勢(shi)是(shi)推動AI進(jin)入大(da)(da)規模(mo)可復制(zhi)的(de)產(chan)(chan)業落地階段,僅需零(ling)樣(yang)本(ben)、小樣(yang)本(ben)的(de)學習就可以達到很好(hao)的(de)效果,以此(ci)大(da)(da)大(da)(da)降低(di)AI開發成本(ben)。
華為從2020年就關注到了人工智能技術的兩大落地趨(qu)勢(shi):
一、從小(xiao)模(mo)型到大(da)模(mo)型演進。過去十年內,AI算法(fa)的(de)(de)算力需(xu)求提升了40萬倍。大(da)模(mo)型將成為(wei)應對(dui) AI 應用碎片化的(de)(de)一種方式,因為(wei)存在較高(gao)的(de)(de)資金(jin)門檻和技(ji)術(shu)門檻,可(ke)能(neng)存在大(da)公司收(shou)編高(gao)度定制化的(de)(de)小(xiao)模(mo)型的(de)(de)現象,導致市場向大(da)公司集中,產業規則和格局也可(ke)能(neng)改變。
二、AI for science,AI與傳統科學計算領(ling)域滲透融(rong)合,將(jiang)會為包括傳統的(de)氣(qi)象、海(hai)洋、農業、地(di)球科學、航空航天(tian)等領(ling)域貢獻從偏微分(fen)方(fang)(fang)程的(de)方(fang)(fang)法拓展(zhan)到 AI 方(fang)(fang)法,在這一(yi)領(ling)域華為云推(tui)出了氣(qi)象、藥(yao)物(wu)分(fen)子領(ling)域的(de)多個行業大模型。
華為盤古大模(mo)(mo)型(xing)基于(yu)底(di)層(ceng)一(yi)站(zhan)式 AI 開發平臺(tai) ModelArts 建立(li)了(le)L0基礎大模(mo)(mo)型(xing)、L1行(xing)業(ye)大模(mo)(mo)型(xing)、L2場景(jing)模(mo)(mo)型(xing)多(duo)層(ceng)服務(wu)。具體(ti)而(er)言,基礎通用(yong)模(mo)(mo)型(xing)L0與行(xing)業(ye)的海量數據(ju)混(hun)合訓(xun)練得到行(xing)業(ye)模(mo)(mo)型(xing)L1,將L1部署到產(chan)業(ye)下游(you)千(qian)行(xing)百(bai)業(ye)的細分(fen)領域(yu)中,得到細分(fen)場景(jing)模(mo)(mo)型(xing)L2。為了(le)降低生(sheng)產(chan)成本,提高(gao)效率,盡快為行(xing)業(ye)賦能,華為過去幾年(nian)主要(yao)在(zai)做(zuo)盤古系列與訓(xun)練大模(mo)(mo)型(xing)。
據田奇介紹(shao),華為(wei)云過去幾年(nian)實踐的(de)(de)人工智能(neng)項(xiang)目(mu)已(yi)經(jing)超(chao)過1000個,其中30%人工智能(neng)項(xiang)目(mu)已(yi)經(jing)進(jin)入了(le)核心生產系統(tong),幫助客戶將盈利能(neng)力(li)平均提升18%。他預測(ce),人工智能(neng)行業滲透率(lv)將再度提速,在2026年(nian)對企(qi)業的(de)(de)滲透率(lv)將達到20%。
自華為2021年(nian)(nian)(nian)開始立項盤(pan)古(gu)大(da)(da)(da)模(mo)(mo)(mo)(mo)(mo)型(xing)以來進展不(bu)斷——2021年(nian)(nian)(nian)4月發布(bu)了盤(pan)古(gu)NLP大(da)(da)(da)模(mo)(mo)(mo)(mo)(mo)型(xing)、盤(pan)古(gu)視(shi)覺大(da)(da)(da)模(mo)(mo)(mo)(mo)(mo)型(xing)、盤(pan)古(gu)科學計算大(da)(da)(da)模(mo)(mo)(mo)(mo)(mo)型(xing);2021年(nian)(nian)(nian)9月,推出用于藥(yao)物研(yan)發細分(fen)場景的大(da)(da)(da)模(mo)(mo)(mo)(mo)(mo)型(xing);2022年(nian)(nian)(nian),其與(yu)能源集團合作發布(bu)了盤(pan)古(gu)礦山大(da)(da)(da)模(mo)(mo)(mo)(mo)(mo)型(xing)、盤(pan)古(gu)氣象大(da)(da)(da)模(mo)(mo)(mo)(mo)(mo)型(xing)、盤(pan)古(gu)海浪(lang)大(da)(da)(da)模(mo)(mo)(mo)(mo)(mo)型(xing)、盤(pan)古(gu)金融OCR大(da)(da)(da)模(mo)(mo)(mo)(mo)(mo)型(xing)。
田(tian)奇表示,2022年(nian),華(hua)為盤(pan)古(gu)大(da)模(mo)(mo)(mo)型(xing)主要在做(zuo) AI for Industry(AI 賦能產(chan)業(ye)),例(li)如視覺大(da)模(mo)(mo)(mo)型(xing)已經在工(gong)業(ye)質檢(jian)、缺陷(xian)檢(jian)測、電(dian)力(li)巡檢(jian)等100多(duo)個場景得(de)到驗證。華(hua)為大(da)模(mo)(mo)(mo)型(xing)產(chan)業(ye)化的初(chu)衷(zhong)在于開辟更多(duo)B端(duan)業(ye)務場景,正如田(tian)奇此前所說,“將工(gong)業(ye)化的一面放置在更高的優(you)先級上”。華(hua)為希望通過盤(pan)古(gu)大(da)模(mo)(mo)(mo)型(xing)為煤(mei)礦、水(shui)泥、電(dian)力(li)、金(jin)融、農業(ye)等行業(ye)創造更多(duo)產(chan)業(ye)價值(zhi)。
田奇還表示,大模型(xing)是連接技(ji)術生態和商(shang)業(ye)生態的(de)橋梁,是未來(lai)AI生態的(de)核心。華為(wei)云(yun)盤古大模型(xing)能(neng)(neng)夠推動人工(gong)智(zhi)能(neng)(neng)開發(fa)(fa)從“作(zuo)坊式”到“工(gong)業(ye)化(hua)”升級(ji)。展望(wang)未來(lai),AI for Industries是人工(gong)智(zhi)能(neng)(neng)新的(de)爆發(fa)(fa)點。盤古大模型(xing)將解決傳統(tong)AI開發(fa)(fa)的(de)難題(ti),包(bao)括作(zuo)坊式開發(fa)(fa)、樣本(ben)標注、代(dai)價大、模型(xing)維護困(kun)難、模型(xing)泛化(hua)不(bu)足、行(xing)業(ye)人短(duan)缺(que)等難題(ti)等。
田奇著重(zhong)介紹(shao)了盤古大(da)模型中CV大(da)模型和(he)的落地情況,具體如下:
CV大模型
在與能(neng)源公司(si)合(he)作的(de)盤(pan)古礦(kuang)山大模型中(zhong)案例中(zhong),礦(kuang)井(jing)現(xian)場(chang)是(shi)一(yi)(yi)個 40 米長的(de)采(cai)(cai)掘機(ji),寬度僅 2 米左(zuo)右,傳統相機(ji)很難一(yi)(yi)下子捕捉到全部畫(hua)面(mian),只(zhi)能(neng)用圖中(zhong)的(de)九宮格視頻(pin)畫(hua)面(mian)。通過 5G+AI 全景視頻(pin)拼接綜采(cai)(cai)畫(hua)面(mian)卷,傳輸到地(di)面(mian),地(di)面(mian)工作人員將來可以實現(xian)地(di)面(mian)控制機(ji)器進(jin)行采(cai)(cai)礦(kuang),實現(xian)礦(kuang)下無人少(shao)人安全作業。
盤古礦(kuang)山(shan)大模型還(huan)(huan)用(yong)在(zai)了(le)煤礦(kuang)的主(zhu)運輸(shu)皮(pi)帶(dai)作(zuo)業(ye)(ye)監控。煤礦(kuang)被采集下(xia)來以(yi)后,它會通過一(yi)個主(zhu)運輸(shu)皮(pi)帶(dai),從(cong)地下(xia)傳輸(shu)到地上。按傳統方法是(shi)通過工人配合作(zuo)業(ye)(ye)。華(hua)為提出通過視頻對作(zuo)業(ye)(ye)的安全規范進(jin)行巡檢,主(zhu)運場景的異物識(shi)別精度達(da) 98%,煤礦(kuang)作(zuo)業(ye)(ye)場景動(dong)作(zuo)識(shi)別準確率達(da) 95%,助井下(xia)安全事故減少 90% 以(yi)上;此外(wai)大模型還(huan)(huan)能進(jin)行軌道機車缺陷檢測,比如掉鏈、脫(tuo)落、裂痕等潛在(zai)不安全因(yin)素,人工檢測成本較高,盤古大模型提供圖像質量(liang)的自(zi)動(dong)評估、小樣(yang)本的故障(zhang)定(ding)位與識(shi)別等。
科學計算大模型
華為(wei)云盤古(gu)科學(xue)計算大模(mo)(mo)型(xing)加速了(le)(le)(le)人工(gong)智能在科學(xue)計算方(fang)面對于模(mo)(mo)型(xing)、算法(fa)、軟件、硬件四個(ge)(ge)方(fang)面進(jin)行(xing)融合。該模(mo)(mo)型(xing)是全球首(shou)個(ge)(ge)精度(du)超(chao)過(guo)(guo)傳(chuan)統預報方(fang)式的(de)AI模(mo)(mo)型(xing),可(ke)以在秒級(ji)的(de)時(shi)間內完成全球未(wei)來全球一(yi)個(ge)(ge)小時(shi)到七天(tian)的(de)全球天(tian)氣預報,其精度(du)首(shou)次超(chao)過(guo)(guo)了(le)(le)(le)歐洲氣象中(zhong)心(xin)的(de)數(shu)值分析方(fang)法(fa),并且預測速度(du)相對于傳(chuan)統的(de)數(shu)字分析方(fang)法(fa)提升了(le)(le)(le)1萬(wan)倍以上。此(ci)外,華為(wei)云盤古(gu)藥物分子大模(mo)(mo)型(xing)縮(suo)短先導藥物研發周期從(cong)數(shu)年(nian)到1個(ge)(ge)月。
中國大模型競爭在所難免
關(guan)注(zhu)(zhu)股市(shi)的讀者朋友今年基本都(dou)會對ChatGPT概念股傾(qing)注(zhu)(zhu)一些關(guan)注(zhu)(zhu),而此(ci)類炒作(zuo)中,我們(men)已經見證過不少(shao)速生(sheng)速死的案(an)例。在(zai)關(guan)注(zhu)(zhu)此(ci)方面上市(shi)公司近期(qi)動態時,我們(men)發(fa)現不少(shao)公司發(fa)出了“AIGC、大模型、人工智能(neng)相關(guan)產(chan)(chan)品(pin)并未對公司產(chan)(chan)生(sheng)任何收入”的聲(sheng)(sheng)音。將(jiang)目光從資本市(shi)場(chang)轉(zhuan)移到實際應(ying)用上,AI真正(zheng)在(zai)產(chan)(chan)業側(ce)掀起“ChatGPT式(shi)”的大變革似乎還很遙遠。在(zai)C端市(shi)場(chang)的傳播度(du)與(yu)基本聲(sheng)(sheng)量,是(shi)B端市(shi)場(chang)所(suo)不能(neng)及的;但B端市(shi)場(chang)能(neng)夠給予的資金底座和長線收益,也是(shi)高(gao)速變動的C端市(shi)場(chang)可(ke)望(wang)不可(ke)及的。
任(ren)何(he)一門技術突(tu)破都需要以(yi)產業(ye)賦(fu)能為(wei)技術指引,對于大(da)(da)模型(xing)而言,如果在(zai)(zai)NLP方(fang)面喪失先機(ji),處在(zai)(zai)追趕國(guo)外的(de)境況(kuang),不妨(fang)直接從產業(ye)側(ce)出發(fa),依(yi)托中國(guo)本(ben)身具備的(de)龐(pang)大(da)(da)業(ye)態尋求突(tu)圍(wei)機(ji)會。在(zai)(zai)此方(fang)面,正如田奇所(suo)言,大(da)(da)小模型(xing)協同進化(hua)(hua)將成(cheng)為(wei)行業(ye)趨勢,共(gong)同推動端側(ce)化(hua)(hua)發(fa)展(zhan)。
如果將(jiang)ChatGPT的(de)(de)(de)(de)成功模(mo)式復用(yong)(yong)到B端,以輕量(liang)化(hua)服(fu)務降低(di)應用(yong)(yong)門(men)檻(jian)一定是(shi)一條重要(yao)路(lu)徑。大(da)模(mo)型具有良好的(de)(de)(de)(de)通用(yong)(yong)性、泛化(hua)性,能夠顯(xian)著降低(di)人(ren)工(gong)智(zhi)能應用(yong)(yong)門(men)檻(jian)。預訓(xun)練(lian)大(da)模(mo)型在海量(liang)數據的(de)(de)(de)(de)學(xue)習訓(xun)練(lian)后具有良好的(de)(de)(de)(de)通用(yong)(yong)性和(he)泛化(hua)性,用(yong)(yong)戶基(ji)于大(da)模(mo)型通過(guo)零樣本、小樣本學(xue)習即可獲得領先的(de)(de)(de)(de)效果,同(tong)時“預訓(xun)練(lian)+精(jing)調”等開發范式,能夠讓研發過(guo)程更加標準化(hua),這將(jiang)降低(di)人(ren)工(gong)智(zhi)能的(de)(de)(de)(de)應用(yong)(yong)門(men)檻(jian),也將(jiang)是(shi)AI走向工(gong)程化(hua)應用(yong)(yong)落地(di)的(de)(de)(de)(de)重要(yao)手段。
在(zai)過去在(zai)分散化(hua)的(de)(de)模(mo)(mo)型(xing)(xing)研發(fa)模(mo)(mo)式(shi)(shi)下,單一的(de)(de)AI應(ying)用(yong)(yong)場景下的(de)(de)多個(ge)任(ren)務都(dou)需(xu)要(yao)由(you)多個(ge)模(mo)(mo)型(xing)(xing)支(zhi)撐完成,每一個(ge)模(mo)(mo)型(xing)(xing)建(jian)設都(dou)需(xu)要(yao)算(suan)法開發(fa)、數據處(chu)理(li)、模(mo)(mo)型(xing)(xing)訓練(lian)與(yu)調優過程(cheng)。預訓練(lian)大(da)模(mo)(mo)型(xing)(xing)增強了人工智能的(de)(de)通用(yong)(yong)性(xing)、泛化(hua)性(xing),基(ji)于大(da)模(mo)(mo)型(xing)(xing)通過零樣(yang)本或小樣(yang)本精調,就(jiu)可實(shi)現(xian)在(zai)多種(zhong)任(ren)務上的(de)(de)較(jiao)好效果。大(da)模(mo)(mo)型(xing)(xing)“預訓練(lian)+精調”等模(mo)(mo)式(shi)(shi)帶來(lai)了新的(de)(de)標準化(hua)AI研發(fa)范式(shi)(shi),實(shi)現(xian)AI模(mo)(mo)型(xing)(xing)在(zai)更(geng)統一、簡(jian)單的(de)(de)方(fang)式(shi)(shi)下規模(mo)(mo)化(hua)生(sheng)產。
隨后,大模(mo)(mo)(mo)型(xing)負(fu)責向(xiang)小(xiao)模(mo)(mo)(mo)型(xing)輸出模(mo)(mo)(mo)型(xing)能(neng)力,小(xiao)模(mo)(mo)(mo)型(xing)更(geng)(geng)精(jing)確地處(chu)理(li)自己“擅長”的(de)(de)(de)任(ren)務,再將應用(yong)中的(de)(de)(de)數(shu)據與結(jie)果反哺給大模(mo)(mo)(mo)型(xing),讓大模(mo)(mo)(mo)型(xing)持續迭(die)代更(geng)(geng)新,形(xing)成(cheng)大小(xiao)模(mo)(mo)(mo)型(xing)協同(tong)應用(yong)模(mo)(mo)(mo)式(shi),達到降低能(neng)耗(hao)、提(ti)高整體模(mo)(mo)(mo)型(xing)精(jing)度(du)的(de)(de)(de)效果。
據IDC預(yu)測,未來(lai)大(da)模(mo)型將(jiang)帶動(dong)新的產(chan)業(ye)(ye)和服務(wu)應用(yong)范式,在(zai)深(shen)度學習平臺的支撐(cheng)下將(jiang)成(cheng)為產(chan)業(ye)(ye)智能化基座,企(qi)業(ye)(ye)需加快建設人工智能統一底座,融合專家知識(shi)圖譜,打造可面向跨(kua)場景或行業(ye)(ye)服務(wu)的 “元能力引擎” 。
從近期的(de)行業(ye)亂(luan)戰來看,中國企業(ye)不擅長做“有(you)趣的(de)技術(shu)”,但執著于行業(ye)首創(chuang)的(de)“模(mo)式”。追逐浪潮在(zai)(zai)(zai)所難免,但相較于大語言模(mo)型,我(wo)國大廠在(zai)(zai)(zai)幾(ji)年前(qian)就紛(fen)紛(fen)推(tui)出行業(ye)大模(mo)型,在(zai)(zai)(zai)此方面(mian)(mian)存在(zai)(zai)(zai)一定的(de)先行布局(ju),此方面(mian)(mian)一定需要(yao)繼續加(jia)碼,但在(zai)(zai)(zai)大語言模(mo)型方面(mian)(mian),中國需要(yao)幾(ji)個“輪子”目前(qian)還沒有(you)定論,這等(deng)耗時耗力的(de)活計,唯有(you)留給(gei)一線(xian)的(de)大廠來思考。
參考資料:
1.《華(hua)(hua)為盤(pan)古大模型新進(jin)展,華(hua)(hua)為云 AI 首(shou)席科學家(jia) 7000 字(zi)演講(jiang)精(jing)華(hua)(hua)》,智東西
2.《華為AI盤古大模型研(yan)究框架(jia)》,浙商(shang)證(zheng)券(quan)
3.《2022中國大模型(xing)發展白皮書》,IDC