北京(jing)此次提出的這(zhe)些措施比較領(ling)先(xian),眼光比較超前。
▲2023年5月24日,中關村論壇人工智能展區,北京通用人工智能研究院工作人員在介紹他們研發的一個具有人類認知智能能力的模型——“通慧模型”。新京報記者 浦峰 攝
5月30日,在2023中關村論壇閉幕式重大成果發布會上,北京市科委、中關村管委會二級巡視員劉航正式發布兩項政策。這兩項政策分別是:北京市政府印發《北京市加快建設具有全球影響力的人工智能創新策源地實施方案(2023-2025年)》(以下簡稱《方案》);市政府辦公廳同步印發《北京市促進通用人工智能創新發展的若干措施》(以下簡稱《措施》)。
圍繞著人工智(zhi)能(neng)如此密(mi)集(ji)地(di)發布重要文(wen)件(jian),實屬(shu)罕見,北京市(shi)建設人工智(zhi)能(neng)高地(di)的決心和力度清晰可(ke)見。
1兩份重磅文件邏輯緊密相連
讀了這兩(liang)份(fen)重要文(wen)件,可以看出兩(liang)份(fen)文(wen)件內在邏(luo)輯其實(shi)緊密相(xiang)連(lian)。
首先,《方(fang)案(an)》圍(wei)繞(rao)著突(tu)破關鍵技術、夯實底層(ceng)基礎(chu)、構(gou)(gou)建(jian)產業(ye)方(fang)陣(zhen)、推動(dong)場景(jing)建(jian)設、構(gou)(gou)建(jian)創新(xin)生態五(wu)(wu)大方(fang)向,提(ti)出(chu)16項重點任務;《措施》則從提(ti)升(sheng)(sheng)算力資源統(tong)籌供(gong)給能(neng)力、提(ti)升(sheng)(sheng)高質(zhi)量數據要素供(gong)給能(neng)力、系(xi)統(tong)構(gou)(gou)建(jian)大模型等通(tong)用人工智能(neng)技術體(ti)系(xi)、推動(dong)通(tong)用人工智能(neng)技術創新(xin)場景(jing)應(ying)用、探索營造包(bao)容審慎(shen)的監(jian)管環境五(wu)(wu)個(ge)方(fang)面(mian)退出(chu)的具體(ti)措施。
《方案》重點是“要做什么”,《措施》則是“具體怎么做”。《方案》側重宏觀產業發展方向,《措施》側重具體操作,任務的落地。
“人(ren)工(gong)智(zhi)(zhi)能(neng)(neng)核心產業(ye)規模達到(dao)3000億元,持續保持10%以上增長,輻射產業(ye)規模超過1萬億元。”《方(fang)案》提出了(le)具體(ti)的目(mu)標(biao)(biao)數據。16項重點任務(wu)和(he)(he)21條具體(ti)措施就是圍(wei)繞著這個(ge)目(mu)標(biao)(biao)展(zhan)(zhan)開。從大(da)的方(fang)向上看,是在國(guo)家(jia)發展(zhan)(zhan)新(xin)一代(dai)人(ren)工(gong)智(zhi)(zhi)能(neng)(neng)的決策框架之下,針對北(bei)(bei)京市的“兩個(ge)人(ren)工(gong)智(zhi)(zhi)能(neng)(neng)區(qu)”——北(bei)(bei)京國(guo)家(jia)新(xin)一代(dai)人(ren)工(gong)智(zhi)(zhi)能(neng)(neng)創(chuang)新(xin)發展(zhan)(zhan)試驗區(qu)和(he)(he)國(guo)家(jia)人(ren)工(gong)智(zhi)(zhi)能(neng)(neng)創(chuang)新(xin)應用(yong)先導區(qu),“一個(ge)地(di)”——全(quan)球(qiu)影響力的人(ren)工(gong)智(zhi)(zhi)能(neng)(neng)創(chuang)新(xin)策源地(di),“一個(ge)中(zhong)心”——國(guo)際科技(ji)創(chuang)新(xin)中(zhong)心的繼續布局(ju)、深化加強和(he)(he)全(quan)面推動。
2幾個關鍵詞值得關注
在(zai)兩(liang)個(ge)重磅(bang)文件中,幾個(ge)重點和關鍵詞值得關注。
一是突破和原創。《方(fang)案》提到了“突(tu)破(po)人(ren)工智(zhi)(zhi)能前沿基礎(chu)理(li)論創(chuang)新(xin)”,強調“圍(wei)繞人(ren)工智(zhi)(zhi)能數學機(ji)理(li)、大數據智(zhi)(zhi)能、多模態(tai)智(zhi)(zhi)能、決(jue)策智(zhi)(zhi)能、類(lei)腦智(zhi)(zhi)能、科學智(zhi)(zhi)能、具身(shen)智(zhi)(zhi)能等方(fang)向開展研究布局,形成具有國(guo)際(ji)影(ying)響力的人(ren)工智(zhi)(zhi)能原創(chuang)理(li)論體系(xi)。”不(bu)僅僅是要有基礎(chu)理(li)論框架體系(xi),而且強調“原創(chuang)”。
目(mu)前,在AI領(ling)域,大部分的(de)基礎理論(lun)框架(jia)都是(shi)由國外的(de)科學(xue)家和(he)工程師提出(chu),這(zhe)不(bu)是(shi)什(shen)么秘(mi)密(mi),國內的(de)業界也一(yi)直期待(dai)什(shen)么時候有我們的(de)科學(xue)家或者工程師提出(chu)的(de)原創性的(de)框架(jia)和(he)體系(xi),打破國外的(de)壟斷局面。如(ru)今,北京在此方面敢為人先(xian),提出(chu)這(zhe)樣一(yi)個任務,有希望早日實現突破。
二是兩個重要內容。《方案》提到“支(zhi)持創新主體重點突破(po)分布式(shi)高效(xiao)深(shen)度學習框(kuang)架、大模(mo)型(xing)新型(xing)基(ji)礎架構、深(shen)度超大規模(mo)圖計算(suan)、超大規模(mo)模(mo)擬計算(suan)等(deng)基(ji)礎平臺技(ji)術。支(zhi)持數據與(yu)知(zhi)識深(shen)度聯合學習、高維(wei)空間多模(mo)態(tai)語義對(dui)齊(qi)、大規模(mo)認(ren)知(zhi)與(yu)推理、可控內容生成、高效(xiao)低成本(ben)訓練與(yu)推理等(deng)關(guan)(guan)鍵(jian)算(suan)法研發,著(zhu)力推動大模(mo)型(xing)相(xiang)關(guan)(guan)技(ji)術創新。鼓勵相(xiang)關(guan)(guan)技(ji)術和(he)算(suan)法開源開放。”
這里提(ti)到了兩個(ge)重(zhong)要的(de)(de)(de)(de)內容。一(yi)個(ge)是(shi)(shi)框(kuang)架和(he)算法的(de)(de)(de)(de)研發,一(yi)個(ge)是(shi)(shi)鼓勵開(kai)(kai)源。框(kuang)架和(he)算法,是(shi)(shi)生態(tai)的(de)(de)(de)(de)基礎(chu),比(bi)如早期谷歌提(ti)出(chu)的(de)(de)(de)(de)Tensorflow,到當(dang)前比(bi)較流(liu)行(xing)的(de)(de)(de)(de)PyTorch,主要是(shi)(shi)來自于(yu)美國,后(hou)來百(bai)度提(ti)出(chu)的(de)(de)(de)(de)飛(fei)槳,也逐漸形成了自己的(de)(de)(de)(de)技術(shu)生態(tai)。這個(ge)堪比(bi)電腦的(de)(de)(de)(de)操作系統,重(zhong)要性可見一(yi)斑。開(kai)(kai)源則是(shi)(shi)一(yi)種態(tai)度、底(di)氣(qi)和(he)實力(li)(li),目前絕大部分框(kuang)架都(dou)是(shi)(shi)開(kai)(kai)源的(de)(de)(de)(de),包括百(bai)度的(de)(de)(de)(de)飛(fei)槳。開(kai)(kai)源社區的(de)(de)(de)(de)共享(xiang)程(cheng)度,一(yi)直(zhi)是(shi)(shi)業界衡量實力(li)(li)的(de)(de)(de)(de)一(yi)個(ge)重(zhong)要指標。
再者,《方案》提到“推動國產人工智能芯片實現突破。面向人工智能云端分布式訓練需求,開展通用高算力訓練芯片研發;面(mian)向邊(bian)緣端(duan)應用場景的低功耗需求,研制多模態(tai)智能(neng)傳感芯(xin)片(pian)、自主(zhu)智能(neng)決策執行芯(xin)片(pian)、高能(neng)效邊(bian)緣端(duan)異構智能(neng)芯(xin)片(pian);面(mian)向創(chuang)新型芯(xin)片(pian)架構,探(tan)索可重構、存算(suan)一體(ti)、類(lei)腦計算(suan)、Chiplet 等創(chuang)新架構路(lu)線。”
眾所周知,芯片是人工智能的王者。自(zi)從美國(guo)(guo)對中(zhong)國(guo)(guo)芯(xin)片(pian)(pian)方(fang)(fang)面接連實施限(xian)制,我國(guo)(guo)在芯(xin)片(pian)(pian)方(fang)(fang)面逐漸獨立(li)自(zi)主成為了剛需。前面所說的理論(lun)和框架,技(ji)術體系都(dou)是(shi)需要算(suan)力(li)做支撐(cheng),如(ru)果說算(suan)力(li)是(shi)基(ji)礎(chu)(chu)設施,芯(xin)片(pian)(pian)則(ze)是(shi)基(ji)礎(chu)(chu)的基(ji)礎(chu)(chu)。《方(fang)(fang)案》可謂(wei)抓住了重點的重點。
3措施領先,眼光超前
說了《方案》,再來談談《措施》。
首先,《措施》提到“算力資源統籌供給”。眾所周(zhou)知,大模型(xing)對算(suan)力要求(qiu)非常高(gao)。以ChatGPT為例,ChatGPT3.5光訓練就用了萬級別(bie)的A100的卡,這種算(suan)力全(quan)世界也沒幾家公司具有。除(chu)此之外,實(shi)現大模型(xing)商用,隨著千萬級甚至(zhi)上億級的高(gao)并發,如果沒有足(zu)夠(gou)的算(suan)力完全(quan)撐不住(zhu),非常容易造成服務不可用。
在這種(zhong)算力資源非常(chang)緊缺的(de)情形下,單打(da)獨斗不行,資源統籌非常(chang)有必(bi)要。北(bei)京市可以發揮(hui)非常(chang)好的(de)統籌作用,集中全部(bu)的(de)算力,合理地分(fen)配(pei)與調度,實現需求和(he)供給的(de)高效匹配(pei)。
其次,《措施》提到“高質量數據要素供給”。數據、算力和算法(fa)是(shi)人工智能的(de)“三劍客”,缺(que)一不可(ke),數據堪比工業界的(de)“石油”。就語(yu)言大模型(xing)(xing)來說(shuo),國外(wai)提(ti)出的(de)大模型(xing)(xing)訓練(lian)過程中(zhong)(zhong),中(zhong)(zhong)文(wen)(wen)數據是(shi)缺(que)乏(fa)的(de),中(zhong)(zhong)文(wen)(wen)的(de)知(zhi)識(shi)(shi)也是(shi)缺(que)乏(fa)的(de),所以其模型(xing)(xing)推斷(duan)出來的(de)結(jie)果在(zai)中(zhong)(zhong)文(wen)(wen)方(fang)面是(shi)有(you)(you)限的(de)。中(zhong)(zhong)文(wen)(wen)數據這方(fang)面,中(zhong)(zhong)文(wen)(wen)是(shi)母(mu)語(yu),我國更(geng)有(you)(you)優勢。所以,只(zhi)要積累到更(geng)多的(de)高(gao)質量的(de)中(zhong)(zhong)文(wen)(wen)數據和知(zhi)識(shi)(shi),完全可(ke)能訓練(lian)出比國外(wai)大模型(xing)(xing)更(geng)好的(de)中(zhong)(zhong)文(wen)(wen)大模型(xing)(xing),這恰(qia)好也是(shi)我們所需要的(de)。
再者,《措施》提到人工智能的應用落地,主要是政務服務、醫療、科學研究、金融、自動駕駛、城市治理這些領域的示范應用。這些領(ling)域都是(shi)北京的重點領(ling)域和(he)優(you)勢領(ling)域,將人(ren)工智能在這些領(ling)域的應用(yong)推(tui)廣可謂“強強聯(lian)手”,發(fa)揮(hui)出協(xie)同效應。
此外,《措(cuo)(cuo)施》提(ti)到(dao)(dao)人(ren)工智能的監管創(chuang)新、網絡安全(quan)和數據防護(hu)、加(jia)強科技倫理(li)的治理(li)。北(bei)京此次提(ti)出(chu)的這些措(cuo)(cuo)施比較領先,眼(yan)光比較超前。人(ren)工智能不僅僅起到(dao)(dao)正面(mian)的積極作用(yong),如果不加(jia)管制,其負面(mian)效應會逐漸爆發出(chu)來,對社會乃至人(ren)類造成傷(shang)害。
對人工智能的監管和治理,就要早早把人工智能之“惡”關在籠子里。
綜上所(suo)述,《方(fang)案》和《措施(shi)》兩份重磅文件在大模型形成一(yi)個(ge)新的(de)大爆發,人(ren)工智能進入一(yi)個(ge)新的(de)爆發周期的(de)起點(dian)這個(ge)重要時(shi)刻發布,展示出(chu)北京沖刺“AI第一(yi)城(cheng)”的(de)決心和部署,值得期待(dai)。
▲5月26日,中關村國家自主創新示范區展(zhan)示中心的一款全尺寸人(ren)形仿生機器人(ren)。圖/新華社
4北京在國際人工智能城市排名提升
北京在人工智能方面具有非常好的基礎。
首先是人才,北京(jing)聚集了眾多以清華大(da)學(xue)、北京(jing)大(da)學(xue)、中(zhong)國科(ke)學(xue)院(yuan)等國際(ji)和(he)國內知名的高校和(he)科(ke)研院(yuan)所。人工智能是一個人才(cai)密集型(xing)產(chan)業。人才(cai)優勢非常(chang)關鍵。
其次是資金,在長期看好的有利條件(jian)下,北京吸引了(le)國內外(wai)資金(jin)。還有就是政府推動。相互之間形(xing)成了(le)巨大的合力(li)。在這(zhe)些(xie)基礎上,北京在人工智能建設方(fang)面取得(de)了(le)重大進展。
2022年10月,北(bei)(bei)(bei)京市經濟和信息化(hua)局(ju)在北(bei)(bei)(bei)京人工智(zhi)能產(chan)業(ye)(ye)創(chuang)新(xin)發(fa)展大會上發(fa)布了《2022年北(bei)(bei)(bei)京人工智(zhi)能產(chan)業(ye)(ye)發(fa)展白皮(pi)書(shu)》。白皮(pi)書(shu)顯(xian)示,北(bei)(bei)(bei)京持(chi)續保持(chi)人工智(zhi)能領先優勢(shi)。截至(zhi)2022年10月,北(bei)(bei)(bei)京擁有人工智(zhi)能核心企(qi)業(ye)(ye)1048家,占全國(guo)人工智(zhi)能企(qi)業(ye)(ye)總量的29%,位列全國(guo)第一。
根據白(bai)皮書(shu),北京(jing)創新“策源(yuan)地(di)”建設提速。北京(jing)人(ren)(ren)工(gong)智(zhi)能(neng)領域核(he)心技術(shu)人(ren)(ren)才超四萬人(ren)(ren),占全(quan)國的60%。人(ren)(ren)工(gong)智(zhi)能(neng)論文發表量居全(quan)國第一。在專利(li)授權數量全(quan)球排名前100的機(ji)構中,北京(jing)總部機(ji)構30家(jia)。白(bai)皮書(shu)顯示,北京(jing)人(ren)(ren)工(gong)智(zhi)能(neng)支撐能(neng)力不(bu)斷(duan)增強(qiang)。人(ren)(ren)工(gong)智(zhi)能(neng)算力發展排名全(quan)國第一。
白皮書還顯示,北京國家人工智能先導區建設成果顯著。數字人、智能機器人等技術在冬奧會成功落地,彰顯科技冬奧魅力。海淀、朝陽、西城、昌平、通州等區已開始或完成“智慧城市大腦(nao)”相關部(bu)署(shu),北(bei)京已邁向(xiang)全(quan)域場景開放的(de)智(zhi)慧城市(shi)2.0階(jie)段。無(wu)人出行(xing)服務從(cong)示范運營邁入商業(ye)化(hua)試(shi)點新(xin)階(jie)段。2022年度北(bei)京市(shi)智(zhi)能(neng)工(gong)(gong)廠(chang)和(he)(he)數(shu)(shu)字化(hua)車(che)(che)間(jian)名單(dan)正式發布,36家智(zhi)能(neng)工(gong)(gong)廠(chang)和(he)(he)47家數(shu)(shu)字化(hua)車(che)(che)間(jian)名單(dan)出爐(lu),人工(gong)(gong)智(zhi)能(neng)與智(zhi)能(neng)制(zhi)造融合創(chuang)新(xin)加速落地。
除此之外,最近(jin),據(ju)不(bu)完全(quan)統計(ji),目前(qian)中(zhong)國10億參(can)數(shu)規模(mo)(mo)以(yi)上(shang)(shang)的大(da)模(mo)(mo)型(xing)(xing)已(yi)發布(bu)79個(ge),14個(ge)省市/地區都在開展大(da)模(mo)(mo)型(xing)(xing)研發,主(zhu)要集中(zhong)在北(bei)京和廣東,其中(zhong)北(bei)京38個(ge)大(da)模(mo)(mo)型(xing)(xing),廣東20個(ge)大(da)模(mo)(mo)型(xing)(xing)。中(zhong)國大(da)模(mo)(mo)型(xing)(xing)中(zhong),已(yi)有半數(shu)以(yi)上(shang)(shang)大(da)模(mo)(mo)型(xing)(xing)開源,高校/科(ke)研機構是開源主(zhu)力。
在國內,北京長期占據人工智能城市排行榜第一的位置。在國際人工智能城市排名榜上,北京的排名也從2020年的第七到2023年的第五,地位逐漸提升。
可以預見,北京未來將有一個越來越清晰的新名片:AI之城。