芯東西8月27日報道,今日,GTIC 2022全球AI芯片峰會在深圳市南山區圓滿落幕。會上,2022「中國AI芯片企業50強」榜單正式揭曉。

▲智一科技聯合創(chuang)始人、總(zong)編(bian)輯張國仁(ren)揭曉榜單

這場高規格產業(ye)會議,由芯(xin)東(dong)(dong)西與智(zhi)東(dong)(dong)西公開課聯(lian)合(he)主(zhu)辦,以“不負芯(xin)光(guang)(guang) 智(zhi)算未來(lai)”為主(zhu)題,匯集了來(lai)自AI芯(xin)片領域的(de)產學研投專家及創(chuang)業(ye)先鋒代表,展示智(zhi)能計算底層(ceng)創(chuang)新與落(luo)地的(de)最新光(guang)(guang)景。
兩(liang)天內(nei),32位嘉(jia)賓通過主題演講和(he)巔峰對話,分享了(le)(le)干(gan)貨滿載、深(shen)入淺(qian)出的行業見解(jie)。峰會全(quan)場(chang)座無虛席,全(quan)網直(zhi)播人數累計(ji)高達220萬+人次。作為智(zhi)一科技產(chan)業對接平(ping)臺GTIC落地(di)深(shen)圳的首場(chang)產(chan)業峰會,GTIC 2022全(quan)球AI芯片峰會得到了(le)(le)深(shen)圳產(chan)業人士的廣泛好(hao)評。
昨日,我們整(zheng)理(li)了AI芯(xin)片高峰論(lun)壇(tan)和云端(duan)AI芯(xin)片專題論(lun)壇(tan)的核心看點(dian)。(AI芯(xin)片峰會燃爆深圳南山!17位(wei)大咖(ka)演(yan)講萬字(zi)精華來了)
今天,精彩繼(ji)續!15位大牛分別(bie)出席邊(bian)緣端AI芯(xin)(xin)片(pian)專題論(lun)壇(tan)(tan)、存算一體芯(xin)(xin)片(pian)專題論(lun)壇(tan)(tan)、新型計(ji)算技術專題論(lun)壇(tan)(tan),暢談AI芯(xin)(xin)片(pian)創(chuang)新路徑,以及在加速落地商用(yong)過程中積累的心(xin)得。
南方科技大(da)學深港(gang)微電(dian)子學院(yuan)創院(yuan)副(fu)院(yuan)長(chang)余浩教授在(zai)現場“種草(cao)”了低碳AI芯片。
我(wo)(wo)(wo)們(men)(men)向往著讓機器來(lai)做計算(suan),幫助我(wo)(wo)(wo)們(men)(men)“躺平(ping)”,但就(jiu)目前的(de)算(suan)力(li)中心而言(yan),其在(zai)功耗和效(xiao)率上都需(xu)要(yao)付出很大代價,如電力(li)、能源的(de)消(xiao)耗。因此,在(zai)數字經(jing)濟、可持續經(jing)濟的(de)背景下,我(wo)(wo)(wo)們(men)(men)需(xu)要(yao)一(yi)塊高能效(xiao)的(de)低(di)碳芯(xin)片(pian)。

▲南方科技大學深港微電子學院(yuan)(yuan)創院(yuan)(yuan)副院(yuan)(yuan)長余浩教授
現有(you)的(de)(de)有(you)效解(jie)決途徑包括并行(xing)的(de)(de)GPU、脈(mo)動的(de)(de)TPU,不過這些解(jie)法或多(duo)或少仍(reng)存在功(gong)耗高、能效低的(de)(de)問題。那么,如(ru)何在保證精(jing)度(du)、降低功(gong)耗的(de)(de)情況下(xia)訓練出多(duo)精(jing)度(du)、多(duo)復雜度(du)模型并實現高能效的(de)(de)硬件計算(suan)?
余浩(hao)教授團(tuan)隊的(de)做法是(shi)通過網(wang)絡架構自動搜(sou)索設計(ji),對網(wang)絡進(jin)行(xing)(xing)逐層優化(hua),得到高(gao)能(neng)(neng)效的(de)混(hun)合(he)精度神經網(wang)絡;并在硬(ying)件(jian)層面,讓每個(ge)數據單(dan)元(yuan)都(dou)支持多精度并行(xing)(xing)處理,同(tong)時每個(ge)并行(xing)(xing)的(de)多精度陣(zhen)列又可以進(jin)行(xing)(xing)數據復用,就(jiu)可以高(gao)能(neng)(neng)效地運行(xing)(xing)多復雜度的(de)網(wang)絡模(mo)型。
南方科技(ji)大學團隊已經研(yan)發(fa)了4款(kuan)AI芯片,其(qi)中(zhong),在平(ping)均能效情況(kuang)下,X-Edge芯片達到200TOPS/W,超越人腦的(de)10TOPS/W。
基于上述研發理念,X-Edge芯片可以應用于搭建低碳邊緣算力平臺、機器人平臺、移動巡檢平臺、元宇宙平臺等。
相對(dui)云端AI芯片(pian),邊緣側與(yu)端側的(de)AI芯片(pian)企業面臨著更為多元的(de)應(ying)用場景,不(bu)止要通過優化底層(ceng)技術,還必須抓住(zhu)時間窗口,加(jia)速實現芯片(pian)及相應(ying)解決方案(an)的(de)規(gui)模(mo)化落地。
在上(shang)午舉行(xing)的邊緣端AI芯(xin)片專題(ti)論壇期間(jian),來自時擎(qing)科(ke)技、愛芯(xin)元智(zhi)、Imagination、齊感科(ke)技、英(ying)諾達、嘉楠科(ke)技的行(xing)業大牛,分享了他們觀察到的下游市場需(xu)求之變(bian),以及(ji)應對這些變(bian)化(hua)的產品創新、落地打法與(yu)實戰經驗。
1、時擎科技仇健樂:分布式存儲與計算,應對端側AI落地碎片化挑戰
在AIoT時代,AI應用越來(lai)越多地以“云邊端(duan)協(xie)同”形式出(chu)現(xian)。與云端(duan)AI芯片(pian)(pian)相比,端(duan)側(ce)AI芯片(pian)(pian)需(xu)要滿足一些特定(ding)需(xu)求,比如:算(suan)力能支持本地預(yu)處(chu)理或簡單決策即可,對功(gong)耗和成(cheng)本更敏感(gan)(gan),傳感(gan)(gan)器接(jie)口和應用市場碎片(pian)(pian)化等。
面向這樣的市場特點(dian),端側智能芯(xin)片公司時(shi)擎科技選擇采(cai)用DSA(領域專用架構(gou)(gou))芯(xin)片設計方(fang)案,時(shi)擎采(cai)用神經網(wang)絡(luo)數據壓縮(suo)引(yin)擎,支持自(zi)主研發的基于RISC-V架構(gou)(gou)的端側DSA智能處理(li)器。
據(ju)時(shi)擎科技研發(fa)副總裁仇健樂分(fen)享,該(gai)處理器(qi)可進行分(fen)布式存儲和計算,適應AI算法快速(su)演進,保持(chi)高(gao)計算效率,目前已能(neng)在128GOPS-2TOPS算力范圍(wei)內實現較強伸縮性。

▲時擎科(ke)技研發副總裁(cai)仇健樂
當進(jin)入客戶(hu)應用場景進(jin)行部(bu)(bu)署(shu),設(she)計(ji)好的AI端側芯片又面臨一(yi)大新的挑戰——部(bu)(bu)署(shu)模(mo)型多為(wei)小型化網絡模(mo)型,數據量化難度大。
為此,時(shi)擎(qing)(qing)通過TimesFlow平臺提供多(duo)種量(liang)(liang)化(hua)(hua)方(fang)法,包括INT8/INT16的對(dui)稱(cheng)/非(fei)對(dui)稱(cheng)量(liang)(liang)化(hua)(hua)選項,從而降低(di)量(liang)(liang)化(hua)(hua)過程中(zhong)的精度損失。時(shi)擎(qing)(qing)還配備一(yi)鍵部(bu)署(shu)功能(neng)、豐富算子庫、多(duo)種預處理方(fang)法,以優(you)化(hua)(hua)客(ke)戶的應用部(bu)署(shu)體(ti)驗。
2、愛芯元智劉建偉:兩大核心技術,加速端側AI芯片落地
近10年(nian)AI技術發展(zhan)(zhan)迅猛(meng),隨著(zhu)算(suan)力越來(lai)越大,市(shi)場空間暴(bao)漲,端側和(he)邊(bian)緣(yuan)側的(de)AI芯(xin)片也(ye)(ye)迎來(lai)發展(zhan)(zhan)機遇。在端側、邊(bian)緣(yuan)側對(dui)智能要(yao)求越多,需要(yao)的(de)算(suan)法也(ye)(ye)就越多,同(tong)時,AI的(de)應(ying)用也(ye)(ye)對(dui)感知和(he)計(ji)算(suan)提出(chu)了更高的(de)需求。
愛芯元智聯合創始人、副總裁劉建偉說:“愛芯元智在AI芯片領域對感知和計算的探索,已經成功量產兩代四顆芯片,并布局于消費電子、智慧城市領域。”

▲愛芯元(yuan)智(zhi)聯合創始(shi)人、副總(zong)裁(cai)劉建(jian)偉
愛芯元智將(jiang)感(gan)知和計(ji)算作為兩大基礎技術進(jin)行研發,其中,AI-ISP技術將(jiang)AI與(yu)ISP(圖像信號處(chu)理)相結合,選取傳統ISP中的模塊(kuai)進(jin)行增強。混(hun)合精度NPU提供基礎算力,可(ke)以實(shi)現模塊(kuai)間并行計(ji)算。
此外,愛芯元智(zhi)提供的(de)不僅是AI芯片,而是面向場景的(de)解(jie)決方(fang)案(an),在設(she)計(ji)整(zheng)個(ge)芯片時(shi),會(hui)幫助客戶從芯片、應(ying)用到算法(fa)進(jin)行協同設(she)計(ji)。
3、Imagination鄭魁:CPU+GPU+AI異構計算,滿足邊緣智能多樣化需求
隨著人工智能市場快速增長,PC、智能手機、安全、汽車等市場都需要不同算力,為此,IP解決方案商Imagination最新推出了覆蓋AI、GPU和CPU等IP的異構計算架構。
Imagination中(zhong)國區(qu)??智(zhi)能及(ji)汽車產(chan)品市場副(fu)總鄭魁談道(dao),作為一家IP設(she)計公(gong)司(si),PPA(性能、功耗(hao)、面(mian)(mian)積)是產(chan)品一直強調的要素(su)。同時面(mian)(mian)向手機、自動駕駛等各個領域(yu)的算(suan)力需(xu)(xu)求多樣化,對硬(ying)件計算(suan)架構(gou)乃(nai)至軟件棧有更(geng)高的需(xu)(xu)求。異構(gou)計算(suan)是未(wei)來的發展方向,對此(ci),Imagination已在IP層面(mian)(mian)將所有計算(suan)異構(gou)能力整合,提供具備(bei)靈活性、標(biao)準化、開放性的解決方案(an)。

▲Imagination中國(guo)區??智能及汽(qi)車(che)產品市場副總鄭(zheng)魁
在AI方面,Imagination推出(chu)了(le)NNA(神經網絡(luo)加速器)等IP產品(pin),已落地自動駕駛(shi)、consumer等多個領域;在CPU方面,最(zui)新推出(chu)基于(yu)(yu)RISC-V的RTXM-2200,是其首款實(shi)時(shi)嵌入(ru)式(shi)的高度(du)可擴展的實(shi)時(shi)、確定性、32位嵌入(ru)式(shi)CPU;在GPU方面,基于(yu)(yu)PowerVR開拓(tuo)性架構(gou)除了(le)出(chu)色的PPA,還具備強大的算(suan)(suan)力(li)可拓(tuo)展性。Power VR架構(gou)走(zou)過(guo)30載(zai),如今高算(suan)(suan)力(li)IMG GPU已拓(tuo)展至(zhi)桌(zhuo)面、車載(zai)、高性能計算(suan)(suan)等多個新市場。
4、齊感科技刁勇:芯片+解決方案,助不同AI場景的應用快速落地
齊感科技市場副總裁刁勇談道(dao),AI產業市場正在高速(su)(su)發展,目前較典(dian)型的AI應(ying)用包括(kuo)語音(yin)識別、自然語言(yan)處(chu)理、視覺應(ying)用,其中(zhong)視覺應(ying)用是成長最(zui)快(kuai)速(su)(su)的。

▲齊感科(ke)技市場副總裁刁勇(yong)
智(zhi)慧(hui)家居、智(zhi)慧(hui)零售、智(zhi)慧(hui)農(nong)牧(mu)、機器人、智(zhi)慧(hui)教育等落地場景,對AI視(shi)(shi)覺芯片(pian)有非常強的(de)需(xu)求。對于AI視(shi)(shi)覺芯片(pian)公司來(lai)說,僅(jin)利用自(zi)己的(de)經驗來(lai)應對不同業(ye)務需(xu)求,可能會面(mian)臨(lin)很(hen)多的(de)挑戰。對此,齊(qi)感科技以AI SoC芯片(pian)為核心,推出全套解(jie)決(jue)方案,來(lai)幫助客戶在(zai)設計相關產品時(shi)快速(su)落地。
目前,齊感科技已經推出兩代芯片平臺(tai)QG21、QG31,包含8顆芯片,并在此(ci)基礎上布局了智(zhi)(zhi)能網絡攝像機(ji)、低功耗視覺(jue)應(ying)用,智(zhi)(zhi)能門鎖、AI智(zhi)(zhi)能分析盒子(zi)、智(zhi)(zhi)能云臺(tai)、翻譯機(ji)等解(jie)決方案(an)。
此外,很多不帶AI的(de)攝像頭已經部(bu)署應用,但它(ta)們可能有(you)實際上有(you)升級(ji)、增加(jia)AI加(jia)速能力的(de)需(xu)求,齊感科技(ji)的(de)AI智能分析(xi)解決(jue)方案則給這些產品提供了升級(ji)路徑(jing)。
5、英諾達李曦:大型AI芯片驗證平臺,應對芯片設計上云需求
算力(li)成(cheng)為半導體行業(ye)的(de)新增長點,人們(men)在(zai)追求更先進的(de)制程工藝時,IC設計(ji)成(cheng)本(ben)隨(sui)之快速上(shang)升,芯片設計(ji)軟(ruan)件(jian)EDA上(shang)云成(cheng)為新趨(qu)勢。
英諾達市場與銷售總監(jian)李曦談道,IC設計上云面臨數據安全、商務模式、技術(shu)支持等多(duo)重挑戰。EDA龍頭Cadence推出(chu)的Palladium硬(ying)件(jian)仿真加速(su)器是業界較通用的硬(ying)件(jian)仿真器,支持百億門級的SoC全芯片(pian)驗證(zheng);但它(ta)價格昂(ang)貴(gui),安裝及維(wei)護要求高,中小公司往往難以(yi)負擔(dan)。

▲英諾達市場與銷售(shou)總(zong)監李(li)曦
為此,英諾達推(tui)出(chu)國內首(shou)個基(ji)于且由Cadence獨家授權(quan)的(de)(de)Palladium的(de)(de)異構(gou)云(yun)平臺,在國內搭建異構(gou)機(ji)房以保(bao)證安(an)全(quan)可控和(he)數據(ju)快(kuai)速(su)傳輸,并(bing)將(jiang)費(fei)用降低到中(zhong)小(xiao)公司可負擔(dan)的(de)(de)范圍(wei),目前已形成按(an)需使用、按(an)時收費(fei)的(de)(de)商業模式。
同時,該平臺(tai)也會(hui)提(ti)供機(ji)器故障診斷及(ji)維修、客(ke)戶配置(zhi)初始(shi)調試(shi)、驗(yan)證環境搭建等技術支(zhi)持(chi)。在疫(yi)情期間,英諾(nuo)達的(de)云服務優勢(shi)明顯(xian),客(ke)戶的(de)機(ji)器利(li)用率保持(chi)在80%以(yi)(yi)上,不僅可(ke)(ke)以(yi)(yi)讓用戶持(chi)續推(tui)進研發進度,還(huan)可(ke)(ke)以(yi)(yi)讓用戶把更(geng)多精力放在體現其核心競爭力的(de)芯片設(she)計上。
6、嘉楠科技湯煒偉:擁抱軟硬件開源生態,算法平臺和倉庫幫助輕松部署
“AI應用的發展逐漸變得(de)場(chang)景化(hua)、設(she)備化(hua)、多樣化(hua)。”嘉楠科(ke)技副總裁湯煒偉說。AI先(xian)起于(yu)云端,隨(sui)著技術(shu)不(bu)(bu)斷成熟(shu)、AI算法(fa)模型裁剪(jian)量化(hua),AI芯片(pian)性能和性價比不(bu)(bu)斷提升,邊(bian)緣的AI算力變得(de)更加(jia)普及。

▲嘉楠科技副總裁湯煒偉(wei)
邊緣(yuan)AI計算設備(bei)形態(tai)多元化,這導致未(wei)來該(gai)領(ling)域的開發(fa)并(bing)不(bu)只在(zai)大公(gong)司(si),更(geng)多中(zhong)小公(gong)司(si)、個人開發(fa)者都會參與進來。不(bu)過(guo)在(zai)開發(fa)過(guo)程中(zhong),開發(fa)者往(wang)往(wang)直(zhi)面很多門(men)檻,比如選擇芯片(pian)平臺、買(mai)不(bu)到(dao)芯片(pian)硬件、獲(huo)取(qu)開發(fa)資料和獲(huo)得支持等(deng)。在(zai)他看來,降(jiang)低門(men)檻最好的途徑就是開源。
因此,嘉(jia)(jia)楠科(ke)技采用(yong)(yong)RISC-V的通用(yong)(yong)處理器核架構,多代自(zi)研KPU架構,實現全流程的研發(fa)自(zi)主研發(fa),能(neng)夠對開(kai)源開(kai)放(fang)、快速迭代和客戶支持有更好支撐。近(jin)兩三(san)年(nian)嘉(jia)(jia)楠科(ke)技已經實現超200萬顆(ke)RISC-V AI芯片(pian)出(chu)貨。
另外,新的(de)(de)AI算法(fa)平臺和倉庫計劃年(nian)底推出,該工具將極大降低(di)AI開發(fa)門檻。在體驗(yan)已有AI demo集的(de)(de)基礎上,開發(fa)者(zhe)可空中升級新增的(de)(de)AI算法(fa)demo 以(yi)及算法(fa)二次開發(fa),并輕松優(you)化部署在硬件上。
嘉楠(nan)科技的(de)AI工具鏈,軟(ruan)件(jian)SDK等代(dai)碼和文檔已全面開源在Github等平臺上,以勘(kan)智Kendryte AI品牌(pai)呈現(xian)。
三、存算一體核心力(li)量(liang)集結!從小算力(li)走向大(da)算力(li)
存算一體是當(dang)前AI芯(xin)(xin)片領域(yu)最熱門的(de)(de)架構創(chuang)新方(fang)向。這個(ge)有望突破傳(chuan)統(tong)算力瓶(ping)頸的(de)(de)創(chuang)新賽道,不僅是國(guo)際芯(xin)(xin)片學術頂級會議的(de)(de)焦點話題(ti),而(er)且在產業界開(kai)始(shi)頻頻“吸金(jin)”,連(lian)獲各路(lu)資本的(de)(de)傾投。
今天下(xia)午,五位國(guo)內存算一(yi)體(ti)AI芯(xin)(xin)片創(chuang)企的(de)創(chuang)始人兼(jian)CEO齊(qi)聚GTIC 2022全(quan)球AI芯(xin)(xin)片峰(feng)會·存算一(yi)體(ti)芯(xin)(xin)片專(zhuan)題論壇,展示前沿(yan)架(jia)構與落地進展,探討高能效、低成本的(de)可行之(zhi)徑。
1、知存科技王紹迪:存內計算芯片能效、成本優勢明顯,WTM系列芯片率先布局生態
相比于傳統計(ji)算(suan)架(jia)構(gou),存算(suan)一體更(geng)(geng)適(shi)合(he)AI計(ji)算(suan)。利用(yong)歐姆定(ding)律乘法(fa)的(de)計(ji)算(suan)原(yuan)理,這種(zhong)架(jia)構(gou)就可以實(shi)現百(bai)萬級、千萬級并行(xing)計(ji)算(suan),使(shi)得AI計(ji)算(suan)算(suan)力(li)能(neng)效(xiao)提升數倍到(dao)數十倍,相比CPU、GPU具備(bei)更(geng)(geng)高密度(du)、更(geng)(geng)高并行(xing)度(du)、更(geng)(geng)高能(neng)效(xiao)、更(geng)(geng)大算(suan)力(li)。
知存科技創(chuang)始(shi)人兼CEO王紹迪談道,存算一體在成本、算力、功耗上有很大優勢,但還需(xu)要補齊(qi)通(tong)用型、工(gong)具(ju)鏈、精度。

▲知存(cun)科技創始人(ren)兼(jian)CEO王紹迪
知存科技(ji)已(yi)經量產(chan)商用存內計算SoC芯片(pian)WTM2101,AI算力達到50Gops,功(gong)耗僅5uA-3mA,主要應用于(yu)可穿戴(dai)場景(jing)中的語音識別、語音增強(qiang)、健康監測(ce)等功(gong)能。未來5年內,還將發布更高算力芯片(pian)序列(lie)WTM8系列(lie)、WTM-C系列(lie)、WTM-S系列(lie)。
接下來,憑借存(cun)(cun)內計算(suan)產(chan)品(pin)研發(fa)和商(shang)用(yong)的先(xian)發(fa)優勢(shi),知(zhi)存(cun)(cun)科技會持(chi)續投入算(suan)法體系、架(jia)構創新與工(gong)具鏈、底層(ceng)工(gong)藝三個(ge)層(ceng)面,推動存(cun)(cun)內計算(suan)生態構建。王紹(shao)迪表示,存(cun)(cun)內計算(suan)未來也要擁抱Chiplet,將兼容性、能效做的更好(hao)。
2、蘋芯科技楊越:AI算力下沉時代,用SRAM突破“存儲墻”限制
進入AI時代,算力正在下沉到移動物聯網及AIoT終端,計算更加注重能耗及效率。
為(wei)了(le)解決“存儲(chu)墻”問題,減少數據在(zai)存儲(chu)器(qi)與處理器(qi)之間的傳輸(shu)損耗,業界出現了(le)CMOS加速器(qi)、近存計算(suan)、存內(nei)計算(suan)等(deng)多種路徑。蘋芯科技聯合(he)創始?兼CEO楊(yang)越認為(wei),在(zai)可實(shi)現存內(nei)計算(suan)的多種存儲(chu)器(qi)技術(shu)中,SRAM(靜態隨機(ji)存取存儲(chu)器(qi))具有(you)較大(da)計算(suan)優勢。

▲蘋芯科技聯合創始?兼CEO楊越
聚焦這一領域,蘋芯科(ke)技(ji)推(tui)出(chu)了SRAM數字(zi)存(cun)內(nei)計算內(nei)核(he),支持(chi)常(chang)見的(de)定點(dian)/浮點(dian)運算,能實(shi)現超5倍效率提升,納秒級讀寫(xie)延遲,無擦寫(xie)次數限制,并且能夠向高級工藝節點(dian)兼容,引(yin)入ADC-less設計,從(cong)(cong)而(er)實(shi)現精(jing)度無損效果。從(cong)(cong)內(nei)核(he)硬件到(dao)SoC產品,蘋芯科(ke)技(ji)在(zai)可掛載的(de)PIM核(he)、軟件構建等(deng)方面加(jia)大布局,目(mu)前正在(zai)陸續推(tui)出(chu)NE002、NE003、PIMCHIP S230等(deng)幾(ji)款芯片。
權威報告(gao)顯示,2030年(nian)全球(qiu)AI芯片市場規模有(you)望達到2021億美(mei)元。楊越(yue)說,蘋(pin)芯定位的(de)市場不局限于AI識(shi)別算(suan)法,還覆蓋了包括降噪算(suan)法、SLAM算(suan)法、ISP算(suan)法等其他矩陣類運算(suan),目標落地智慧可穿戴、機器人、工農(nong)業智能化設備等領域。
3、億鑄(zhu)科技(ji)(ji)熊(xiong)大(da)(da)鵬:基于ReRAM的全數字化存算(suan)一(yi)體大(da)(da)算(suan)力芯片(pian)技(ji)(ji)術
AI芯片正(zheng)在(zai)從通用(yong)(yong)CPU、專用(yong)(yong)加速(su)器發展(zhan)為存算一體(ti)階段,而馮·諾依曼(man)架構的(de)存儲墻(qiang)、能效墻(qiang)、編譯墻(qiang)正(zheng)在(zai)阻礙AI芯片算力(li)和能效比的(de)持續發展(zhan)。
億鑄(zhu)科技創始人、董事(shi)長(chang)兼CEO熊(xiong)大鵬談道,存(cun)算一體架(jia)(jia)構在突破這些瓶頸上具有(you)先天優勢。目(mu)前實(shi)現存(cun)算一體架(jia)(jia)構主要(yao)通過模擬、數(shu)(shu)模兩種(zhong)方(fang)式。模擬能(neng)夠提高兩個數(shu)(shu)量級以上的能(neng)效(xiao)比,數(shu)(shu)模混合(he)能(neng)部分解決精度問題,不過這兩種(zhong)方(fang)式會犧(xi)牲部分精度,同時(shi)數(shu)(shu)模、模數(shu)(shu)轉換會帶來能(neng)耗、面積和(he)性能(neng)瓶頸。

▲億鑄科技創始人、董事(shi)長兼CEO熊大(da)鵬
為了突破上述瓶頸,億鑄科(ke)技基(ji)于ReRAM打造了全數字(zi)化存(cun)算一體(ti)(ti)AI大(da)(da)算力芯(xin)片技術(shu),通過數字(zi)化徹(che)底解精度問(wen)題(ti),在整(zheng)個計算過程中(zhong),不(bu)受(shou)工藝(yi)環境(jing)的(de)影響,實現(xian)高精度、大(da)(da)算力、超(chao)高能效比,切實將存(cun)算一體(ti)(ti)架(jia)構應用于大(da)(da)算力領域。
不同存儲(chu)介質(zhi)(zhi)應(ying)用在(zai)不同場(chang)(chang)景上各有(you)優(you)劣勢。熊大(da)(da)鵬認為(wei),面向AI大(da)(da)算力場(chang)(chang)景,ReRAM是目前最合適的存儲(chu)介質(zhi)(zhi)。億鑄(zhu)選擇ReRAM的優(you)勢在(zai)于非易失、密(mi)度大(da)(da)、密(mi)度上升空間巨大(da)(da)、能耗低(di)、讀(du)寫速度快(kuai)、成本低(di)、穩定、兼容(rong)CMOS工藝等特(te)點。目前ReRAM的制造(zao)工藝已經成熟,且已經有(you)ReRAM產品量產落地。
4、智芯科張鐘宣:解決AI落地中的“將大象塞進冰箱”難題
杭州智芯科微電?創始(shi)?兼CEO張鐘(zhong)宣說(shuo),千千萬萬的AI公司做(zuo)AI落地(di),面臨“將大象塞(sai)進(jin)冰箱”的問題。例如(ru),一個手(shou)(shou)機(ji)的功耗(hao)不能超過5W,否則熱(re)散不去,AI模(mo)型落地(di)到手(shou)(shou)機(ji)上,就會(hui)損失(shi)很多效果。

▲杭(hang)州智芯(xin)科(ke)微(wei)電?創始(shi)?兼CEO張鐘宣
看到這一市場發(fa)展瓶頸,智(zhi)芯(xin)科選擇基(ji)于(yu)SRAM(靜(jing)態隨機存取存儲器(qi))的存內計算(suan)技術,解(jie)決(jue)后摩爾時代(dai)的“大(da)算(suan)力、低功耗”市場痛(tong)點。智(zhi)芯(xin)科主(zhu)要(yao)聚(ju)焦視覺處(chu)理芯(xin)片、GPNPU(通用神經網絡處(chu)理器(qi))兩個落地方向。
張(zhang)鐘宣談道,智(zhi)芯科的視覺處理器AT700 AI CIM,int8能(neng)(neng)耗比(bi)達(da)(da)到(dao)10TOPS/W。AT700X Pre-ISP圖像增強(qiang)能(neng)(neng)使算力(li)超過(guo)20TOPS,同(tong)時功(gong)耗低(di)(di)于1W;落地網絡攝像機領域,能(neng)(neng)實(shi)現0.5~2W低(di)(di)功(gong)耗,算力(li)達(da)(da)10~50TOPS(int8),實(shi)現暗(an)光(guang)全彩效(xiao)果;AT800 GP CIM是其代表(biao)性的邊緣AI處理器,采用12nm制程(cheng),int8能(neng)(neng)耗比(bi)達(da)(da)到(dao)30TOPS/W,幾(ji)乎達(da)(da)到(dao)當下5nm同(tong)類芯片(pian)的水平。
在軟件方(fang)面(mian),智芯(xin)科推出了一套AI工(gong)具流程,面(mian)向客(ke)戶提供網絡(luo)優(you)化(hua)、量化(hua)浮點(dian)達(da)int8的算(suan)力服務(wu),并支(zhi)持神經網絡(luo)圖形編譯、可執行(xing)二(er)進(jin)制(zhi)文件生成的相關硬(ying)件。
5、九天睿芯劉洪杰:基于混合信號SRAM存算一體,多模態傳感器協同
人機交互系統智能(neng)程度提(ti)升(sheng),帶(dai)來了傳感器(qi)數量、時(shi)間(jian)空間(jian)分辨率(lv)要(yao)求及神(shen)經網(wang)絡應用規(gui)模的提(ti)升(sheng),對多維度數據同步采集、傳輸(shu)、處理(li)、運算和存儲操作的能(neng)效、面效和時(shi)效性能(neng)提(ti)出了更高的要(yao)求。
九(jiu)(jiu)天睿芯創始人(ren)、董事長兼(jian)CEO劉洪杰談道,基于SRAM的(de)(de)(de)混合信(xin)號存內(nei)計算能夠實現(xian)更(geng)(geng)小(xiao)(xiao)的(de)(de)(de)運算單(dan)元、更(geng)(geng)高的(de)(de)(de)能效,同時(shi)保持符合商(shang)用(yong)的(de)(de)(de)精度,體現(xian)了該架構良好的(de)(de)(de)應用(yong)優勢,在面積上(shang),九(jiu)(jiu)天睿芯的(de)(de)(de)產品大小(xiao)(xiao)僅為1.4x1.4平(ping)方毫米。

▲九天睿(rui)芯創(chuang)始(shi)人(ren)、董事長兼CEO劉(liu)洪(hong)杰
混合(he)信號(hao)(hao)SRAM存(cun)算(suan)(suan)一體同時結(jie)合(he)模(mo)擬預處理(li)和(he)高(gao)性(xing)能(neng)(neng)(neng)ADC,九天睿芯使整個信號(hao)(hao)鏈更智能(neng)(neng)(neng)更高(gao)效(xiao)率,這一架構(gou)能(neng)(neng)(neng)打破(po)傳(chuan)感器(qi)端ADC速度(du)(du)和(he)精(jing)度(du)(du)性(xing)能(neng)(neng)(neng)瓶頸,存(cun)算(suan)(suan)一體實現了NPU突破(po)功耗(hao)(hao)瓶頸,因此適用(yong)(yong)(yong)于追求(qiu)極致低(di)功耗(hao)(hao)和(he)低(di)延(yan)時、高(gao)精(jing)度(du)(du)的場景。面向兩個應用(yong)(yong)(yong):1,VR/AR領域(yu)的未來應用(yong)(yong)(yong),基于混合(he)信號(hao)(hao)SRAM感存(cun)算(suan)(suan)一體可(ke)幫助實現眼動追蹤,以及VR/AR頭(tou)顯(xian)設備的超低(di)功耗(hao)(hao)語音識別、SLAM同步定(ding)位與(yu)構(gou)圖。2,集(ji)成(cheng)模(mo)擬預處理(li)或高(gao)速ADC與(yu)存(cun)算(suan)(suan)一體的車用(yong)(yong)(yong)傳(chuan)感器(qi)端(視(shi)覺,激光雷(lei)達(da)等)的低(di)延(yan)時低(di)功耗(hao)(hao)高(gao)集(ji)成(cheng)度(du)(du)處理(li)。
在后(hou)摩爾時代,AI芯(xin)片日漸面(mian)臨(lin)來(lai)自(zi)器(qi)件、工藝、架構、能耗、成本(ben)等諸多芯(xin)片設計與制造層面(mian)的(de)(de)挑戰。同時,盡(jin)管(guan)深度學習算(suan)法(fa)的(de)(de)落(luo)地愈發廣泛,產學界(jie)仍在探(tan)索實現(xian)通用(yong)智(zhi)能的(de)(de)更多可能路徑,這要求AI芯(xin)片從底(di)層架構創新,來(lai)應對主(zhu)流AI算(suan)法(fa)變化的(de)(de)不確定性。
除了存算(suan)(suan)一體方(fang)興未艾,還有幾類新(xin)型(xing)計(ji)算(suan)(suan)架構(gou)走出學術象牙(ya)塔,走向產業化。在新(xin)型(xing)計(ji)算(suan)(suan)技(ji)術專(zhuan)題(ti)論壇(tan)上(shang),類腦(nao)計(ji)算(suan)(suan)創企(qi)(qi)代(dai)表靈(ling)汐科技(ji)、光子計(ji)算(suan)(suan)創企(qi)(qi)代(dai)表曦智科技(ji)、量子計(ji)算(suan)(suan)創企(qi)(qi)代(dai)表玻色量子發表主題(ti)演(yan)講,分享(xiang)他們如何通過(guo)將前沿(yan)技(ji)術轉化落地,闖向AI計(ji)算(suan)(suan)加速(su)的“無人區”。
1、靈汐科技華寶洪:類腦芯片已量產落地,異構融合成新趨勢
靈汐科技副(fu)總經(jing)理(li)華寶洪認為(wei),類腦計算(suan)是(shi)后(hou)摩爾(er)時代顛(dian)覆性(xing)戰略(lve)技術,已成中(zhong)美(mei)歐科技競爭(zheng)必爭(zheng)之地。這一(yi)(yi)方法受人腦啟(qi)發產生(sheng),是(shi)一(yi)(yi)個融合生(sheng)物腦科學原理(li)和(he)計算(suan)機科學原理(li)的(de)計算(suan)系統,具(ju)有近似計算(suan)、抗(kang)噪音、稀疏、時空相關性(xing)等(deng)特點。

▲靈汐科(ke)技副總經理華寶洪(hong)
華寶(bao)洪說,異構融合是類腦計(ji)算的(de)(de)發展趨勢。靈汐科技的(de)(de)相關成果于2019年登國(guo)際學術頂刊《自然》封面,基于此靈汐科技已流片和量產了(le)邊端首款(kuan)商(shang)用類腦芯片Lynchip KA200,兼容人工神(shen)經網(wang)絡和生物(wu)神(shen)經網(wang)絡,采用12nm制程,支持25萬(wan)神(shen)經元、2500萬(wan)突(tu)觸,稀疏模式支持200萬(wan)神(shen)經元,DNN算力達(da)到32TOPS(int8),16TFLOPS(FP16),功耗范圍在1-14瓦(wa),運行ResNet50-64、yolo5等主流網(wang)絡時,芯片在能效比和性(xing)價比遠高于NVIDIA T4。
目前(qian)靈汐(xi)科技的(de)類腦(nao)計(ji)算芯片已經用于腦(nao)科學和類腦(nao)計(ji)算,同時也(ye)覆蓋安防、機器人(ren)、無人(ren)機等傳統AI應(ying)用領域。
2、曦智科技胡永強:光電混合,重新定義算力基建
半導體(ti)工(gong)藝從硅基時(shi)代的(de)10μm工(gong)藝發(fa)展到3nm工(gong)藝,進(jin)入后摩(mo)爾時(shi)代,企業(ye)開始探索光子計(ji)算(suan)、量(liang)子計(ji)算(suan)、存內計(ji)算(suan)的(de)發(fa)展。曦智科技全球副總裁胡(hu)永強談道,光子計(ji)算(suan)的(de)底層優勢(shi)是低(di)延遲、低(di)能(neng)耗、高通量(liang)。與電傳輸相比(bi),光信號(hao)以光速傳輸,能(neng)實(shi)現微米(mi)至百(bai)米(mi)級(ji)的(de)TB級(ji)數據傳輸能(neng)力(li)。

▲曦(xi)智科技全(quan)球副總裁胡永強
基于光(guang)子矩陣計(ji)算oMAC、片(pian)上光(guang)網絡oNET、片(pian)間光(guang)網絡oNOC的三(san)大光(guang)核心技術,曦智科技打造了光(guang)子計(ji)算和(he)光(guang)子網絡兩大產(chan)品(pin)線。
相比(bi)于電子(zi)芯片,光(guang)的(de)計(ji)算(suan)(suan)單元并(bing)行能力很強,可(ke)以(yi)利用(yong)波分復用(yong)同時(shi)計(ji)算(suan)(suan)多路數據,同時(shi)獲得更高的(de)能效比(bi)以(yi)及(ji)極低(di)的(de)計(ji)算(suan)(suan)延遲,且對工藝制(zhi)程(cheng)的(de)要求也更低(di)。此(ci)外,片上(shang)光(guang)網絡oNOC技術將(jiang)CMOS硅電子(zi)芯片堆疊在(zai)光(guang)芯片上(shang),這種光(guang)電技術能通過光(guang)波導實現高帶寬、低(di)能耗(hao)、低(di)延遲的(de)chiplet網絡互聯方案(an)。
去年,曦(xi)智科(ke)技(ji)發布了第二代光(guang)計(ji)算(suan)處(chu)理器(qi)PACE,采用64x64光(guang)學矩(ju)陣乘(cheng)法器(qi),單個光(guang)子芯片中集成超(chao)過10000個光(guang)子器(qi)件(jian),其運行特定(ding)神(shen)經網絡的計(ji)算(suan)速(su)度可以達(da)到(dao)目前高(gao)端GPU的數百(bai)倍。今(jin)年下半(ban)年,曦(xi)智科(ke)技(ji)將推出(chu)全(quan)球首顆基于oNOC技(ji)術的光(guang)電混合3D封裝AI加(jia)速(su)計(ji)算(suan)芯片,并搭載自研(yan)軟件(jian)棧。
3、玻?量??凱:光量子芯片正從理論優越性走向實用優越性
量子(zi)(zi)計(ji)算(suan)代表著下(xia)一代算(suan)力(li)的(de)(de)重要突破方向。在量子(zi)(zi)計(ji)算(suan)世界中,運(yun)算(suan)的(de)(de)基本(ben)單元是(shi)量子(zi)(zi)比特,它(ta)的(de)(de)基本(ben)狀(zhuang)態是(shi)0和1的(de)(de)疊加。對N個量子(zi)(zi)比特進(jin)行一次(ci)操(cao)作,相當于對經典比特進(jin)行2的(de)(de)N次(ci)方次(ci)操(cao)作。這體現(xian)了量子(zi)(zi)計(ji)算(suan)機的(de)(de)巨(ju)大運(yun)算(suan)潛力(li),可(ke)應用(yong)于模(mo)擬、優化、機器學習、密碼學等(deng)方向。
玻色量(liang)子(zi)創(chuang)始(shi)人兼CEO文(wen)凱分(fen)享說,光(guang)(guang)量(liang)子(zi)計(ji)(ji)算是(shi)商用(yong)化(hua)量(liang)子(zi)計(ji)(ji)算機(ji)的(de)新(xin)形態,目(mu)前正從(cong)空間光(guang)(guang)發展(zhan)到(dao)集成光(guang)(guang)學(xue)芯片(pian),從(cong)理論優越(yue)性走向實用(yong)優越(yue)性。比(bi)如中(zhong)科大(da)“九(jiu)章(zhang)(zhang)”去年研(yan)制的(de)113個光(guang)(guang)量(liang)子(zi)的(de)“九(jiu)章(zhang)(zhang)2.0”完成了高斯玻色采樣計(ji)(ji)算實驗(yan),比(bi)經(jing)典超級計(ji)(ji)算機(ji)快了大(da)約10的(de)24次方倍(bei),驗(yan)證了量(liang)子(zi)計(ji)(ji)算的(de)理論優越(yue)性。近年來,北京(jing)大(da)學(xue)王劍威團隊、美國(guo)PsiQuantum公司,加拿大(da)Xanadu公司等都進行(xing)了光(guang)(guang)量(liang)子(zi)計(ji)(ji)算芯片(pian)化(hua)的(de)相關探(tan)索。

▲玻色(se)量子創始人兼(jian)CEO文(wen)凱
創立(li)于2020年底的(de)玻色量(liang)(liang)子是一支來(lai)自斯坦福大(da)學(xue)、麻省(sheng)理工(gong)、清華大(da)學(xue)、中科院等學(xue)府的(de)團隊,多年研究(jiu)基于DOPO(簡并(bing)光學(xue)參量(liang)(liang)振(zhen)蕩器(qi))的(de)相(xiang)干量(liang)(liang)子計(ji)算方案,并(bing)在(zai)量(liang)(liang)子神經元生成芯(xin)片、通用(yong)光量(liang)(liang)子計(ji)算芯(xin)片等方向展(zhan)開了攻(gong)關。
目(mu)前,玻色量(liang)子已推出第一(yi)代(dai)“天工(gong)”光(guang)量(liang)子計算驗證平(ping)臺,在(zai)(zai)國內首次(ci)實現25節(jie)點任意相連可編程的MAX-CUT問(wen)題的優(you)(you)化求解驗證,能在(zai)(zai)50微秒(miao)內在(zai)(zai)3000多萬種(zhong)可能性中篩選出4個最優(you)(you)解之一(yi)。在(zai)(zai)商業化場景應用上,玻色量(liang)子在(zai)(zai)金融、交通、生(sheng)物制藥等(deng)方面(mian)也都實現了突破。
結語:AI芯(xin)片(pian)長(chang)坡(po)厚雪(xue),奔向(xiang)智能計(ji)算未來
至(zhi)此(ci),GTIC 2022全球AI芯片峰會圓滿收官。
在這場AI芯(xin)(xin)片(pian)盛(sheng)宴上,我們看到(dao)技術(shu)創新的力量依然熠熠生輝,從競逐有(you)效算力到(dao)聚焦解決現實問(wen)題,許多創新方案提(ti)供了更多破解AI芯(xin)(xin)片(pian)瓶(ping)頸的差異化思路,多個(ge)創業團隊積淀的AI芯(xin)(xin)片(pian)實力也開始(shi)厚積薄發。
同(tong)時,我們也看到,無(wu)論是大算(suan)(suan)力還是小算(suan)(suan)力的AI芯片,無(wu)論是相對成熟的領域專用(yong)架(jia)構、通用(yong)GPU,還是存算(suan)(suan)一體、類腦計算(suan)(suan)、光子計算(suan)(suan)、量子計算(suan)(suan)等前沿技術路線,都有越來越多的高性能(neng)產品(pin)走向規(gui)模化量產與(yu)商(shang)用(yong)落地。
隨著(zhu)疫情得到有(you)效控制,行(xing)業秩序逐步(bu)恢(hui)復,面對智能化(hua)、數(shu)字化(hua)、電動化(hua)帶來的海量數(shu)據(ju)計算需(xu)求,承(cheng)載著(zhu)智能計算核心動力的AI芯(xin)片產業,繼續快速奔跑,未來市場發展空間廣闊。
我(wo)們希望GTIC 2022全球AI芯片峰(feng)會成為前沿技術交流和產業(ye)落地對接的平臺,通(tong)過(guo)邀請各條(tiao)細分(fen)賽道極(ji)具代表性(xing)的AI芯片企業(ye)們同(tong)(tong)臺,共同(tong)(tong)譜出AI芯片產業(ye)的最(zui)強音。
預告:GTIC另一場產業峰(feng)會(hui),2022全(quan)球自動(dong)駕駛(shi)峰(feng)會(hui),也將于(yu)近期(9月27日(ri))在深(shen)圳舉行,敬請(qing)關(guan)注。