国产人妻精品区一区二区,国产农村妇女毛片精品久久,JAPANESE日本丰满少妇,日本公妇理伦a片,射精专区一区二区朝鲜

萬字回顧首屆中國AI算力大會!15+位大咖主會場演講精華爆棚,來沒來都值得收藏
作者 | 創始人(ren)2025-07-01


6月26日,一場干貨爆棚的(de)AI算力盛會,在北京燦爛盛夏中熱(re)烈召開。

以大模型、生成式AI為代表的新一輪人工智能浪潮的(de)滾(gun)滾(gun)向前,催(cui)生(sheng)出前所(suo)未有的(de)AI算(suan)力(li)需求,算(suan)力(li)是(shi)數字經濟時代的(de)新質生(sheng)產力(li),更是(shi)人工智能發展的(de)基石(shi)。

2025年(nian),以DeepSeek為代表的國(guo)產大模(mo)型強勢突圍,在全球引(yin)爆(bao)部署熱潮(chao)和AI應用開發(fa)熱潮(chao),也給國(guo)內(nei)AI算力市場注入新的活力,推動(dong)AI推理算力需求暴漲,超(chao)大規模(mo)集群鱗次櫛比,而需求的爆(bao)發(fa)也帶來諸多(duo)挑(tiao)戰(zhan),醞釀新的行(xing)業(ye)變化。

為此,我們發(fa)起了一場聚焦前沿技術與(yu)產業趨勢的夏日AI聚會——2025中國AI算力大會。

從(cong)國產AI算力(li)(li)的(de)(de)突圍(wei)與崛起,到智(zhi)算中心深層(ceng)軟硬(ying)件技術創新(xin)解(jie)決算力(li)(li)落(luo)地產業難題(ti),近30位重量級嘉賓與會帶來致辭、報告、演講和(he)對話,全方位解(jie)構DeepSeek引爆的(de)(de)AI算力(li)(li)變局,全場(chang)金句(ju)頻頻,各路大佬觀點持續碰(peng)撞擦出火花,現場(chang)參會人數(shu)超過850人。

在會場外的展區(qu),Alluxio、研惠通、惠普、白(bai)山云科(ke)(ke)技、中昊芯英、中科(ke)(ke)加禾、科(ke)(ke)華數據(ju)、行(xing)云集成電路等8家企業亮出了他們的最新(xin)技術和產品,展區(qu)人頭攢動,交流(liu)熱(re)情氛圍濃(nong)厚。

萬字回顧首屆中國AI算力大會!15+位大咖主會場演講精華爆棚,來沒來都值得收藏

▲展區

由智(zhi)(zhi)(zhi)一科技旗下智(zhi)(zhi)(zhi)猩猩與智(zhi)(zhi)(zhi)東(dong)西(xi)共(gong)同(tong)發起主(zhu)辦、芯東(dong)西(xi)協辦的首屆AI算(suan)(suan)力(li)大會(hui),圍(wei)繞AI算(suan)(suan)力(li)產業(ye)變(bian)局與創新、AI推(tui)理(li)算(suan)(suan)力(li)、智(zhi)(zhi)(zhi)算(suan)(suan)中心、智(zhi)(zhi)(zhi)算(suan)(suan)集(ji)群(qun)異構混(hun)訓、超節點(dian)等話題設置議程,主(zhu)會(hui)場(chang)(chang)包括高峰論壇(tan)、AI推(tui)理(li)算(suan)(suan)力(li)專題論壇(tan)和智(zhi)(zhi)(zhi)算(suan)(suan)中心專題論壇(tan);分會(hui)場(chang)(chang)為閉門制,組(zu)織了(le)智(zhi)(zhi)(zhi)算(suan)(suan)集(ji)群(qun)異構混(hun)訓技術研討會(hui)、超節點(dian)技術研討會(hui)。

▲聯想(xiang)集團Game of AI科(ke)普視頻(pin)在大會(hui)展播:聯想(xiang)海神全液冷解決方(fang)案(an),革命性提升(sheng)AI推理時(shi)代算力(li)

智一科技聯合創始人、CEO龔倫(lun)常在大會致辭環節(jie)宣布:中國AI算力大會正式成(cheng)為(wei)“智領未來”北京人工(gong)智能系列品牌活動之一。

“智領未來”是北(bei)(bei)京(jing)市科委、中關村管委會(hui)打造的北(bei)(bei)京(jing)市人工智能領域的活動(dong)品牌。同樣作為“智領未來”北(bei)(bei)京(jing)人工智能系列品牌活動(dong)之一的中國生成式AI大會(hui)已于今年4月(yue)1日-2日圓滿舉行(xing)。

龔倫常還預告了將于下半年舉行的兩場大型品牌活動:9月在上海舉辦第七屆全球AI芯片峰會(hui),11月在深圳(zhen)舉辦2025中國具身(shen)智能(neng)機器人大(da)會(hui)。

▲智一科技(ji)聯合(he)創始(shi)人、CEO龔倫常

智(zhi)(zhi)(zhi)算(suan)集群異構混訓、超節點(dian)兩場技(ji)(ji)術研(yan)(yan)討(tao)會(hui)(hui)在(zai)分會(hui)(hui)場圓(yuan)滿(man)舉辦。壁仞(ren)科技(ji)(ji)AI軟件首(shou)席架(jia)構師丁云帆、中(zhong)國移動(dong)研(yan)(yan)究院網絡與IT技(ji)(ji)術研(yan)(yan)究所(suo)技(ji)(ji)術經理班有容、北(bei)京(jing)智(zhi)(zhi)(zhi)源人工(gong)智(zhi)(zhi)(zhi)能(neng)研(yan)(yan)究院AI框(kuang)架(jia)研(yan)(yan)發負(fu)責(ze)人敖(ao)玉龍、上(shang)海人工(gong)智(zhi)(zhi)(zhi)能(neng)實驗室編(bian)譯計算(suan)與國產化(hua)團隊負(fu)責(ze)人裴芝林、商湯大裝置技(ji)(ji)術產品(pin)總監劉(liu)葉楓在(zai)智(zhi)(zhi)(zhi)算(suan)集群異構混訓技(ji)(ji)術研(yan)(yan)討(tao)會(hui)(hui)做(zuo)了報告分享(xiang)。

阿里(li)云基礎設施異構硬件和系(xi)統及解決方案資深總監盧曉偉、中國移動(dong)研究院網(wang)絡與IT技(ji)(ji)術研究所(suo)技(ji)(ji)術經理王鵬、奇異摩(mo)爾首席網(wang)絡架構專家葉棟、曦智(zhi)科技(ji)(ji)聯合創始人(ren)兼首席技(ji)(ji)術官孟懷宇圍繞(rao)超節(jie)點(dian)進(jin)行了不(bu)同視角的報告分享。中信建投證券科技(ji)(ji)行業首席分析師閻貴(gui)成主(zhu)持了超節(jie)點(dian)技(ji)(ji)術研討會及圓桌Panel。

萬字回顧首屆中國AI算力大會!15+位大咖主會場演講精華爆棚,來沒來都值得收藏

▲分會場

接下來(lai)我們將為大家帶(dai)來(lai)主會場三大論壇(tan)15+位(wei)分享嘉賓的(de)演講和對(dui)話精(jing)華(hua)。

一、高峰論壇:從千芯節點到千億大模型,國產AI芯片生態迸發旺盛活力

AI已成為數(shu)據(ju)中心增長(chang)的(de)核心驅動(dong)力。大(da)模(mo)型迭代(dai)拉動(dong)算力需求暴增,推(tui)動(dong)計(ji)算、存儲(chu)、網絡基礎設(she)施全面升級(ji)。在(zai)大(da)模(mo)型訓練與部署需求旺盛(sheng)的(de)背景下(xia),如(ru)何更充分(fen)地利用閑(xian)置算力,國產AI芯片發展到了怎樣的(de)新階段,有哪些優化大(da)模(mo)型推(tui)理效果的(de)創新技術?6位嘉賓分(fen)享了他們對產業最新風向的(de)觀察與探索。

1、信通院陳屹力:“算力荒”與“算力閑置”共存,算力互聯互通、AI云成焦點

中(zhong)國信息通信研究院(yuan)云(yun)大(da)所副總工程(cheng)師陳屹力談道,當下(xia)AI大(da)規模應用促使智能算(suan)力需(xu)求激增,AI 云(yun)成為全球AI浪(lang)潮角逐(zhu)的(de)焦點。其中(zhong)AI云(yun)基(ji)礎設(she)施需(xu)覆蓋異構高效調(diao)度能力、一(yi)云(yun)多模能力、專家(jia)知識大(da)腦等多方面。AI云(yun)平臺推動(dong)AI應用的(de)智能、便捷(jie)構建,提升(sheng)國際(ji)影響(xiang)力、助力生態繁(fan)榮。

隨(sui)任務(wu)型智算(suan)(suan)應用(yong)(yong)興(xing)起,對算(suan)(suan)力(li)資源的(de)定(ding)位、調(diao)度、部署效率提出更高要(yao)求。中國信通(tong)院聯(lian)(lian)合產業各(ge)方(fang)(fang)探(tan)索(suo)構建(jian)算(suan)(suan)力(li)互聯(lian)(lian)網(wang),積(ji)極推進(jin)算(suan)(suan)力(li)標識、算(suan)(suan)力(li)調(diao)度、傳輸協(xie)議(yi)、應用(yong)(yong)適配(pei)等(deng)方(fang)(fang)面技術研(yan)究,加快現有算(suan)(suan)力(li)“局域網(wang)”間互聯(lian)(lian)互通(tong),逐(zhu)步建(jian)立標準(zhun)體系,形(xing)成算(suan)(suan)力(li)互聯(lian)(lian)網(wang)體系架構,核(he)心解(jie)決(jue)算(suan)(suan)力(li)“找調(diao)用(yong)(yong)”挑戰,逐(zhu)步形(xing)成具備智能感知(zhi)、實時發現、隨(sui)需獲取的(de)算(suan)(suan)力(li)互聯(lian)(lian)網(wang)。

▲中(zhong)國信息通信研究院(yuan)云大所(suo)副總工程師(shi)陳屹力

2、摩爾線程王華:算力需求千倍增長,大集群和FP8成為強需求

摩爾線(xian)程副總裁王(wang)華引用了(le)一(yi)些研(yan)究數據:2020至2025年(nian)間,大模(mo)型訓練的算力需(xu)求提升(sheng)近(jin)1000倍 ,驅動力來自參(can)數規模(mo)與數據量雙向增長(chang)。以DeepSeek-V3為例(li),其訓練所需(xu)算力達102?級別,在(zai)萬卡集(ji)群(qun)上可將(jiang)訓練時間壓(ya)縮(suo)至13天(tian)內完成 。

為應對(dui)算(suan)力(li)需(xu)求(qiu),摩爾線(xian)程提(ti)供包(bao)括FP8在(zai)內(nei)的(de)全精(jing)(jing)度(du)算(suan)力(li),有效(xiao)(xiao)支持(chi)混(hun)合精(jing)(jing)度(du)訓練(lian),大幅(fu)提(ti)升訓練(lian)效(xiao)(xiao)率;部署(shu)萬(wan)卡集群,研發完整的(de)軟硬件棧,提(ti)供開箱(xiang)即(ji)用(yong)的(de)產品,快(kuai)速滿足大模(mo)型(xing)訓練(lian)的(de)算(suan)力(li)需(xu)求(qiu);打造豐富的(de)集群監(jian)控和診斷能力(li),針對(dui)大規模(mo)集群實(shi)現分鐘級故障定位(wei)。

此外,摩爾線程(cheng)構(gou)建(jian)了支持FP8、BF16、FP32等(deng)數據類型的(de)混(hun)合精(jing)度訓練方案,開源Torch-MUSA、MT-MegatronLM與(yu)(yu)MT-TransformerEngine等(deng)大模型訓練組件,已完(wan)成DeepSeek-V3的(de)混(hun)合精(jing)度訓練復(fu)現。在多個模型上(shang)的(de)實(shi)驗結果(guo)表(biao)明,其方案整體性能提升可達20%–30%,訓練精(jing)度與(yu)(yu)業界主流保(bao)持一(yi)致(zhi)。

▲摩(mo)爾線程副(fu)總裁王華(hua)

3、中昊芯英楊龔軼凡:解讀TPU架構創新設計,國產AI芯片如何抓住本土機遇

中昊芯英創始人(ren)、CEO楊龔(gong)軼凡談道,AI專用(yong)芯片(pian)是AI Infra的(de)必(bi)然發展(zhan)(zhan)趨勢,TPU架構(gou)為AI大(da)模型而生,采用(yong)多維度計算單元來優(you)化數據復用(yong),提高計算效率,并通過更激進(jin)的(de)數據傳輸策略(lve)和(he)更小的(de)控(kong)制單元,給片(pian)上存(cun)儲器(qi)和(he)運算單元留下更大(da)空間(jian),其可擴展(zhan)(zhan)性也更適合超大(da)規模計算。

中昊芯英全(quan)自研高(gao)性能(neng)(neng)TPU架構AI芯片“剎(cha)那(nei)(nei)”于2023年已成功流片并實現量產,其計算性能(neng)(neng)較海(hai)外某知名GPU芯片提升近1.5倍。基于“剎(cha)那(nei)(nei)”的高(gao)性能(neng)(neng)AI服務器(qi)及大(da)規(gui)模(mo)(mo)AI計算集群“泰則(ze)”,支(zhi)持1024卡高(gao)速互聯,可支(zhi)撐超千億(yi)參(can)數大(da)模(mo)(mo)型計算。

隨著大模型成本下移,AI芯片架(jia)構開(kai)始深度適(shi)配動態(tai)稀疏計算范式,形成“算法(fa)定(ding)義硬件”的(de)新研發模式。降(jiang)低(di)對CUDA生態(tai)的(de)依賴后,國(guo)產(chan)Al芯片將通過提供定(ding)制化工具(ju)鏈(lian)、優化編譯器等方式,在(zai)架(jia)構設計上更加(jia)靈活適(shi)應新的(de)本土趨勢和需(xu)求。

▲中(zhong)昊(hao)芯英創始人、CEO楊龔(gong)軼凡

4、魔形智能徐凌杰:大模型需要“千芯”超節點,未來架構有五大關鍵因素

魔(mo)形智能科技創始(shi)人(ren)、CEO徐凌杰幽默開場:“過去十年(nian),中(zhong)國最值(zhi)錢(qian)的(de)是(shi)(shi)房(fang)地產(chan)(chan)行業。未來最值(zhi)錢(qian)的(de),可能還是(shi)(shi)房(fang)地產(chan)(chan),只不(bu)過住的(de)不(bu)是(shi)(shi)人(ren),而(er)是(shi)(shi)機(ji)器。”

研(yan)究數(shu)據(ju)顯示(shi),全球數(shu)據(ju)中心總耗(hao)電(dian)量與單個發達國家(jia)相(xiang)當(dang)。更強的大模型(xing)需要(yao)大集(ji)群,更快的大模型(xing)需要(yao)超(chao)(chao)節(jie)點,更大的高(gao)帶(dai)寬互聯(lian)域是超(chao)(chao)節(jie)點設計的核心。當(dang)前(qian)算(suan)(suan)力密度遠不夠高(gao),要(yao)達到與人腦相(xiang)當(dang)的算(suan)(suan)力密度,需要(yao)構建“千(qian)芯”超(chao)(chao)節(jie)點,構建可重(zhong)構的AI算(suan)(suan)力中心。

如何構(gou)建千(qian)芯互連(lian)網(wang)絡?徐(xu)凌杰總結(jie)了未(wei)來超(chao)(chao)節點架(jia)構(gou)的5大關(guan)鍵因素:超(chao)(chao)高密度算力節點,千(qian)芯多(duo)機柜級聯背板連(lian)接,800V供電(dian)輸入(ru),交(jiao)換芯片全(quan)互聯,全(quan)覆蓋式(shi)冷卻。

他還分享了下一代算力基礎設施對芯片(pian)提(ti)出的3大要求:板級&封裝級靈活組合與解耦,整合光電共封裝設計,Cluster First的產品理念。軟硬協同將釋放超(chao)大集群(qun)的潛力。

▲魔(mo)形(xing)智能科技創始人、CEO徐凌杰(jie)

5、中科加禾崔慧敏:AI編譯優化躍升推理性能,有效擴展國產AI芯片生態

中(zhong)國科學院計算技術研(yan)究(jiu)所研(yan)究(jiu)員、中(zhong)科加禾(he)創(chuang)始人崔慧(hui)敏談道,大(da)模型推理私有化(hua)部署需求大(da)漲,但面臨硬件繁多(duo)、需求多(duo)元(yuan)、多(duo)模部署等多(duo)重挑戰。

中(zhong)(zhong)科加禾圍繞(rao)編譯優化(hua)構建大(da)(da)模型推(tui)理的引擎和軟件棧,積(ji)累了大(da)(da)量(liang)實踐案例:在(zai)推(tui)理引擎中(zhong)(zhong)實施深度顯存(cun)優化(hua),有(you)效(xiao)提高顯存(cun)利用率;在(zai)大(da)(da)規模推(tui)理中(zhong)(zhong)實現多維(wei)并行(xing)策略,有(you)效(xiao)利用計(ji)算(suan)、訪存(cun)、通信資(zi)源(yuan);基于多項聯合優化(hua),推(tui)理技術在(zai)某互聯網(wang)廠(chang)商合作中(zhong)(zhong)將QPS提升50%以上(shang),并在(zai)昇(sheng)騰910B平臺(tai)私有(you)化(hua)部(bu)署場景下有(you)效(xiao)支持128K長上(shang)下文。

長期(qi)來看,基(ji)于AI編譯技(ji)術,構建一套底(di)層公(gong)共的編譯支撐,能夠長期(qi)有(you)效(xiao)解決AI生態碎片化及(ji)生態融(rong)合(he)問(wen)題。

▲中國科學院計算技術研究所研究員(yuan)、中科加(jia)禾(he)創(chuang)始人崔慧(hui)敏

6、趨境科技陳祥麟:千億大模型的異構推理新路徑

趨境科(ke)技(ji)(ji)技(ji)(ji)術負責人陳祥麟分(fen)享(xiang)了(le)大模(mo)(mo)型(xing)推(tui)理(li)的技(ji)(ji)術創新。他認(ren)為(wei)大模(mo)(mo)型(xing)私有化推(tui)理(li)架構(gou)將(jiang)從傳統的以GPU為(wei)中心轉向全系統異構(gou)協(xie)同(tong),需要(yao)充分(fen)提(ti)升算(suan)力利(li)用率。

團(tuan)隊首創全(quan)系統異構協同與以存換算(suan)技(ji)術,充分利(li)用底層GPU、CPU、存儲等硬件設備算(suan)力(li),通(tong)過基于(yu)計算(suan)強度(du)的offload策(ce)略、CPU/GPU的高性能算(suan)子改造、MTP等算(suan)力(li)優化方(fang)法,以及(ji)prefix cache等融合(he)推(tui)理(li)策(ce)略,提升全(quan)系統算(suan)力(li),將大模型推(tui)理(li)門(men)檻降低至1/10。

趨(qu)境(jing)科(ke)技與清華KVCache.AI團隊共(gong)同開(kai)源的異(yi)構推(tui)理(li)框架KTranformers,能夠利用單(dan)張消費(fei)級GPU+CPU異(yi)構推(tui)理(li)DeepSeek-671B-r1/v3,decode速度最高達到20+ tokens/s。

同時參與月之(zhi)暗面(mian)、清華MADSys實(shi)驗室等多個產學研機(ji)構開(kai)源的項目(mu)Mooncake,以(yi)超大(da)規模(mo)KVCache緩存池為中心(xin),通過以(yi)存換算(suan)的創新理念大(da)幅度(du)減少算(suan)力開(kai)銷,顯著提升了(le)推理吞吐(tu)量。

▲趨境科技研發負(fu)責人(ren)陳祥(xiang)麟(lin)

二、高端對話:國產AI算力的突圍與崛起,中美差距正逐步縮小

以《國產AI算力的突圍與崛(jue)起(qi)》為(wei)主(zhu)題的高端對話,由智一科技聯合創始(shi)人(ren)(ren)、智車芯產媒矩陣總編輯張國仁主(zhu)持(chi),中昊(hao)芯英創始(shi)人(ren)(ren)兼(jian)CEO楊龔軼凡,魔(mo)形智能(neng)科技創始(shi)人(ren)(ren)、CEO徐(xu)凌杰,中科加禾聯合創始(shi)人(ren)(ren)兼(jian)CTO陳(chen)龍三位嘉賓進(jin)行分(fen)享(xiang)。

張國仁談道,從2018年(nian)AI芯片峰(feng)會(hui)到如今(jin)AI算力(li)峰(feng)會(hui),他感觸最深的是國內企業對(dui)自己的產品、公司發(fa)展都(dou)表現得愈發(fa)云淡風輕。

▲智一科技聯(lian)合創始人、智車芯產媒(mei)矩陣總編輯張國仁

1、國產算力與全球差距仍然存在

面對國產算力在(zai)全(quan)球發(fa)展(zhan)中的地位,陳龍談道(dao),國內廠商已掌(zhang)握算力底層(ceng)技術(shu),但在(zai)PyTorch等主流訓練框架適配方面仍處(chu)于(yu)跟隨、陪(pei)跑階段(duan)。

楊龔軼(yi)凡從(cong)硬(ying)件的(de)設計(ji)(ji)和生產(chan)兩(liang)方面進行(xing)了(le)比較:生產(chan)差距存在,但預(yu)測(ce)將在3-5年內逐步縮小(xiao);而(er)在設計(ji)(ji)層面,從(cong)學術研究(jiu)、論(lun)文創新(xin)性等(deng)角度看,設計(ji)(ji)的(de)差距更大。隨著模型算法收斂(lian),更多(duo)創新(xin)型架構、設計(ji)(ji)出現,國(guo)外諸多(duo)路線已(yi)發(fa)展到產(chan)品落地,國(guo)內廠商需要共同拓展生態。

▲中昊芯英創始(shi)人兼CEO楊龔軼(yi)凡(fan)

徐凌杰認為,在(zai)如何(he)做優秀的GPU、如何(he)搭(da)建生態、如何(he)做集群(qun)等方(fang)面,中美(mei)認知(zhi)差距正不斷縮小。但實際產(chan)業中,差距進一步擴(kuo)大,企業需要從底層供應(ying)鏈突破。

2、算力仍是資源導向型市場

對(dui)于國(guo)產算力的市場化,徐凌(ling)杰判斷,政(zheng)府、資源導向型的現(xian)狀未來幾年不(bu)會有(you)很大(da)改變,芯(xin)片晶(jing)圓、制程以及芯(xin)片創企在(zai)國(guo)產生態中(zhong)的成(cheng)長,都(dou)需要(yao)政(zheng)府扶(fu)持(chi)。芯(xin)片公(gong)司的機會是通過(guo)更強互聯、集群(qun)打造(zao)差異化,找到(dao)商業化落腳點。

楊龔軼凡同樣(yang)認為,資源導(dao)(dao)向型走向市(shi)場導(dao)(dao)向型是一個過程(cheng),在半導(dao)(dao)體行業(ye),老的生(sheng)(sheng)產(chan)(chan)(chan)制程(cheng)永遠比新的生(sheng)(sheng)產(chan)(chan)(chan)制程(cheng)性(xing)價比低(di),生(sheng)(sheng)產(chan)(chan)(chan)制程(cheng)每迭代一次會(hui)有4倍的性(xing)價比提升,這(zhe)就(jiu)導(dao)(dao)致純國(guo)產(chan)(chan)(chan)芯(xin)片(pian)的性(xing)價比更低(di),需要政府扶持拉通生(sheng)(sheng)產(chan)(chan)(chan)工(gong)藝的產(chan)(chan)(chan)業(ye)鏈。

陳龍從應用層面進行分析(xi),談到國家的(de)扶持(chi)很必要,企業通過軟硬件優化降低了部署成本,但消費(fei)側拉(la)動(dong)還不(bu)夠強(qiang),現(xian)狀是上一(yi)代芯(xin)片尚(shang)沒有完全落地(di)應用,下一(yi)代芯(xin)片已(yi)經出來了,因(yin)此核心是要發(fa)掘更有價值的(de)應用。

▲中科加禾聯合創(chuang)始人兼CTO陳龍

3、專用芯片、編譯技術、超節點,是未來發展方向

楊龔軼(yi)凡堅(jian)信專(zhuan)用芯片(pian)是未(wei)來的發展方向(xiang),在通用性(xing)需求大幅降(jiang)低的情況下,可以(yi)拋棄(qi)部分通用性(xing),增加芯片(pian)核心的性(xing)能和性(xing)價比。越專(zhuan)越好,是在滿足(zu)一定可控性(xing)和變化下的結果(guo)。

圍繞編譯技術在解決(jue)國產(chan)芯片面(mian)臨的(de)(de)風險,陳龍認為(wei)(wei),它是(shi)將專(zhuan)家的(de)(de)經驗泛化(hua)、普適化(hua)的(de)(de)一種技術手段。編譯技術最開(kai)始產(chan)生是(shi)為(wei)(wei)了(le)彌補人(ren)的(de)(de)思(si)維和機器能接(jie)受信息之(zhi)間的(de)(de)鴻溝,使開(kai)發效率提升上百倍。

徐凌杰著(zhu)重(zhong)談(tan)到超節(jie)點的(de)發展方(fang)向,在(zai)大(da)(da)模型領域,類似MoE的(de)創新結合(he)超節(jie)點會(hui)有更(geng)大(da)(da)收益(yi),即更(geng)大(da)(da)的(de)問題用更(geng)大(da)(da)的(de)集群(qun)(qun)解決,更(geng)大(da)(da)的(de)集群(qun)(qun)反哺系統,從而做出更(geng)大(da)(da)的(de)模型。

萬字回顧首屆中國AI算力大會!15+位大咖主會場演講精華爆棚,來沒來都值得收藏

▲魔形智能科技創始(shi)人(ren)、CEO徐凌(ling)杰

4、算力產業格局未定

談到全(quan)球算力產業的(de)產業格局(ju),陳龍認為(wei),雖(sui)然國(guo)內巨頭有積累優勢,但(dan)產業規模(mo)足夠(gou)大,且需求多元化,將來企業將百花齊(qi)放。

楊龔軼凡的觀點更為激(ji)進:首(shou)先,3-5年(nian)內形成產業(ye)格(ge)局(ju)(ju)的可能性不高,目前仍是(shi)企業(ye)相互(hu)競爭、高速(su)發展(zhan)變革的過程;其次(ci),資源(yuan)型市(shi)場的天然屬性決定了其很難形成壟斷,且巨頭(tou)穿越周期能力弱,因(yin)此AI產業(ye)爆(bao)發后市(shi)場格(ge)局(ju)(ju)會(hui)洗牌(pai),初創公司(si)或許會(hui)通(tong)過更好的組織形式去適應(ying)產業(ye)發展(zhan)。

行業的重要性、資本周期發(fa)展對(dui)產業發(fa)展都會(hui)(hui)有(you)影響。徐(xu)凌杰相信(xin),算力變得(de)越(yue)來越(yue)有(you)吸引力,自然會(hui)(hui)有(you)更多的錢涌入,會(hui)(hui)出現巨(ju)頭被沖(chong)擊、新(xin)生勢力冒出的場景。創企和巨(ju)頭需要找準自己(ji)的定位,通過“整合(he)”變成更強實(shi)體可能是一條發(fa)展路徑。

如今中國(guo)(guo)(guo)算(suan)力(li)規模(mo)已在全球排名第二,被預(yu)測(ce)有望影響(xiang)全球AI 競賽格局(ju)(ju)。陳龍(long)認為,AI算(suan)力(li)市場規模(mo)和國(guo)(guo)(guo)家GDP發展成(cheng)正比關系,當(dang)國(guo)(guo)(guo)家GDP反超或許是國(guo)(guo)(guo)產算(suan)力(li)格局(ju)(ju)更進一(yi)步的機(ji)會。楊龔軼凡提(ti)到投(tou)入(ru)產出(chu)比,目前美國(guo)(guo)(guo)和中國(guo)(guo)(guo)算(suan)力(li)開銷(xiao)差10倍,當(dang)投(tou)入(ru)量逐步趕(gan)上才會有變(bian)化(hua)。徐凌杰認為未來當(dang)AI賦(fu)能千行(xing)百業,算(suan)力(li)真正變(bian)成(cheng)生產力(li)時,就是一(yi)個巨(ju)大的機(ji)會。

三、專題論壇:從軟硬協同到端邊云協同,底層技術創新突破AI算力瓶頸

下午(wu)場火熱繼(ji)續(xu),在(zai)AI推理算力專題(ti)論(lun)壇和智算中(zhong)心專題(ti)論(lun)壇中(zhong),來(lai)自行(xing)云集(ji)成電路(lu)、安謀科技、實在(zai)智能、白山云科技、Alluxio、浩云長盛(sheng)集(ji)團(tuan)、上海(hai)矩向科技、趨動科技的8位嘉(jia)賓帶(dai)來(lai)了精彩(cai)演講。

如(ru)何(he)(he)突破大模型推理芯片的(de)(de)核心瓶頸、如(ru)何(he)(he)實(shi)現出色的(de)(de)端側模型性能?超大規模智算中心面臨的(de)(de)數據、成本(ben)功耗、算力利用率等方面的(de)(de)一系列難(nan)題(ti)要如(ru)何(he)(he)破解?我們都(dou)將找到答(da)案。

1、行云余洪敏:只有軟硬件協同創新才能突破大模型推理芯片的核心瓶頸

行云(yun)聯合創(chuang)始人、CTO余(yu)洪敏談(tan)道,高質量(liang)大模型最核心的需求就是極其變(bian)態的內存需求,既要帶(dai)寬,又要容量(liang)。推理芯(xin)片核心瓶頸有:顯存容量(liang),價格(ge)高昂,只(zhi)有通(tong)過軟硬(ying)件協同(tong)創(chuang)新才能解決。

行(xing)(xing)云致力(li)于把AI基礎設施(shi)從(cong)超(chao)(chao)算(suan)變成消(xiao)費電子競爭(zheng)(zheng),褐(he)蟻(yi)是第一個十萬元(yuan)級運行(xing)(xing)DeepSeek滿(man)血671B、FP8非量(liang)化且對(dui)話速度在(zai)20TPS以上的解決方(fang)案,用數(shu)量(liang)級碾壓(ya)的競爭(zheng)(zheng)力(li)讓全行(xing)(xing)業對(dui)AI超(chao)(chao)算(suan)祛(qu)魅。

近(jin)(jin)期行云(yun)將推出蟻群,實(shi)現500~1000有效并(bing)發下最高質量模型的流暢體驗,價格在300~400萬價位,接近(jin)(jin)DeepSeek公(gong)有云(yun)的性(xing)價比(bi)(bi);此(ci)外,計劃在明年年底(di)推出自研GPU芯片,相比(bi)(bi)褐(he)蟻性(xing)能將有數倍提升,集(ji)群化(hua)后,相比(bi)(bi)蟻群可以(yi)數倍提高有效并(bing)發。

▲行云(yun)集成電路聯(lian)合創始人、CTO余洪敏

2、安謀科技鮑敏祺:NPU如何助力端側設備突破內存、算力、功耗三堵墻?

安(an)謀科技產品總(zong)監鮑(bao)敏祺(qi)觀(guan)察到,端(duan)側設備(bei)正逐步承(cheng)擔更多AI計算(suan)任(ren)務,端(duan)側AI模(mo)型(xing)在算(suan)法迭代、上下文長度擴展和模(mo)型(xing)理解力(li)提升(sheng)等方面進(jin)展迅(xun)速(su)。

隨(sui)著模(mo)型的演進,端(duan)側AI硬件也面臨新的需求:一是算力需求持(chi)續(xu)增長,計算精(jing)度(du)從INT向FLOAT轉變,需通過多核協同實現算力提升;二是大模(mo)型對帶寬(kuan)要(yao)求更高,可通過提升數(shu)據本地化程度(du)減少數(shu)據傳輸距離,從而優(you)化能(neng)效(xiao)比(bi);三是需要(yao)優(you)化硬件中向量計算與矩陣計算的配(pei)比(bi)。

為(wei)應對“內存墻(qiang)”、“算(suan)力(li)墻(qiang)”和(he)“功耗墻(qiang)”三(san)大挑戰,安謀科技正升(sheng)級(ji)其(qi)自研(yan)“周易”NPU產(chan)品(pin),如擴展數據類型支持、新增(zeng)W4A16硬件加(jia)(jia)速和(he)DSA加(jia)(jia)速功能、提(ti)供(gong)更為(wei)豐(feng)富的算(suan)子庫等,持續驅(qu)動終端(duan)算(suan)力(li)躍遷,助力(li)產(chan)業把握端(duan)側AI“芯”機(ji)遇。

▲安(an)謀(mou)科(ke)技(ji)產品總監鮑敏祺

3、實在智能歐陽小剛:Agent端側性能超GPT-4o 10%,一體機30分鐘開箱部署

實在智能合伙人、核心(xin)算(suan)法(fa)負責人歐陽(yang)小(xiao)剛提到,算(suan)力需求與場景落地(di)的雙向倒逼(bi),正推(tui)動智能體技術(shu)端側(ce)的探索革(ge)新(xin)。

其公(gong)司行業首發的通(tong)用(yong)智能(neng)體(ti)“實(shi)(shi)在Agent”,專注跨(kua)系統、鏈接各類軟件的辦公(gong)流程自動化。其自研的實(shi)(shi)在TARS大模(mo)型和TARS-VL大模(mo)型分(fen)別在垂域任務理解(jie)(jie)性(xing)能(neng)超越GPT-4o達10個百分(fen)點,GUI多(duo)模(mo)態理解(jie)(jie)能(neng)力(li)領先3%,而通(tong)用(yong)能(neng)力(li)幾乎無(wu)損;同時,該(gai)模(mo)型支持(chi)私有(you)化部(bu)署,深度融合(he)RPA與(yu)智能(neng)體(ti)工作流,實(shi)(shi)現瀏覽器、桌面(mian)應用(yong)、移動端的無(wu)縫(feng)操(cao)作,支持(chi)一(yi)鍵流程編輯(ji)和智能(neng)體(ti)共享(xiang),降低30%重復開(kai)發成本。

歐陽小剛提到(dao)與惠(hui)普聯合打造的Z系(xi)列(lie)數字員工(gong)一體機(ji):基于HP Z8 Fury G5工(gong)作站,得益于四塊(kuai)NVIDIA 5880 Ada的強大算(suan)力,開箱30分鐘完成(cheng)部署,核心業務數據全程(cheng)本地處理(li)。

▲實在(zai)智能合(he)伙人、核心算法負責人歐陽小剛(gang)

4、 白山云科技李金鋒:以邊緣計算破解AI推理時延與成本難題

白山云科技智算產品研發負責人(ren)李金鋒談到,AI推(tui)理面臨網絡時延與成本挑(tiao)戰,對(dui)邊(bian)緣計算的需求日益(yi)增長。當前的云邊(bian)端(duan)架構(gou)依(yi)然適用:中心云集中計算,追(zhui)求性能極致優化(hua);邊(bian)緣云在靠近用戶處提供算力,作為重要補充,現可(ke)處理百億(yi)參數(shu)內大模型推(tui)理,顯(xian)著降低(di)時延;終端(duan)算力則在保(bao)障(zhang)數(shu)據(ju)隱私場景(jing)中發揮作用。

針(zhen)對邊緣云(yun)節(jie)(jie)點分散帶來(lai)的算力(li)管理難(nan)、任務調(diao)(diao)度(du)復(fu)雜(za)和單節(jie)(jie)點資源有限等挑戰,李(li)金鋒介(jie)紹可通(tong)過全網(wang)任務調(diao)(diao)度(du)、彈性算力(li)調(diao)(diao)度(du)、模(mo)型加(jia)載(zai)優(you)化(hua)及單節(jie)(jie)點推理性能優(you)化(hua)等方(fang)式解決(jue)。

依托覆蓋(gai)全球(qiu)的(de)1700多(duo)個具備計算、存儲、安(an)全能力的(de)數據節點及150多(duo)個海外運(yun)營(ying)商資源(yuan),白(bai)山云能輕松(song)升級(ji)GPU算力,有(you)力支(zhi)撐邊緣推理服務。

萬字回顧首屆中國AI算力大會!15+位大咖主會場演講精華爆棚,來沒來都值得收藏

▲白山云科(ke)技智(zhi)算產品研發負責人李金鋒

5、Alluxio傅正佳:用去中心化架構方案,解決AI數據湖困境

Alluxio首席架構師傅正佳談道,AI 數據(ju)全鏈路各環節面臨的(de)不(bu)同難(nan)題,以及環節間數據(ju)交互(hu)導致(zhi)的(de)資源浪費與效率低(di)下,其本質都是數據(ju)湖困境的(de)體現。

Alluxio介于分布式(shi)計算(suan)框架(jia)與(yu)存儲系(xi)統之間,可(ke)以(yi)做到對當前AI Infra“零改造無(wu)侵(qin)入”,并提升數據安全(quan)性(xing)(xing),還可(ke)以(yi)統一納管數據孤島,提供高性(xing)(xing)能緩存層。Alluxio采用去(qu)中心(xin)化(hua)架(jia)構,支持100億以(yi)上對象,能夠降低數據工程復雜度與(yu)成(cheng)本(ben),提升模型迭代效率與(yu)數據方(fang)向速度。

Alluxio的核(he)心技(ji)術(shu)包括協議轉換(huan)、數據緩(huan)存層以及虛擬(ni)數據湖等,可(ke)應用于智(zhi)駕、機器學(xue)習訓練、智(zhi)算(suan)、AI模型分發(fa)、科學(xue)計算(suan)等場景(jing)。基準測試顯示,其性(xing)能與全球頂尖并(bing)行系統持平,成(cheng)本(ben)更低,GPU利(li)用率可(ke)達95%及以上。

萬字回顧首屆中國AI算力大會!15+位大咖主會場演講精華爆棚,來沒來都值得收藏
▲Alluxio首(shou)席架構師(shi)傅正佳

6、浩云長盛趙亮:智算時代數據中心變革,液冷、超高壓直流成大勢所趨

浩云長(chang)盛集團(tuan)首席增長(chang)官(guan)(CGO)趙亮稱,隨著智(zhi)算時代的(de)到來,數據中心的(de)算力密(mi)度不(bu)斷提升,同時,大模型(xing)推(tui)(tui)理和訓推(tui)(tui)一(yi)體(ti)的(de)需求(qiu)也在增長(chang)。

這些變(bian)化(hua)對(dui)數(shu)據中心的(de)(de)供(gong)電和制冷系統提(ti)出了巨大(da)挑戰,設計和架構需要重(zhong)大(da)調整。如(ru)今,數(shu)據中心應配備(bei)更(geng)(geng)高的(de)(de)層(ceng)高和更(geng)(geng)強的(de)(de)承重(zhong)能力(li),以滿足密度的(de)(de)提(ti)升,隨之(zhi)而來(lai)的(de)(de)散熱問題(ti)讓液冷成為必然選擇。在(zai)電力(li)層(ceng)面,能夠(gou)減少(shao)能源(yuan)轉換(huan)損耗、提(ti)升電力(li)運營效率(lv)的(de)(de)高壓直流技術正(zheng)獲得廣(guang)泛采用。

此(ci)外,數據中心的選址也(ye)至關重要,需綜合考(kao)慮(lv)電(dian)力供應便(bian)(bian)利(li)性(xing)、運維(wei)便(bian)(bian)利(li)性(xing)、算力設備梯(ti)級利(li)用(yong)和實際應用(yong)場景,而非(fei)簡(jian)單(dan)地(di)(di)將其布局(ju)在(zai)能(neng)源成本較低的地(di)(di)區,因此(ci)把訓推一體智(zhi)算中心建設在(zai)一線城(cheng)市周邊更有優勢。

萬字回顧首屆中國AI算力大會!15+位大咖主會場演講精華爆棚,來沒來都值得收藏
▲浩(hao)云長盛集團首席增(zeng)長官(guan)CGO趙亮

7、矩向科技黃朝波:模算云破局算力浪費,毛利躍升超10倍

上海矩向科技創(chuang)始(shi)人兼CEO黃朝波(bo)指出,當(dang)前(qian)智(zhi)算(suan)中心深陷無序建設、架(jia)構(gou)封閉、遠離業務場景三重困(kun)局(ju),導致區域算(suan)力閑置(zhi)、資源(yuan)利用率(lv)不足。

傳統硬(ying)件堆砌模(mo)式已無法滿足(zu)AI爆發需(xu)求,唯有通(tong)過整合算(suan)力(li)(li)、模(mo)型與應用的(de)(de)模(mo)算(suan)云平臺重構(gou)價值鏈,將電力(li)(li)轉化為(wei)算(suan)力(li)(li)、模(mo)型力(li)(li),并(bing)深(shen)加工為(wei)應用賦能能力(li)(li),以此來實現算(suan)力(li)(li)服(fu)(fu)務毛利的(de)(de)躍遷。以3000P AI算(suan)力(li)(li)為(wei)例,服(fu)(fu)務毛利從智算(suan)中心的(de)(de)1億飆升至模(mo)算(suan)云的(de)(de)10多億,增幅超10倍。

模算(suan)云模式以輕資產實現高產出:政府可(ke)統籌閑置(zhi)算(suan)力賦能中(zhong)小企(qi)業(ye),企(qi)業(ye)可(ke)通過開箱即(ji)用的MaaS服務降低(di)(di)AI門檻(jian);技(ji)術(shu)上采用異構協同,國(guo)產芯片覆(fu)蓋80%計算(suan)量(liang),英(ying)偉達GPU兜底剩余(yu)需求,同時結合云邊端協同,進一步(bu)降低(di)(di)推理成本(ben),縮短業(ye)務落地周期(qi)。

萬字回顧首屆中國AI算力大會!15+位大咖主會場演講精華爆棚,來沒來都值得收藏
▲上海矩(ju)向(xiang)科技創(chuang)始(shi)人(ren)兼CEO黃朝(chao)波

8、趨動科技張增金:通用行業GPU利用率不足30%,軟件定義AI算力成必然趨勢

趨動科技技術(shu)總監張(zhang)增金指出,盡管(guan)生成式(shi)AI算力(li)市(shi)場熱度(du)高漲,但非生成式(shi)AI的(de)規模仍是其兩(liang)倍,從(cong)運(yun)營層面(mian)來看(kan),蘊藏著巨大的(de)收入潛力(li)(IDC 2025)。在(zai)國內眾多(duo)智算場景中(zhong),GPU平均利用率低至5%左右,主要原(yuan)因(yin)在(zai)于異構資源分配方式(shi)粗放、調度(du)機制缺失以及(ji)管(guan)理效率低下等問題。

采(cai)用軟件(jian)定(ding)義AI算力的模(mo)式(shi),通過軟件(jian)對(dui)算力基礎設施進行重新(xin)構(gou)(gou)建(jian),實現(xian)硬件(jian)資源(yuan)的按需(xu)動(dong)態調用,能夠有效解決當前(qian)異構(gou)(gou)硬件(jian)利用率低、調度(du)模(mo)式(shi)僵化等難(nan)題,避免因資源(yuan)管理不善(shan)而(er)引發的系統瓶頸。

張增金表示,未來(lai)(lai),軟(ruan)件定義將成為(wei)智算中心(xin)的關鍵發展方向。在一系列行業實踐中,趨動科技借助軟(ruan)件定義技術,助力某客戶(hu)將整體GPU平(ping)均(jun)利(li)用率(lv)(lv)從8%提升至(zhi)35%,峰(feng)值平(ping)均(jun)利(li)用率(lv)(lv)從15%躍升至(zhi)60%。目前,趨動科技已與(yu)數百(bai)家家來(lai)(lai)自運營商、金融、能(neng)源電力、制造業等(deng)領(ling)域的客戶(hu)展開了深度合作。

萬字回顧首屆中國AI算力大會!15+位大咖主會場演講精華爆棚,來沒來都值得收藏
▲趨動科技技術(shu)總(zong)監(jian)張增(zeng)金

結語:中國AI算力蓬勃向前,技術創新加速涌現

在中美博(bo)弈的(de)背(bei)景下(xia),國產(chan)大模型(xing)們強勢突(tu)圍,帶動(dong)了國內AI算(suan)力(li)需求的(de)持續增(zeng)(zeng)長(chang),算(suan)力(li)需求發生(sheng)結構性(xing)變化、推理算(suan)力(li)需求增(zeng)(zeng)速(su)遠超預期,中國AI算(suan)力(li)產(chan)業不斷(duan)迎來(lai)新的(de)機遇和挑(tiao)戰,諸多優(you)秀企業通過技術(shu)創(chuang)新破解算(suan)力(li)難題(ti),加速(su)AI的(de)產(chan)業化落(luo)地。

站在(zai)技術與產業(ye)共振的(de)歷(li)史節點,我們(men)每(mei)一(yi)個(ge)人,都正在(zai)見證和參與一(yi)場激(ji)動人心(xin)的(de)技術躍遷。隨著(zhu)Agent浪潮的(de)涌起、端側智(zhi)能的(de)加(jia)(jia)速(su)落地(di)、具身智(zhi)能的(de)覺醒、產業(ye)AI加(jia)(jia)速(su)賦(fu)能,AGI的(de)曙光正離(li)我們(men)越來越近。

中國AI算力(li)產業必將乘(cheng)著這(zhe)股勁流揚帆起航(hang),駛(shi)向更廣闊的AI星(xing)辰大海!


熱門文章
據估計,未來十年內,至少會有一家汽車制造商因網絡安全漏洞而造成市值減半的重大損失。萬物互聯可能會帶來越來越多的機遇,但所有利益相關者都希望確保這些機遇不會被不法分子利用而引發網絡安全攻擊。無論所處行業
2025-07-01
X