国产人妻精品区一区二区,国产农村妇女毛片精品久久,JAPANESE日本丰满少妇,日本公妇理伦a片,射精专区一区二区朝鲜

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏
作者 | 創(chuang)始人2025-04-08

智東西(公眾號:zhidxcom)
作者 | GenAICon 2025

4月1日-2日,一場全場干(gan)貨爆棚的生成式(shi)AI盛會,在北京圓滿舉行。

開(kai)年以(yi)來(lai),DeepSeek的異(yi)軍突起,改(gai)寫了(le)(le)中西大模(mo)型競爭敘(xu)事。生(sheng)成式AI似乎猛然沖(chong)進(jin)一個全(quan)新(xin)征程中,中國企業更是斗志昂揚地踴躍創新(xin),不僅領銜(xian)AI開(kai)源盛世,還掀起了(le)(le)新(xin)一輪模(mo)型部署與AI應用研發熱潮,在(zai)這(zhe)千載難逢的歷史機遇期(qi)全(quan)速沖(chong)鋒。

為(wei)此,我們發起了一(yi)場聚焦前沿技術與產業趨勢的春日(ri)AI聚會——2025中國生成(cheng)式(shi)AI大(da)會(北京站)。

大會以“大拐(guai)點 新(xin)征(zheng)程”為主題,兩天之內,超過50位(wei)產學研嘉(jia)賓密集輸出高(gao)濃度、高(gao)質量的干貨信息,深(shen)度解構DeepSeek引發的變革(ge)狂潮,全面(mian)展示覆蓋深(shen)度推理模(mo)型、多模(mo)態模(mo)型與(yu)世界(jie)模(mo)型、AI Infra(AI基礎設施(shi))、AIGC應(ying)用(yong)、Agents(智能體)、具身智能等領(ling)域的生(sheng)成式AI最新(xin)進展。

▲中國生成式(shi)AI大(da)會(hui)主會(hui)場開(kai)幕(mu)式(shi)、GenAI應(ying)用論壇、大(da)模型峰會(hui)、分會(hui)場技(ji)術研討會(hui)、展區人流密集

本屆大(da)會(hui)主會(hui)場(chang)舉(ju)辦開幕式(shi)、GenAI應用論壇(tan)、大(da)模(mo)型(xing)峰會(hui),分會(hui)場(chang)舉(ju)辦3場(chang)以DeepSeek R1與推理、AI智能體、具身智能大(da)模(mo)型(xing)為主題的技(ji)術研(yan)討會(hui),期間既有(you)同頻共振,又(you)有(you)激(ji)烈觀(guan)點交鋒,現場(chang)參會(hui)觀(guan)眾(zhong)超過(guo)1500人(ren)。

展區亦是人頭攢(zan)動,從(cong)早到晚(wan)充斥著熱切的交(jiao)流聲,Alluxio、Zenlayer、DriveNets、澳(ao)鵬數(shu)(shu)據、晴數(shu)(shu)智慧、中昊芯英(ying)、GMI Cloud、焱融科技、英(ying)博數(shu)(shu)科、華為云、研惠通、新(xin)(xin)晧誠科技、楓清科技、科華數(shu)(shu)據、首都(dou)在線、清智圖靈等16家(jia)企業帶來最新(xin)(xin)技術產(chan)品展示。

這已(yi)經是智(zhi)一(yi)科(ke)技旗下(xia)智(zhi)猩猩、智(zhi)東西共同發起中國(guo)生成(cheng)式AI大會(hui)的第四屆(jie),也(ye)是AI青(qing)年(nian)學者密度(du)最高的一(yi)屆(jie)。自2023年(nian)以(yi)來,大會(hui)累計吸引了數千(qian)人(ren)線下(xia)參會(hui),線上(shang)觀看人(ren)次更(geng)是超過1000萬,成(cheng)為(wei)國(guo)內AI領(ling)域(yu)最具(ju)影響力的產業峰會(hui)之一(yi)。

 ▲聯(lian)想(xiang)集團Game of AI科普視(shi)頻在大會(hui)展播:聯(lian)想(xiang)工廠制(zhi)造控(kong)制(zhi)塔(ta)MCT2.0,生成式AI在制(zhi)造業首次(ci)落(luo)地

智一科技聯合創始人、CEO龔倫常在致辭環節宣布:今年,中國生成式AI大會正式升級為“智領未來”北京人工智能系列品牌活動之一。

“智領未來”是北京市科委、中關村管委會打造的北京市人工智能領域(yu)的活(huo)動品(pin)牌。此(ci)外,同樣作為“智(zhi)領未來”北(bei)京(jing)人工智(zhi)能系列品(pin)牌活(huo)動之一的中國AI算(suan)力峰(feng)會將于(yu)今年6月(yue)在(zai)北(bei)京(jing)舉辦。

龔倫常還預告了將于今年舉辦的多個主題會議:4月底,中國汽車智能化創新峰會將在上海車展期間同步舉辦;9月,全球AI芯片峰會將(jiang)在上海舉辦(ban);11月,中國具身智(zhi)能機器人大會將(jiang)在深圳(zhen)舉辦(ban)。歡迎感興趣(qu)的朋友們關注。

▲智一科(ke)技聯合創始人、CEO龔倫常致辭(ci)

一、開幕式:突破大模型預訓練瓶頸,為AI應用爆發掃清障礙

進(jin)入2025年(nian),AI領域涌現(xian)哪些新關鍵(jian)詞?慢思考推理技術如何緩(huan)解(jie)大模(mo)型預(yu)訓(xun)練瓶頸?怎(zen)樣(yang)讓機器人操作交互像跳舞(wu)一樣(yang)絲(si)滑(hua)?Agents(智能體)落地企業需攻(gong)克哪些挑戰?國(guo)產算(suan)力怎(zen)么(me)解(jie)鎖萬卡集(ji)群(qun)難關?

在大(da)會首(shou)日(ri)開(kai)幕式上,產學研嘉賓(bin)圍繞(rao)深(shen)度推(tui)理模型、具(ju)身智(zhi)能機(ji)器人、AI智(zhi)能體、AI算力基(ji)礎設施、AI應(ying)用,分享(xiang)了(le)對最新技術思(si)(si)路與推(tui)動落地的觀察與思(si)(si)考(kao)。

1、人大趙鑫:慢思考推理技術如何緩解大模型預訓練瓶頸?

中國人(ren)(ren)民大學高瓴人(ren)(ren)工智能(neng)學院教授趙(zhao)鑫談道,大模(mo)型本(ben)質上是一個條(tiao)件概率生成模(mo)型,思維鏈(lian)會提升預(yu)測正確的(de)可能(neng)性。

當前訓練模型性能增(zeng)長(chang)會出現邊際效(xiao)益(yi)遞減,其中數據和算力(li)是探索擴展法則的主要限制,這(zhe)也是為何(he)當下(xia)需要慢思考推理(li)技術。

慢(man)思考推理(li)技(ji)術的基本思路(lu)是“搜(sou)索(suo)+學(xue)習”的結合,具體來看,包括(kuo)基于多次采樣的方(fang)法(fa)、基于樹(shu)搜(sou)索(suo)的方(fang)法(fa)、基于SFT(監督微調)的方(fang)法(fa)、基于RL(強化學(xue)習)的方(fang)法(fa)。

趙鑫教(jiao)授團隊在(zai)慢思考技術方(fang)面進(jin)行(xing)了(le)大量研究。在(zai)RL技術領域(yu),找到可驗證的訓(xun)練數據非常重要,團隊系統探(tan)索了(le)類R1模型(xing)的復(fu)現(xian)方(fang)法。

推(tui)理模(mo)型本質(zhi)上可以認(ren)為是(shi)一個(ge)具備逐(zhu)步(bu)推(tui)理/動作(zuo)規劃的“大腦”,未來推(tui)理模(mo)型可能(neng)會(hui)深刻影(ying)響現有(you)智能(neng)體(ti)的設計模(mo)式。

▲中(zhong)國(guo)人(ren)民(min)大學(xue)高瓴(ling)人(ren)工(gong)智能學(xue)院(yuan)教授趙鑫(xin)

2、清華許華哲:如何讓機器人的操作交互像跳舞一樣“絲滑”?

清華大(da)學交叉學院助(zhu)理(li)教授、博導、星海圖聯合(he)創始人許華哲談道,當前機器人做跳舞、跑步、扭秧歌這類事已經很嫻熟了,有(you)大(da)量數(shu)據支撐,但(dan)在操作(zuo)交互方面數(shu)據十(shi)分(fen)匱乏,還有(you)很長的路要(yao)走。

解決數(shu)據難題,讓機器人有(you)觸覺是非常(chang)關鍵的(de)(de),這樣數(shu)據才能更豐富,團隊設計了仿(fang)真手套,可以讓機器人同步人手的(de)(de)操作。

有了數據還不夠,數據量(liang)也非常關鍵,為此,團隊通過DemoGen的(de)(de)方(fang)式(shi)豐富(fu)數據量(liang),借此機器人(ren)的(de)(de)泛化能力(li)可以得(de)到進一步提升。相比傳(chuan)統(tong)方(fang)式(shi),通過DemoGen的(de)(de)方(fang)式(shi)獲得(de)數據的(de)(de)速度快了上萬倍。

未來讓機器人能夠泛(fan)化(hua)地去做更多的柔(rou)性操作,是團隊努力(li)的方向(xiang)。

▲清華(hua)大(da)學交(jiao)叉學院助理教授、博導、星(xing)海圖(tu)聯合創始(shi)人許華(hua)哲

3、PINE AI李博杰:AI原生團隊是組織形態的一場重大變革

PINE AI聯合創(chuang)始(shi)人、首席科(ke)學家(jia)李(li)博杰(jie)認為(wei),AI Agent在(zai)爆(bao)火的同(tong)時,也面臨著企業知(zhi)識孤島、GUI使用困難、缺少獨(du)立測試(shi)環境、無法長(chang)時間(jian)運(yun)行等(deng)問題。

要(yao)打造(zao)AI原生團隊,讓AI真正(zheng)成為(wei)“數字員工”,需要(yao)為(wei)Agent打造(zao)類似開源社區的溝通(tong)文化,實現開放透(tou)明的信息(xi)共享,并配備AI友好的團隊協作工具(ju)接口、完善的測(ce)試環境與測(ce)試用例(li),同時讓每個員工都擁有AI助理。

從(cong)技術層面來(lai)看,未來(lai)Agent還需要(yao)在明晰需求(qiu)、主(zhu)動溝通、主(zhu)動協作、長期記憶、自我反(fan)思回(hui)溯與高精度內部知識庫(ku)搜(sou)索等(deng)方面實現突破,才能(neng)真正(zheng)實現從(cong)工(gong)具到(dao)團隊成員的轉變。

▲PINE AI聯(lian)合創始(shi)人、首席科學家李博杰

4、壁仞科技丁云帆:64卡4TB顯存訓練滿血DeepSeek-V3,異構混訓逐步邁向萬卡集群

DeepSeek引爆了大模(mo)(mo)型落地元年。壁仞科技AI軟件首席架構師丁云帆(fan)認為,大模(mo)(mo)型落地需要(yao)工程和算(suan)法的協同創新(xin),數據(ju)是(shi)燃料,算(suan)法是(shi)引擎,算(suan)力是(shi)加速(su)器。

壁(bi)(bi)仞(ren)科技目前(qian)有萬(wan)卡集(ji)群(qun)整體解決方案和智算(suan)(suan)生態(tai),希望通過軟(ruan)硬(ying)協同(tong)&算(suan)(suan)法與工程(cheng)協同(tong),系統(tong)性地破(po)解大(da)模型(xing)算(suan)(suan)力(li)難題:硬(ying)件集(ji)群(qun)算(suan)(suan)力(li)方面(mian),壁(bi)(bi)仞(ren)科技自(zi)主原創了GPU芯(xin)片架構,引領Chiplet技術(shu)趨(qu)勢;軟(ruan)件有效算(suan)(suan)力(li)方面(mian),有大(da)模型(xing)訓推一體平(ping)臺,業(ye)界首次實(shi)現(xian)大(da)模型(xing)訓練自(zi)動彈(dan)性擴(kuo)縮容(rong)。業(ye)界首創三(san)級異(yi)步checkpoint,千卡集(ji)群(qun)千億參數可以實(shi)現(xian)自(zi)動斷(duan)點續訓小于5分鐘,大(da)幅提升集(ji)群(qun)穩(wen)定(ding)性。

大規模分布式優(you)化(hua)方面(mian),壁仞科(ke)技針對國產(chan)GPU高效適配(pei)DeepSeek進行了一(yi)系(xi)列技術優(you)化(hua)創新(xin),64卡(ka)4096GB顯存即可支持(chi)DeepSeek-V3滿血版高效全參訓練,而其(qi)他已公(gong)布方案至少(shao)需(xu)要256卡(ka)。

此(ci)外異(yi)構(gou)聚合算力方面,壁仞科技自主(zhu)原創了異(yi)構(gou)GPU協同訓練方案(an)HGCT,支持4種及以上異(yi)構(gou)GPU協同訓練同一個大(da)模型,解決了異(yi)構(gou)混訓的關鍵技術挑(tiao)戰,已實(shi)現數千卡規(gui)模混訓,下(xia)一步將突(tu)破(po)萬卡混訓。

▲壁(bi)仞(ren)科技AI軟件首席(xi)架構師丁云帆

5、英諾天使基金王晟:AI應用爆發,需要新終端設備的出現

英諾天使基金合伙人王晟(sheng)談道,2023年是大語言模型的(de)(de)爆發(fa)期,2024年則轉向多模態技術,但2024年被寄予(yu)厚(hou)望的(de)(de)“AI應用元年”并未如期而至,主要原因(yin)是缺乏新(xin)終(zhong)端設(she)備和(he)新(xin)場景定義(yi),當前(qian)既有設(she)備的(de)(de)場景需求已(yi)接近飽和(he)。

▲英諾天使基金合伙人(ren)王晟

未來(lai),AI應用的爆(bao)發可能(neng)需要(yao)于(yu)新終(zhong)端設備(bei)、新計算能(neng)力的出現(xian)。能(neng)夠(gou)提供情緒(xu)價(jia)值的AI玩具(ju)和陪伴類(lei)產品也(ye)擁(yong)有巨大的潛力,因為人類(lei)為情緒(xu)價(jia)值買(mai)單的意愿非常強烈。

此外,AI公司的(de)發展方向正從(cong)工(gong)具提供轉向智能(neng)代(dai)理(li),未(wei)來會(hui)成為“造人”的(de)公司,讓(rang)AI能(neng)夠承擔更復(fu)雜的(de)任務,甚至取代(dai)人類從(cong)事多(duo)種職(zhi)業。2025年(nian),AI領域的(de)關鍵(jian)詞包(bao)括應用、AI硬件(jian)、具身智能(neng)和世界模(mo)型,這些(xie)方向將定義未(wei)來的(de)技術(shu)和市場格(ge)局。

二、高端對話:中國AGI新征程全速起航,全產業鏈迎巨大發展機會

以《DeepSeek開啟大模型下(xia)半場 中國(guo)AGI新征程全速(su)起(qi)航》為主題(ti)的高端(duan)對(dui)話,由智(zhi)(zhi)一科技聯合(he)創始(shi)人、智(zhi)(zhi)車芯產媒矩陣總(zong)編輯張(zhang)國(guo)仁主持,彩云科技創始(shi)人兼(jian)CEO袁行遠,GMI Cloud創始(shi)人兼(jian)CEO Alex Yeh,PINE AI聯合(he)創始(shi)人、首席科學家(jia)李博杰(jie),智(zhi)(zhi)澄AI創始(shi)人及CEO胡魯輝(hui),四位嘉賓(bin)分(fen)別(bie)作為AI應用、算(suan)力云、Agent、具身(shen)智(zhi)(zhi)能(neng)企業代表進行分(fen)享。

智(zhi)一科技聯合(he)創始人(ren)、智(zhi)車芯產(chan)媒矩陣總編輯張國(guo)(guo)仁談道,今年春節以來,從DeepSeek、人(ren)形機器人(ren)到通用Agent產(chan)品Manus,中(zhong)國(guo)(guo)團(tuan)隊(dui)不斷造出(chu)現象級AI產(chan)品,2025年AI發展(zhan)似(si)乎(hu)進入了“中(zhong)國(guo)(guo)時刻”,隨(sui)著中(zhong)國(guo)(guo)AGI新(xin)征程(cheng)全速起(qi)航,中(zhong)國(guo)(guo)市場、中(zhong)國(guo)(guo)公司(si)在全球AI格局扮演的角色和發展(zhan)特征都備受(shou)關注。

▲智一科(ke)技聯合創(chuang)始人、智車芯產媒(mei)矩陣總編輯張國仁

1、DeepSeek顯著提升成本效益

PINE AI聯合(he)創(chuang)始人、首(shou)席(xi)科(ke)學家李博杰認為,DeepSeek-R1揭示了大模型訓(xun)練的(de)真實成(cheng)本,讓世界(jie)了解到只(zhi)要方法得當,便能訓(xun)練出優秀的(de)模型。

GMI Cloud創始人兼(jian)CEO Alex Yeh談(tan)道,DeepSeek的開源模型顯(xian)著降低(di)了企業(ye)的部署成本,使(shi)企業(ye)能(neng)夠以(yi)低(di)成本快速構建應用。

彩云科技創始人兼(jian)CEO袁行遠更是用(yong)事實說話,提到彩云科技旗下產(chan)品在切(qie)換到DeepSeek后,成本降低了(le)90%,毛利率轉(zhuan)正。

▲彩云(yun)科技創(chuang)始人兼CEO袁(yuan)行遠

2、中國開源活躍度高,年輕人展現出后發優勢

談及中(zhong)美AI發展的差異,Alex Yeh觀察(cha)到,中(zhong)國在開源社區的活躍(yue)度(du)和快速落地能力(li)顯著優于美國,這(zhe)也(ye)意味(wei)著中(zhong)國在AI應用爆發上會(hui)有巨大的機會(hui)。

▲GMI Cloud創始人兼CEO Alex Yeh

彩云科技旗下的產品(pin)正在(zai)出海。袁行遠分享說,海外用(yong)戶對數(shu)據、隱私等問題的關注度較高,與國內用(yong)戶區別明(ming)顯。他認為中(zhong)國有望通過大量高質量的人才(cai)儲(chu)備(bei),在(zai)中(zhong)美AI對決中(zhong)取(qu)勝。

在李博杰(jie)看來,AI行業(ye)領域(yu)知識(shi)獲取更(geng)便捷,對經(jing)驗的(de)要求相對較(jiao)少(shao),使許多年輕(qing)的(de)中國企(qi)業(ye)和研(yan)究者能展現出后發(fa)優勢(shi)。

3、做基礎模型還是AI應用?

針(zhen)對做基礎(chu)模(mo)型(xing)還(huan)是(shi)AI應用的選擇問題,Alex Yeh認為大廠偏重基礎(chu)模(mo)型(xing)的訓練(lian),而中小企(qi)業則(ze)應專注于快速落地和應用開(kai)發。

AI訓(xun)練需要消(xiao)耗海量的數據與(yu)算力。智澄(cheng)AI創始人及CEO胡(hu)魯輝相信,未來的創新將圍繞如何更高效(xiao)地(di)利用數據和算力展(zhan)開,創業公司(si)在未來十(shi)年也仍將有巨(ju)大(da)的發(fa)展(zhan)空間。

▲智澄AI創(chuang)始人及CEO胡魯輝

彩云科(ke)技(ji)既(ji)做AI基(ji)(ji)礎研究,又(you)開發了彩云天氣(qi)、彩云小夢等(deng)AI應用(yong)。在袁(yuan)行遠看來,在AI應用(yong)落地的過程(cheng)中(zhong),高性能底層模型(xing)已如“電力”般廣泛可及(ji),行業(ye)重點逐漸從(cong)基(ji)(ji)礎算法轉變為對應用(yong)細節的極致追(zhui)求。以天氣(qi)預報為例(li),通用(yong)AI模型(xing)無法敏銳地識別(bie)云圖中(zhong)的細微(wei)變化和噪(zao)音,需(xu)要運用(yong)大(da)量的一線行業(ye)知識才能完美勝任。

4、未來兩年是垂直領域Agent的關鍵突破口

PINE AI正在打(da)造(zao)能(neng)聽、能(neng)看(kan)、能(neng)說、能(neng)操作電腦的通用AI Agent,未來希望成(cheng)為數字(zi)員工(gong)和個人助(zhu)理。

李(li)博杰(jie)說,Agent的(de)形態正在變(bian)化(hua),決(jue)策(ce)能力、通用(yong)(yong)性不斷增(zeng)強,未來兩年是垂直領(ling)域Agent的(de)關(guan)鍵突破(po)口,企(qi)業需要在這一階段(duan)積累(lei)品牌聲譽與網絡效(xiao)應,為2027年左右(you)通用(yong)(yong)Agent爆(bao)發(fa)做好準備。

▲PINE AI聯合創始人、首席科學(xue)家(jia)李(li)博杰

除了完(wan)成(cheng)(cheng)單一任務之(zhi)外,通用Agent的價值還在(zai)于并行完(wan)成(cheng)(cheng)大量(liang)重復性工作,為生(sheng)產、生(sheng)活節省時間,提供(gong)便(bian)利。在(zai)李(li)博杰看來,這類Agent有望在(zai)2025年初步(bu)落地,產生(sheng)價值。

5、具身智能可能在五年內實現

胡魯輝談道(dao),大(da)模型可能(neng)(neng)只是AI發(fa)展(zhan)的一個(ge)階段(duan)性成(cheng)果,AI發(fa)展(zhan)正從生成(cheng)式AI邁(mai)向物理(li)智能(neng)(neng),最(zui)終(zhong)實(shi)現(xian)通用人工智能(neng)(neng)(AGI)。

李博杰也認為,具身智能很有(you)可能是AI到達甚(shen)至(zhi)超過(guo)AGI的路(lu)徑。具身智能在(zai)與(yu)現實世界(jie)交互(hu)的過(guo)程中,獲得大量知識與(yu)數據,助力模型能力持續提升。

Alex Yeh預(yu)測具(ju)身智能將在未來五年內實(shi)現,特別是在工業領域的(de)應用。

他提到多模態數(shu)據的(de)整合(he)將推動(dong)AI向更高維(wei)度發(fa)展,為(wei)AGI的(de)實現提供新的(de)路徑。AI目前還缺少物理數(shu)據,通過VR、AR等技(ji)術收(shou)集,并結合(he)虛擬(ni)場(chang)景(jing)訓練,可加(jia)速具身智能的(de)發(fa)展。

針對近期資(zi)本(ben)退出人形機器人公司的(de)爭議,胡魯輝相信行業共識能夠推動(dong)科(ke)技(ji)發展、人類進步,堅(jian)持(chi)長期主義很(hen)重(zhong)要(yao),亞馬遜、微軟等大公司的(de)成功都源(yuan)于長期堅(jian)持(chi)。因此(ci),投資(zi)應注重(zhong)長期價值。

三、GenAI應用論壇:從生活到企業,如何用AI掀起生產效率變革?

伴隨著前沿模型(xing)快速迭代突破(po),AI應用(yong)迎來前所未有的(de)繁(fan)榮期,快速將AI技術轉化(hua)成(cheng)能夠解決(jue)消費級(ji)、生產級(ji)問題,帶來實際價值(zhi)的(de)賦能工具。

在大會首日GenAI應用(yong)論壇(tan)上,AI平臺、視頻生成、智算云(yun)、AI PPT、AI搜索、AI動漫(man)、端側芯(xin)片領(ling)域的嘉賓代(dai)表各抒己見,剖析(xi)產(chan)業問題,暢(chang)談落地思路,分享他們在真實應用(yong)場景中(zhong)的實踐經(jing)驗和對未來趨勢的研判。

1、楓清科技高雪峰:單一模型無法解決生產級問題,AI落地產業有三要素

楓清科技(ji)Fabarta創(chuang)始人兼CEO高雪峰認為(wei),單一產品(pin)、技(ji)術或模型(xing)難以解決復雜(za)的(de)(de)生(sheng)產級問題,只有將(jiang)各類AI技(ji)術落地在(zai)企業(ye)(ye)、產業(ye)(ye)之中,帶來真正的(de)(de)高價值場(chang)景,融(rong)合為(wei)生(sheng)態系統,才能讓(rang)AI技(ji)術更富有生(sheng)命力、更繁榮(rong)。

AI技術在產(chan)業(ye)中落地,有三個關鍵要素:知識引擎、行業(ye)大模型、智(zhi)能體平臺。要把生成式(shi)AI技術應用到產(chan)業(ye)端,最需要實現決策(ce)智(zhi)能。

楓清科技采取(qu)了以(yi)數據(ju)為(wei)中心的AI平臺架構落地(di)的范(fan)式,還推(tui)出知(zhi)識引擎和行業大模型(xing)雙輪驅動的智能體(ti)平臺,幫助(zhu)企業實現多場景價(jia)值落地(di)。該平臺通過多模態(tai)數據(ju)存儲和計算,智能化(hua)構建企業知(zhi)識庫,支持精(jing)準推(tui)理和復(fu)雜(za)推(tui)理能力。

▲楓(feng)清科技(ji)Fabarta創始人兼(jian)CEO高雪峰

2、愛詩科技孫偉哲:視頻模型需兼顧趣味與速度,幫每個人成為生活的導演

愛(ai)詩科技是(shi)全球最(zui)早訓(xun)練視(shi)頻(pin)生(sheng)成大模(mo)型的(de)(de)團隊之一(yi),正以高(gao)頻(pin)的(de)(de)技術(shu)研發節奏,進(jin)行底層模(mo)型的(de)(de)迭代。愛(ai)詩科技企(qi)服負責人(ren)孫偉(wei)哲分(fen)享(xiang)說,針對短(duan)視(shi)頻(pin)時代用(yong)(yong)戶(hu)習慣的(de)(de)特點,打造(zao)視(shi)頻(pin)生(sheng)成模(mo)型需要兼顧趣味(wei)與(yu)速度(du),前者(zhe)能促進(jin)用(yong)(yong)戶(hu)的(de)(de)關(guan)注與(yu)傳播,而后者(zhe)則是(shi)提升(sheng)用(yong)(yong)戶(hu)體(ti)驗的(de)(de)關(guan)鍵。

語言曾(ceng)經(jing)是傳遞(di)信息的最好(hao)介質(zhi),但目前我們接受的大部分信息都(dou)來自于(yu)視(shi)(shi)頻。全球視(shi)(shi)頻創作需求已大量涌(yong)現,日均視(shi)(shi)頻播放量達800億(yi)次,企(qi)業也需要通(tong)過AI技術(shu)實(shi)現視(shi)(shi)頻內(nei)容(rong)生(sheng)(sheng)產的降本增(zeng)效。愛詩科技希望通(tong)過視(shi)(shi)頻生(sheng)(sheng)成技術(shu),實(shi)現創作平權,幫助每(mei)個(ge)人成為生(sheng)(sheng)活的導演。

愛詩科技(ji)的(de)PixVerse是全球(qiu)最早實現千萬(wan)級MAU的(de)視頻生成產品,并(bing)同步發(fa)力(li)B端業務,利(li)用視頻生成技(ji)術(shu),為企業客戶在數字營銷(xiao)、信息(xi)流(liu)廣告、短劇創作與出海、游戲設計與開發(fa)等領域提供(gong)助力(li),并(bing)提供(gong)了持續、精準的(de)運營服(fu)務。

▲愛(ai)詩科技企服負責(ze)人孫偉哲(zhe)

3、GMI Cloud King Cui:推理服務成AI出海關鍵支撐,及時彈性擴容是核心性能

GMI Cloud亞(ya)太(tai)區(qu)總(zong)裁King Cui談道,基礎模型能(neng)力(li)提(ti)升和開源生態的(de)豐富,為AI應用爆發提(ti)供了核心必要條件,這(zhe)背(bei)后,為中國AI產(chan)品出海提(ti)供關鍵支撐的(de)就是推理算(suan)力(li)。

AI應用(yong)往往會出現用(yong)戶規模和訪問量短期(qi)暴漲等(deng)現象,因(yin)此(ci)提(ti)供及時性(xing)、擴展性(xing)、穩定性(xing)的推理服(fu)務至關(guan)重(zhong)要。

GMI Cloud的目標是打(da)造(zao)更高性(xing)能的GPU推理云服務,支持(chi)全球(qiu)范圍(wei)自(zi)動擴縮容(rong)、一鍵(jian)部署推理模(mo)型、搭載自(zi)動容(rong)錯機制等(deng)。

▲GMI Cloud亞太區總裁King Cui

4、像素綻放PixelBloom蒲世林:AI帶來的效率革新符合發展趨勢,需理性擁抱

像素綻放PixelBloom(AiPPT.com)聯(lian)合創(chuang)始人蒲世林談道(dao),隨著(zhu)底層(ceng)算力和模型層(ceng)成本(ben)的(de)顯著(zhu)下降,AI應(ying)用(yong)層(ceng)迎(ying)來全面(mian)爆發(fa)的(de)機遇。

像素綻放PixelBloom在AI PPT領域,通過ToC、To Partner ToC、ToB三種(zhong)商業化路徑,既直接服務消費者,也與頭部(bu)企(qi)業合作提升辦公(gong)效率;同時還開放API能力,與聯想、釘釘等硬件(jian)和軟件(jian)廠商深(shen)度集成,構建開放生態,覆蓋(gai)辦公(gong)人群。

在進軍海外(wai)市(shi)場時(shi),AiPPT.com注重做好本(ben)土化,提供多語言版本(ben)和(he)本(ben)地化模板,滿(man)足不同國家的市(shi)場需求,還通過(guo)孵化和(he)并購來擴展(zhan)產品矩陣。

在蒲世林看來(lai),AI技術帶來(lai)的效(xiao)率革新(xin)符合人類發展趨勢,企業需理性擁抱AI,不低(di)估但也別期待過(guo)高,通過(guo)實際(ji)應用探索能力邊(bian)界,以(yi)抓住未來(lai)十年的AI紅利(li)。

▲像素綻放(fang)PixelBloom(AiPPT.com)聯合(he)創始(shi)人蒲世(shi)林

5、博查AI翁柔瑩:AI比人類更需要搜索引擎

博查AI搜(sou)索聯合創始人兼CTO翁(weng)柔瑩認為(wei)(wei),AI時代,用戶的(de)搜(sou)索習慣已由“關鍵詞搜(sou)索”轉變(bian)為(wei)(wei)“自然語(yu)言(yan)對話”,內容的(de)生(sheng)產、流動、消費(fei)也在發生(sheng)變(bian)化(hua),在AI為(wei)(wei)用戶整(zheng)理(li)、總(zong)結信息的(de)過程中,內容的(de)消費(fei)主體已經變(bian)成(cheng)了(le)AI。

AI大模型的訓練數據存在(zai)滯(zhi)后性,必須通過聯(lian)網搜(sou)索來(lai)獲取最(zui)新的內容,才(cai)能為用戶(hu)提供更好的信息服務(wu),從這一角度(du)來(lai)看(kan),AI比人類更需要搜(sou)索引擎。

為AI打造的(de)搜(sou)(sou)(sou)(sou)索引(yin)擎(qing)與傳統搜(sou)(sou)(sou)(sou)索引(yin)擎(qing)在架(jia)構(gou)上有相似之處,依舊需要(yao)實時(shi)獲取高質(zhi)量信息。博查采用多(duo)(duo)模態混合搜(sou)(sou)(sou)(sou)索和(he)語義排序(xu)技術,能(neng)突破傳統搜(sou)(sou)(sou)(sou)索引(yin)擎(qing)的(de)技術瓶(ping)頸,滿足大模型對于高質(zhi)量世(shi)界(jie)知識(shi)(shi)的(de)需求,還(huan)打造了全球首個多(duo)(duo)Agent架(jia)構(gou)的(de)智能(neng)體搜(sou)(sou)(sou)(sou)索,為AI提供專業領域知識(shi)(shi)。

▲博查(cha)AI搜(sou)索(suo)聯合(he)創始人兼CTO翁柔瑩

6、中文在線周立強:AI降低動漫短劇門檻,制作成本降低50%

中文在(zai)線AI動(dong)(dong)漫部總經理周立強談道,中國AIGC應用市場(chang)正在(zai)加(jia)速(su)發展,預計2024年(nian)至2028年(nian)年(nian)均復合增長率(lv)將超過30%。作為勞(lao)動(dong)(dong)密集型(xing)行(xing)業,動(dong)(dong)漫領域正受到AIGC相關(guan)工具的深刻影響。

傳(chuan)(chuan)統動漫短劇(ju)制(zhi)作通常(chang)包含原文理解、劇(ju)本改寫(xie)等11個(ge)環節,而AI已(yi)將流程壓縮(suo)至設定理解、生圖(tu)合成、后期(qi)處理等5個(ge)步驟(zou)。AI動漫短劇(ju)的(de)優勢在于(yu)具備(bei)跨國(guo)傳(chuan)(chuan)播(bo)能力、支(zhi)持工(gong)業化(hua)量(liang)產,且制(zhi)作成本顯(xian)著下降——單部作品的(de)制(zhi)作周期(qi)可(ke)縮(suo)短70%,成本降低約50%。

周立強指出(chu),AI動漫(man)短劇已逐步突破(po)單一流量變現階段。預計(ji)未(wei)來三年,掌握AIGC全(quan)鏈路能(neng)力的團(tuan)隊有望占據全(quan)球(qiu)短劇市場30%以上的份額。

▲中(zhong)文在線AI動漫部總經理周立強

7、光羽芯辰周強:端側AI的發展促使手機架構變革,可能孕育出新的大型公司

光羽(yu)芯(xin)辰創始人兼(jian)董事長周強(qiang)談道,過去幾年,AI經歷(li)了從低谷(gu)到高峰的周期,AI創新(xin)的核心在于實(shi)用(yong)性(xing),只有當技術可(ke)用(yong)且有價值時,市(shi)場關注度才會提(ti)升。

早期AI應(ying)用多(duo)局限于(yu)云端(duan),而(er)端(duan)側(ce)AI的興起使(shi)AI能(neng)夠(gou)深入生產生活(huo)各領域,比如應(ying)用到工廠的機器人上,顯著提升生產力。大模型的出現(xian)增(zeng)強了AI能(neng)力,但也暴(bao)露了硬件性(xing)能(neng)不足(zu)的問題。

端(duan)側(ce)AI需要新(xin)的(de)(de)技術架(jia)構以降低功耗、提升性能(neng)和帶寬。以手(shou)機為例,隨著AI未(wei)來的(de)(de)發(fa)展(zhan)趨(qu)勢,智能(neng)手(shou)機將(jiang)進化為AI手(shou)機,將(jiang)集成(cheng)更多端(duan)側(ce)數據,成(cheng)為所有(you)智能(neng)終端(duan)的(de)(de)中心(xin),光羽芯辰(chen)的(de)(de)端(duan)側(ce)芯片(pian)以及(ji)創新(xin)的(de)(de)解(jie)決方案(an)和架(jia)構將(jiang)極大的(de)(de)助力(li)這一變革。

▲光(guang)羽芯(xin)辰創始(shi)人兼董(dong)事長周強

8、Zilliz郭人通:對于Agent構建,我們如何有效支持海量數據檢索,挖掘隱藏于長尾的高價值信息?

Zilliz關注如何(he)有效(xiao)檢索海量數據(ju),發(fa)掘(jue)隱藏于長尾的(de)高價值信息。在OpenAI發(fa)布Deep Research功能之后,Zilliz也嘗(chang)試了(le)復刻。

據Zilliz合伙人、產品總監郭人通(tong)分享,對(dui)于Deep Research這類Agent系統(tong),在(zai)(zai)數據基礎設(she)施層(ceng)面(mian)需(xu)要在(zai)(zai)數據建(jian)模、部署、緩存、多租、冷(leng)熱數據處理等方面(mian)做(zuo)好優化(hua),聚焦信息檢索質量,提高單位(wei)成本可支(zhi)撐的檢索迭代輪次,以保(bao)證(zheng) Agent 對(dui)問題的理解(jie)度(du)以及(ji)對(dui)信息的挖(wa)掘深度(du)。Zilliz目前已提供系統(tong)性解(jie)決方案。

對(dui)于提(ti)高查(cha)(cha)(cha)詢(xun)(xun)質量,目前有(you)(you)一(yi)系列經(jing)過生產(chan)驗證的方(fang)法,包括(kuo)查(cha)(cha)(cha)詢(xun)(xun)改寫,如多查(cha)(cha)(cha)詢(xun)(xun)條件生成、查(cha)(cha)(cha)詢(xun)(xun)拆(chai)解、意圖識別等,這有(you)(you)助于突破傳統(tong)RAG技(ji)術(shu)的搜(sou)索局限性。此外,帶(dai)正負樣本的查(cha)(cha)(cha)詢(xun)(xun)增強、多模態(tai)搜(sou)索也能有(you)(you)效提(ti)升搜(sou)索質量。

目(mu)前,許多企(qi)業(ye)(ye)已切(qie)入垂(chui)直Agent方向,海量(liang)領域數據(ju)也引發數據(ju)Infra的(de)變(bian)革,基于S3構(gou)建的(de)數據(ju)Infra正逐漸獲得更(geng)多企(qi)業(ye)(ye)用戶的(de)選用。今年下半年,Zilliz將推出面向AI應用的(de)數據(ju)湖解決方案(an),從五月開始,Zilliz會面向業(ye)(ye)界進行介(jie)紹,敬請(qing)關注。

▲Zilliz合伙人、產品總監郭人通

四、大模型峰會:判趨勢,剖解法,全面直擊算法、算力、數據挑戰

大(da)(da)會(hui)第二天舉行的(de)大(da)(da)模型峰會(hui),更加聚焦于大(da)(da)模型產業鏈(lian)底層技術,從模型、中間件、云服(fu)務、知(zhi)識(shi)圖譜、存(cun)儲、網(wang)絡、芯片、數據平臺等多維度切(qie)入,探討突破大(da)(da)模型算法、算力、數據關鍵瓶頸的(de)可(ke)行路徑(jing)。

現場,焱融科技首次發布了KV Cache在推理場景性能優化數據。實測數據(ju)顯示(shi):在長上下文場景中,使用YRCloudFile KVCache可(ke)實現高達(da)13倍的TTFT性能(neng)提升,延時縮短超(chao)4倍。

1、上交大戴國浩:全面直擊云邊端不同場景推理需求挑戰,半分離式方案下周開源

上(shang)海交通大學副教授(shou)、無問(wen)芯穹聯合創始(shi)人戴國浩談道,真(zhen)正(zheng)能模仿人類(lei)智力的模型往往是推理(li)需(xu)求(qiu),但現有(you)云側(ce)和端側(ce)很難滿足模型推理(li)需(xu)求(qiu)。

云(yun)側有PD融合式、PD分離(li)式兩種(zhong)技術路線,其中,PD融合式的技術路線將(jiang)(jiang)計算(suan)和存(cun)(cun)(cun)儲進(jin)行融合的好處是(shi)內存(cun)(cun)(cun)利用率更高、無需傳遞KV cache,但缺點是(shi)不同任務(wu)間(jian)干擾(rao)大;PD分離(li)式技術路線,將(jiang)(jiang)計算(suan)和存(cun)(cun)(cun)儲資源分離(li)的好處是(shi)計算(suan)單(dan)元容易隔離(li)、抗(kang)干擾(rao),但存(cun)(cun)(cun)儲冗(rong)余和不均衡(heng)會(hui)帶(dai)來額(e)外開銷。

因(yin)此,無問芯穹取長(chang)補(bu)短打造半(ban)分(fen)離(li)式(shi)方案Semi-PD,實現計算分(fen)離(li)存儲融(rong)合(he),Semi-PD將于一(yi)周后(hou)開源(yuan)(yuan)整體代碼(ma),月(yue)底開源(yuan)(yuan)整個(ge)集(ji)群代碼(ma),Semi-PD在一(yi)體機和分(fen)布式(shi)集(ji)群推理等場(chang)景下將帶來(lai)顯(xian)著性能提升。

其端側(ce)思路是通過輕(qing)量(liang)(liang)化方式讓終端負載變小,SpecEE技術(shu)引入機器學習(xi)、模型(xing)自適應等,可以判斷是否在級(ji)聯結(jie)構當前層輸出了正確結(jie)果。該技術(shu)能無感兼容任(ren)何(he)端側(ce)輕(qing)量(liang)(liang)化方案,整套(tao)代碼將(jiang)在本月開源(yuan)。

▲上海交通(tong)大學副教(jiao)授、無(wu)問芯穹聯合創始人戴國浩(hao)

2、智澄AI胡魯輝:人形機器人“不好用”,與大模型數據挑戰有差別

智(zhi)澄AI創始(shi)人(ren)(ren)兼CEO胡魯輝認為,機器人(ren)(ren)將(jiang)是未來(lai)AI生態中(zhong)的重要組成(cheng)部分,物理智(zhi)能有望成(cheng)為AI的下一波(bo)浪(lang)潮(chao),實現更廣泛的通用(yong)人(ren)(ren)工智(zhi)能。目(mu)前(qian)人(ren)(ren)形機器人(ren)(ren)泛化能力較差,直接(jie)導致(zhi)成(cheng)本高昂,歸(gui)根結底就是“不好用(yong)”。

與大模(mo)型一樣(yang),物(wu)理智能(neng)面臨著數(shu)據(ju)、模(mo)型、環境、算力(li)等方面的挑(tiao)戰(zhan),但挑(tiao)戰(zhan)的內核有(you)所(suo)區別。物(wu)理智能(neng)可用的數(shu)據(ju)量(liang)更(geng)少,需要(yao)在“機器人訓練場”中(zhong)采集數(shu)據(ju),機器人端側(ce)算力(li)限制也(ye)對模(mo)型能(neng)效(xiao)提(ti)出了要(yao)求。

智澄AI從世界(jie)模型的研發與人(ren)形機器人(ren)本體(ti)的打(da)造(zao)兩個角度切入,打(da)造(zao)的TR4機器人(ren)能(neng)以(yi)視覺(jue)+力(li)度感(gan)知的方(fang)案實現(xian)物體(ti)抓握,無需依(yi)賴觸覺(jue)。

▲智(zhi)澄AI創(chuang)始人兼CEO胡魯輝

3、焱融科技張文濤:高性能全閃存儲在訓練與推理中如何破解AI算力瓶頸?

焱融科技(ji)CTO張文濤分享說,針對大模型(xing)訓練和(he)推理的(de)(de)存儲解決方案(an),焱融科技(ji)通過Multi-Channel技(ji)術聚合(he)多個網卡(ka)、帶寬等,提(ti)供高性(xing)能內核私(si)有(you)客戶端,能夠滿足高性(xing)能元數據訪問需求(qiu),為(wei)企業提(ti)供高效(xiao)、靈活(huo)的(de)(de)存儲支持。

焱(yan)融(rong)科技(ji)在數(shu)據(ju)(ju)管(guan)(guan)理(li)方面,采取(qu)智能分(fen)層和(he)數(shu)據(ju)(ju)加載功能來優化管(guan)(guan)理(li)流(liu)程。此(ci)外,焱(yan)融(rong)科技(ji)順勢推出的(de)DataInsight數(shu)據(ju)(ju)編排管(guan)(guan)理(li)平臺,幫(bang)助企業解決其應用(yong)AI大(da)模(mo)型中(zhong)的(de)海(hai)量歷史業務(wu)數(shu)據(ju)(ju)管(guan)(guan)理(li)難題;支持多維度組合查詢,實現(xian)百(bai)億級數(shu)據(ju)(ju)秒級檢索。通過自研DataFlow技(ji)術,用(yong)戶可自定義數(shu)據(ju)(ju)流(liu)動策(ce)略,確保數(shu)據(ju)(ju)按需、快速嵌入業務(wu)流(liu)程。平臺還具備增量數(shu)據(ju)(ju)自動感知能力,保障用(yong)戶從知識庫平臺訪問時獲取(qu)最(zui)新數(shu)據(ju)(ju),進一步提升數(shu)據(ju)(ju)流(liu)動效(xiao)率。

在運維方(fang)面(mian),焱融(rong)科技通(tong)過提供目錄集來做好多租戶管理(li)和隔離,并(bing)設置(zhi)了彈性數據(ju)網絡,使一套存儲能夠(gou)支持多種網絡平面(mian),并(bing)幫助管理(li)員簡化基礎設施(shi)建設。

其(qi)產(chan)品性能(neng)出(chu)色,依托于分布(bu)式元數(shu)據集群能(neng)夠支(zhi)撐千億級(ji)海量文件,能(neng)夠支(zhi)持高速無損網(wang)絡及多種接口,還適配(pei)多個國產(chan)化平臺。在本(ben)屆大會(hui)上,焱融科(ke)技還首(shou)次發布(bu)了KV Cache在推理場景性能(neng)優(you)化數(shu)據。

實測數(shu)據顯示:在(zai)長上(shang)下文(wen)場景中,使用(yong)YRCloudFile KVCache可(ke)實現高(gao)達(da)13倍(bei)的TTFT性能提(ti)升(sheng)。在(zai)TTFT≤2秒的嚴苛約(yue)束下,其支(zhi)持的并發數(shu)提(ti)升(sheng)達(da)8倍(bei),且在(zai)高(gao)并發負載中延遲可(ke)降低4倍(bei)以上(shang)。張文(wen)濤談到(dao)YRCloudFile KVCache可(ke)構建PB級(ji)KVCache緩(huan)存(cun)層,有效突破GPU顯存(cun)限制(zhi),顯著提(ti)升(sheng)緩(huan)存(cun)命(ming)中率與(yu)推理上(shang)下文(wen)長度(du)。

▲焱融科技CTO張文濤

4、Zenlayer陳秀忠:token洪流下算力網絡三大趨勢,實時交互、分布式推理、高效IDC

Zenlayer行業拓(tuo)展總(zong)監陳秀忠談道,token是大模(mo)型世界的(de)基(ji)礎(chu)單位,過去(qu)8個月,token使(shi)得整個網絡世界流量增長(chang),達到移動互聯網時代的(de)3~4倍。

token的整個生命周期包括AI工廠(chang)生產(chan),再經(jing)網絡傳(chuan)輸(shu)給用戶,其在(zai)生產(chan)過程需要(yao)大量算力(li)和(he)(he)電力(li),在(zai)傳(chuan)輸(shu)和(he)(he)消費(fei)環節需要(yao)靠近用戶的推理(li)節點實現即時交(jiao)互(hu)。

在token洪流下(xia),未來的(de)三(san)個演進趨勢包括實時交互的(de)全(quan)球(qiu)網(wang)絡、分布式(shi)推理的(de)易用模(mo)型(xing)服(fu)務、高效的(de)IDC。基于此,Zenlayer構建了覆(fu)蓋全(quan)球(qiu)的(de)專線(xian)網(wang)絡、覆(fu)蓋亞太地區的(de)AI機房、在現有邊緣節點(dian)推出模(mo)型(xing)服(fu)務等。

▲Zenlayer行業拓展總監陳秀忠

5、清程極智師天麾:如何打造國產模型與國產算力間的橋梁?

清程極智(zhi)聯(lian)合創(chuang)始人(ren)、產(chan)品副(fu)總裁(cai)師天麾分享說(shuo),在(zai)(zai)DeepSeek、QwQ等(deng)國產(chan)推理(li)模型(xing)(xing)爆火之后,大(da)模型(xing)(xing)私有化部署(shu)需求(qiu)大(da)幅度增加。在(zai)(zai)國外(wai)算(suan)力(li)獲取困難、國產(chan)顯卡(ka)軟件(jian)生態不(bu)完善的背景(jing)下,打造連接(jie)國產(chan)模型(xing)(xing)與國產(chan)算(suan)力(li)的橋梁尤(you)為迫切(qie)。

清(qing)程極智已聯合清(qing)華大(da)學開源(yuan)了(le)赤(chi)兔推理(li)引(yin)擎(qing),支持(chi)在非Hopper架構設備(如早期大(da)部分(fen)英偉達(da)GPU和(he)大(da)部分(fen)國(guo)產芯片)上原生運行FP8模型(xing),打破(po)硬件綁定,提(ti)升(sheng)算力使(shi)用效(xiao)率,并能(neng)有效(xiao)保留模型(xing)原有精(jing)度(du)。

目前清程極(ji)智基(ji)于赤兔引擎推出多款大模型私(si)有化部署方案,可根據不同場景需求提供針對性解決(jue)方案,結合企業業務(wu),提供從私(si)有化部署到智能體開發的一站式(shi)服(fu)務(wu)。

▲清(qing)程(cheng)極智聯合創始人、產品副總裁師天麾

6、首都在線張振宇:以全棧國產化為特色,助攻生成式AI規模化落地

首(shou)都在線集團智算(suan)產品總經(jing)理(li)張振宇談道,隨(sui)著DeepSeek爆火,AI大(da)模型(xing)國產化趨勢正在加速,推理(li)市場將迎來大(da)規模增長。首(shou)都在線后續也會更聚(ju)焦(jiao)于推理(li)算(suan)力的布(bu)局。

此前首都在線(xian)智算云(yun)(yun)已成(cheng)功應用于多個(ge)生(sheng)(sheng)成(cheng)式AI場(chang)景,如自(zi)然(ran)語言處理、圖像生(sheng)(sheng)成(cheng)、視頻(pin)生(sheng)(sheng)成(cheng)等(deng),公(gong)司(si)今年(nian)將持續優化“一云(yun)(yun)多模、一云(yun)(yun)多芯、一云(yun)(yun)多池”的(de)戰略布局(ju),去構建(jian)高度靈活的(de)AI服(fu)務平臺,我們的(de)平臺不斷拓展支持的(de)模型(xing)種類,為用戶提供更(geng)豐富的(de)選擇,滿足不同場(chang)景需求(qiu)。

首都在線(xian)Maas云平臺通過構(gou)建云端協同調優(you)體系,以算(suan)(suan)力效(xiao)能優(you)化為(wei)基礎(chu)、模(mo)(mo)型即服(fu)務(MaaS)平臺為(wei)核心,為(wei)AI開發(fa)者(zhe)及算(suan)(suan)力伙伴帶來創新性(xing)升(sheng)級,形成(cheng)(cheng)了(le)(le)(le)閉環式技術解決方案,不(bu)僅(jin)有效(xiao)提升(sheng)了(le)(le)(le)GPU利用(yong)率,降低了(le)(le)(le)訓練成(cheng)(cheng)本(ben),能夠為(wei)客戶提供更加高效(xiao)、靈活、低成(cheng)(cheng)本(ben)的算(suan)(suan)力服(fu)務,還為(wei)大(da)模(mo)(mo)型從(cong)實驗(yan)室走(zou)向產(chan)業化提供了(le)(le)(le)關(guan)鍵技術支撐。

▲首都在線集(ji)團智算產(chan)品總經理(li)張振宇

7、海致科技李思宇:以圖為核心,打通大模型與多模態行業知識

海(hai)致(zhi)科技(ji)技(ji)術總監(jian)李思(si)宇談道,大(da)模(mo)型實(shi)際項目落地的(de)Prompt提(ti)示(shi)詞工程(cheng),RAG檢(jian)索召回增強、Agent Function/Tool Call、SFT監(jian)督微(wei)調訓練四種(zhong)基本方(fang)法,其(qi)關鍵是讓(rang)大(da)模(mo)型結(jie)合多模(mo)態行(xing)業知識。

針對此(ci),海致科技的思路是統一知識與數(shu)據(ju)(ju)認知,其解決方案(an)以圖為核心,結合工具將標(biao)量數(shu)據(ju)(ju)和向(xiang)量數(shu)據(ju)(ju)打(da)通形成(cheng)有機整體(ti)。

通過將大(da)模(mo)型與(yu)知(zhi)識圖譜融(rong)合,海(hai)致(zhi)科技(ji)形成了(le)基(ji)礎(chu)模(mo)型層(ceng)、語(yu)義知(zhi)識層(ceng)、邏輯圖譜層(ceng)、智能體(ti)應用層(ceng),可基(ji)于基(ji)礎(chu)模(mo)型、元數(shu)據知(zhi)識體(ti)系(xi),在應用層(ceng)之上構建智能體(ti)、工作流。

實際落(luo)地中,其解決(jue)方案接入(ru)警情案件等五情數(shu)據,可融合(he)跨不同事件、不同情報數(shu)據,形成完整(zheng)事件對(dui)象關(guan)系圖再以此進行信息挖掘,實現(xian)匯聚非結構化(hua)和結構化(hua)數(shu)據的整(zheng)體圖譜。

▲海致科技(ji)技(ji)術總監李思宇

8、中昊芯英朱國梁:Scaling Law延續下的AI芯片軟件棧重構

中昊芯英軟件研發負責人(ren)朱國梁介(jie)紹(shao),目前,Scaling Law正沿著測試(shi)時計算(suan)、強(qiang)化學習與預訓練三條路徑延(yan)續。需要不(bu)斷(duan)重構AI芯片軟件棧來(lai)滿足新的算(suan)力挑戰。

對大部分(fen)廠商(shang)而言,超大Batch-Size依舊(jiu)是優先事項,下一個Transformer級別(bie)的架構(gou)尚未出現。

目前在推理方向(xiang)優化,探索方向(xiang)包括KV緩存卸載、PD分(fen)離、稀疏注意(yi)力和MoE通(tong)信優化等。

強化(hua)學習(xi)方面,隨著強化(hua)學習(xi)兩階(jie)段訓練(lian)的(de)范式形成,訓練(lian)和推理協同調(diao)度需求不(bu)斷增長。

預訓練(lian)方(fang)面(mian),需要在訓練(lian)通信特征、訓練(lian)通算重疊(die)與訓練(lian)容(rong)錯等方(fang)面(mian)對現有(you)軟件棧做(zuo)出修改。

▲中昊芯英軟(ruan)件研發負責人朱國梁

9、澳鵬董成:大模型愈往垂類應用端發力,對數據質量要求愈高

澳鵬Appen中(zhong)國及韓國區副(fu)總(zong)裁董成通過澳鵬在(zai)各領域大模型(xing)部(bu)署中(zhong)數據訓練的(de)最佳實踐,重點分享了對大模型(xing)應用趨勢的(de)觀察(cha)。以(yi)AI Agent為(wei)代表,未來,大模型(xing)必定應用到具體的(de)垂直(zhi)領域中(zhong),比如金融、醫療、代碼、音(yin)樂、文學等。

這一趨勢對(dui)(dui)(dui)數(shu)(shu)據的高質量、專業度、多(duo)垂類提(ti)出了(le)越來越高的要求。對(dui)(dui)(dui)此,澳(ao)鵬提(ti)供了(le)多(duo)種AI輔助的前(qian)沿數(shu)(shu)據采(cai)標工具和方案,包括文本對(dui)(dui)(dui)話、多(duo)模(mo)態交互(hu)、思維鏈推理工具等。

董成認(ren)為,AI大模(mo)型(xing)行業(ye)(ye)正經(jing)歷顯著變(bian)化,Llama和DeepSeek等(deng)開源模(mo)型(xing)在性能(neng)上逐漸趕上甚至超過閉源模(mo)型(xing),一些企(qi)業(ye)(ye)也從(cong)閉源向(xiang)著開源方向(xiang)轉變(bian)。同時,大模(mo)型(xing)企(qi)業(ye)(ye)的研發(fa)越(yue)來越(yue)關注復(fu)雜任務(wu)方向(xiang),從(cong)最(zui)初的簡(jian)單對話向(xiang)模(mo)型(xing)推理、垂直領域(yu)應用(yong)、多模(mo)態等(deng)方向(xiang)發(fa)展。

▲澳鵬Appen中國及(ji)韓國區副總裁董成

10、云軸科技王為:AI實踐應用分四級,基礎設施構建面臨四大挑戰

云軸(zhou)科技CTO王為解讀(du)了當前AI基礎設施構建(jian)面臨的(de)挑(tiao)戰,包括模(mo)型(xing)尺寸增(zeng)加(jia)、上下文窗口增(zeng)加(jia)、全模(mo)態支(zhi)持、多品牌算力支(zhi)持等。

類比自動駕駛,AI實踐可對(dui)應(ying)作(zuo)為工具、作(zuo)為參考(kao)建(jian)(jian)議、主導到端到端實踐的L1~L4級別(bie)。云(yun)軸(zhou)科技已在(zai)AI輔助(zhu)售后、代碼、文檔等方面有所(suo)應(ying)用。其(qi)中AI輔助(zhu)售后、代碼輔助(zhu)處于參考(kao)建(jian)(jian)議階段(duan),輔助(zhu)文檔為主導階段(duan),這背(bei)后凸顯(xian)出諸多基(ji)礎設施的構建(jian)(jian)難題。

AI賦能(neng)企業(ye)內部的(de)(de)技術(shu)架構需要穩(wen)固(gu)的(de)(de)智算底座、模型層,以(yi)及(ji)包含易用(yong)開發、性能(neng)評測等(deng)(deng)工具的(de)(de)運營與(yu)應(ying)用(yong)層。模型層的(de)(de)資源(yuan)管理員主要關注底層資源(yuan)使用(yong)情況,開發者只需直(zhi)接導入模型做精調、推理等(deng)(deng)賦能(neng)業(ye)務。

▲云軸科技CTO王為

11、Alluxio湯文軍:AI時代,高性能分布式緩存如何實現極致I/O優化?

Alluxio解(jie)(jie)決(jue)方(fang)(fang)案架構師湯文軍分享說(shuo),企業在(zai)搭(da)建(jian)和(he)優(you)化(hua)AI高(gao)性能(neng)數據(ju)訪問平臺(tai)時(shi),面臨著數據(ju)方(fang)(fang)面的業務壓力、GPU稀缺昂貴(gui)且利用率不高(gao)、數據(ju)解(jie)(jie)決(jue)方(fang)(fang)案復(fu)雜等問題(ti)。針對這些問題(ti),Alluxio推出了去中心化(hua)的Alluxio Enterprise AI產(chan)品方(fang)(fang)案。

具體來看,針對ML/AI GPU訓練(lian)對I/O提出的(de)諸多要求,Alluxio使(shi)用一致性哈希在worker節點(dian)上(shang)緩(huan)存數據(ju)與(yu)元數據(ju),這顯著減少(shao)了(le)I/O RPC長度(du),減少(shao)單點(dian)故障并(bing)降低了(le)Master節點(dian)性能瓶頸;優化性能時,使(shi)用零拷貝優化、并(bing)行與(yu)隨機讀優化,解決了(le)讀放大問(wen)題。

最終,Alluxio實現了高性(xing)能、低延遲、高可用(yong)、容量(liang)線性(xing)擴展等(deng)(deng)優化效果,這(zhe)套(tao)方案可應用(yong)于數據(ju)預處理、模型訓練、部署、推理等(deng)(deng)環節,已(yi)在眾多場(chang)景實際(ji)落地,帶來GPU利用(yong)率(lv)、運維成本(ben)等(deng)(deng)方面的顯著收益。

▲Alluxio解決方案架構(gou)師湯文(wen)軍(jun)

12、澎峰科技張先軼:解讀AI算力部署進階路,從一體機到專線模式

澎峰科(ke)技創始人(ren)&CEO張(zhang)先軼分享(xiang)說,用(yong)戶在AI算(suan)力部署上的(de)策略通(tong)常從單機(ji)部署開始,例如使用(yong)一(yi)體機(ji)。隨著需求(qiu)的(de)增長,用(yong)戶會逐步(bu)擴展到私(si)有化部署,通(tong)過MaaS平臺納管(guan)更多硬件設備,并分批建設算(suan)力資源,還可以將現有服(fu)務器納入管(guan)理,形成(cheng)一(yi)種(zhong)類似擴容的(de)方案。

為了進(jin)一步提(ti)升(sheng)算(suan)力利用率(lv)(lv)和(he)數據(ju)隱私安全性(xing)(xing),用戶(hu)可以(yi)借(jie)助國產智算(suan)中心的(de)(de)(de)模(mo)型(xing)的(de)(de)(de)專(zhuan)線(xian)模(mo)式(shi)(shi)進(jin)行混(hun)合部(bu)署。這(zhe)種(zhong)模(mo)式(shi)(shi)不僅(jin)能(neng)提(ti)高計算(suan)中心的(de)(de)(de)資源利用率(lv)(lv),還能(neng)在保障(zhang)數據(ju)隱私的(de)(de)(de)同時,支(zhi)(zhi)持(chi)(chi)更(geng)多(duo)應用場景。從(cong)商業模(mo)式(shi)(shi)上看,專(zhuan)線(xian)部(bu)署采(cai)用ToB性(xing)(xing)質(zhi)的(de)(de)(de)計費方式(shi)(shi)。未(wei)來,用戶(hu)可以(yi)在此基(ji)礎上進(jin)行私有模(mo)型(xing)的(de)(de)(de)微(wei)調部(bu)署,支(zhi)(zhi)持(chi)(chi)更(geng)多(duo)應用的(de)(de)(de)開發與擴(kuo)展。

▲澎峰科(ke)技(ji)創始人&CEO張先軼

五、圓桌討論:DeepSeek給AI Infra帶來新機會,國產軟硬件發展正當時

圓桌討論環節以《DeepSeek給AI Infra帶來的(de)啟示與機(ji)會》 為(wei)主(zhu)題,由騰訊(xun)云專有云及智(zhi)算首席架構(gou)師(shi)方天(tian)戟(ji)主(zhu)持,回顧了過去兩個月AI從業(ye)者們圍繞DeepSeek、具身智(zhi)能等展開的(de)一系列(lie)技(ji)(ji)術(shu)攻關,北京智(zhi)源人工智(zhi)能研(yan)究院AI框(kuang)架研(yan)究負責人敖(ao)玉龍、澎峰科技(ji)(ji)創始(shi)人兼CEO張先(xian)軼、沐冰(bing)數據(ju)CTO邸澤民、云軸科技(ji)(ji)CTO王為(wei)分(fen)享了對最新產業(ye)趨勢的(de)觀察與思考。

1、DeepSeek開源帶來震撼,一體機可滿足基礎需求

騰(teng)訊(xun)云專(zhuan)有云及智算首(shou)席架(jia)構(gou)師方天戟(ji)強調DeepSeek具有技(ji)術創新性,基于H800在卡間通信受限的情(qing)況(kuang)下,大幅(fu)壓縮了大模型(xing)成(cheng)(cheng)本,使模型(xing)本地部(bu)署成(cheng)(cheng)為(wei)現實(shi)。

沐冰數據CTO邸澤民認為DeepSeek在開源(yuan)周中一系(xi)列開源(yuan)工作的(de)(de)最大(da)的(de)(de)震撼(han)在于(yu)展(zhan)現了(le)(le)如(ru)何在資源(yuan)受限的(de)(de)約束下,實現最優解(jie)的(de)(de)工程能力,充分(fen)挖掘了(le)(le)現有(you)算力的(de)(de)潛力。DeepSeek團隊(dui)不僅(jin)想到了(le)(le)精妙(miao)的(de)(de)優化技巧與方案,還完(wan)成了(le)(le)代碼與工程實現,并(bing)將(jiang)其(qi)完(wan)全開源(yuan),十(shi)分(fen)令人(ren)尊敬。

▲騰訊云專(zhuan)有云及智算首(shou)席架(jia)構師方天戟

談及近期銷售火爆的(de)DeepSeek一體(ti)機,方天戟認為(wei)這有(you)助于企(qi)業在保護數據安全的(de)情(qing)況下快速用(yong)上DeepSeek,北京智源人工(gong)智能(neng)研究院AI框架研究負責人敖玉龍(long)指(zhi)出(chu)用(yong)戶需要關(guan)注DeepSeek一體(ti)機部署后的(de)軟(ruan)硬件更新問題。

云(yun)軸科技CTO王為(wei)提到DeepSeek一體機為(wei)客戶提供了(le)入門的(de)解決方案(an),通過預裝模型(xing)和應用降低了(le)部署門檻,能夠(gou)快速(su)滿足基礎需求(qiu)。但(dan)隨著需求(qiu)增(zeng)長,客戶可能需要更復雜的(de)算力調度和混合(he)部署方案(an)。

2、國產芯片軟硬件可用性提升,如何繞開CUDA護城河?

敖玉(yu)龍記得在2017年(nian)-2018年(nian),他(ta)嘗試將大規模(mo)并行技術運(yun)用到AI計算中(zhong),但(dan)當時相關(guan)技術尚未完善。過去幾年(nian)AI Infra快速發展,有(you)力地支持了大模(mo)型的技術進步(bu)。

在智(zhi)源(yuan)(yuan)研(yan)究院的(de)工作過程中,他接觸到了(le)端側與服務(wu)器側的(de)大量國產芯片。目前,國產芯片的(de)硬件、軟件都已具備一定(ding)可用(yong)性,主要(yao)挑(tiao)戰(zhan)在于(yu)生態還(huan)相對落后,為此(ci)智(zhi)源(yuan)(yuan)打造(zao)了(le)開(kai)(kai)源(yuan)(yuan)開(kai)(kai)放統一軟件生態FlagOS來(lai)推動國產芯片生態發展。

▲北(bei)京(jing)智(zhi)源人(ren)工智(zhi)能研究院AI框架(jia)研究負(fu)責人(ren)敖玉龍

在ChatGPT爆(bao)火(huo)之(zhi)后(hou),關于DSA特定(ding)領域芯片(pian)或ASIC專用芯片(pian)是否會消(xiao)亡(wang)的討(tao)論不絕于耳。

邸澤民認為,對于(yu)特(te)定(ding)(ding)領域的計(ji)算(suan)負載而言,與(yu)(yu)GPGPU相(xiang)比(bi),DSA具有性(xing)(xing)能(neng),成本與(yu)(yu)能(neng)效(xiao)優勢。從目前(qian)趨勢來看,Transformer這(zhe)個模型架(jia)構的有效(xiao)性(xing)(xing)經過(guo)了驗(yan)證,短期內出(chu)(chu)現顛(dian)覆性(xing)(xing)變(bian)化(hua)的概率不高,那么一定(ding)(ding)會(hui)有對Transformer架(jia)構計(ji)算(suan)特(te)點(dian)更有針對性(xing)(xing)設計(ji)的專用芯片出(chu)(chu)現,不論是采用TPU的脈動陣列、存(cun)算(suan)一體或者別的什(shen)么技(ji)術(shu)路線,ASIC夠有效(xiao)降(jiang)低推(tui)理(li)計(ji)算(suan)成本,只有不斷降(jiang)低推(tui)理(li)成本,才更能(neng)讓大模型的應用實現普惠。

▲沐冰數(shu)據CTO邸澤民

王(wang)為也提到一(yi)(yi)些優(you)化技術(shu)在(zai)GPGPU上(shang)效率不是(shi)特別高,所(suo)以AI推理往ASIC上(shang)發展的可(ke)能(neng)性非常(chang)大。國產算力在(zai)推理上(shang)替(ti)代能(neng)力很強,在(zai)訓(xun)練上(shang)還需要一(yi)(yi)定時間追趕,但應該不會太久。

王為認為,在AI訓練方面(mian),英偉達(da)(da)目前優勢比較(jiao)突出,因為通信性能、通信庫(ku)等(deng)技(ji)術(shu)壁壘很高,但現在也有國產(chan)卡訓練較(jiao)大(da)大(da)參數模(mo)型的(de)案例(li),因此假以時(shi)日還是(shi)可(ke)以趕上(shang)(shang)的(de)。英偉達(da)(da)如今(jin)在數據發布(bu)上(shang)(shang)選擇性披露,著重在低精度(du)上(shang)(shang)、稀疏算(suan)力上(shang)(shang)等(deng),近年披露的(de)數據逐漸(jian)偏向商業宣傳性質(zhi),詳細(xi)的(de)技(ji)術(shu)披露較(jiao)少(shao),這使得評(ping)估(gu)其真(zhen)實性能需要更多(duo)測(ce)試。

▲云軸科技CTO王為

邸澤民預測在(zai)AI訓(xun)練場景,GPGPU依舊將(jiang)會繼續占(zhan)據(ju)主導(dao)地(di)位。在(zai)他看(kan)來,國(guo)產算(suan)力如(ru)果要通過對(dui)PyTorch、TensorFlow等框架(jia)兼容,并覆蓋數千(qian)個(ge)長尾算(suan)子(zi),以實(shi)(shi)現與英偉達的CUDA護城河(he)的競(jing)爭甚(shen)至替換,在(zai)短期內是不現實(shi)(shi)的。但(dan)如(ru)果將(jiang)這種兼容與替換目標進(jin)一步收斂、聚(ju)焦(jiao)到(dao)特定的模型(xing)或者特定領域(yu)的模型(xing)訓(xun)練,比(bi)如(ru)DeepSeek這樣的語言模型(xing),國(guo)產廠商(shang)是有適(shi)配(pei)能力與突破空(kong)間的。除了(le)框架(jia)與算(suan)子(zi)適(shi)配(pei)外,另一個(ge)難點(dian)在(zai)于進(jin)一步提升通信(xin)庫的效率(lv)。

3、混合推理系統是必然趨勢,具身智能將催化AI Infra演進

澎峰(feng)科技創(chuang)(chuang)始(shi)人兼CEO張先軼談道,英偉達在(zai)硬件(jian)創(chuang)(chuang)新上的持續投入,使其在(zai)AI領域保持領先;英偉達在(zai)精度上的創(chuang)(chuang)新不斷提升了性能峰(feng)值(zhi),也為其他芯(xin)片公司設立了競爭(zheng)壁壘。

他判斷未來在大規模部署的情況下,混合推理系統是必然的,能結合不同硬件的優勢以實現更高的性價比和性能。

▲澎峰科技創始人兼CEO張先軼

在混合云(yun)部署的實踐方(fang)面,張先軼(yi)認為(wei)當(dang)(dang)前對數字隱私要(yao)求(qiu)不是(shi)特(te)別高(gao)的客戶比較容易接(jie)受,可以利(li)用(yong)智算中(zhong)心的算力進行補充,比如(ru)一些學校或(huo)中(zhong)小B端。大B端通常(chang)對私有化要(yao)求(qiu)會(hui)更高(gao)。當(dang)(dang)前做AI機(ji)器(qi)人的企業(ye),基本(ben)采(cai)用(yong)的是(shi)邊緣與云(yun)端結合的方(fang)式。

方天戟預測,從長遠來(lai)看,相比大語(yu)言模型,具身智(zhi)能(neng)可能(neng)會成為進一步(bu)促(cu)進未來(lai)AI Infra演進的(de)新應用領域。

敖玉龍提到具身(shen)智能機器(qi)人對端云協同(tong)、通信等方面(mian)提出了(le)新要求(qiu),目前機器(qi)人的大腦模(mo)型往(wang)往(wang)部署在(zai)云端,控(kong)制(zhi)運動的小腦模(mo)型部署在(zai)機器(qi)人本體,如(ru)何(he)實現低延(yan)遲的協同(tong)需要進一步探索(suo)。

結語:中國生成式AI浪潮波濤洶涌

中國生成式AI的每一次(ci)突破,從來(lai)不是某(mou)家企業的獨角戲(xi),而是產學研用協同攻堅的交響曲。

開年DeepSeek的(de)爆火,成為中國(guo)(guo)乃至世界生成式AI產業的(de)關鍵(jian)拐點(dian)。它顛覆(fu)了“堆砌算(suan)力”的(de)固有路徑(jing),開辟(pi)出一條“效率優先”的(de)創新路徑(jing),催化(hua)開源、推理(li)模(mo)型(xing)與AI Infra研發(fa)熱潮,更為端側(ce)AI與國(guo)(guo)產AI算(suan)力基礎設施的(de)落地(di)應用注(zhu)入了新動能(neng)。

站在技(ji)術(shu)與產業共振的(de)歷史節(jie)點(dian),我們(men)每一個人(ren),都(dou)正(zheng)在見證和參與一場激動人(ren)心的(de)技(ji)術(shu)躍遷。

春天來了,生成式AI的浪潮更(geng)加(jia)波濤洶涌,未(wei)來正(zheng)呼嘯而(er)至。

下一(yi)站(zhan),也(ye)許(xu)是(shi)基礎模型的飛躍式進化,也(ye)許(xu)是(shi)AI超級(ji)應用橫(heng)空出世,也(ye)許(xu)是(shi)人形機器人的覺醒,也(ye)許(xu)是(shi)商業價值(zhi)的裂變,也(ye)許(xu)是(shi)AGI新(xin)路(lu)徑(jing)的曙光。

生成(cheng)式AI正(zheng)以摧枯(ku)拉朽之勢重(zhong)塑(su)傳統產業(ye),創(chuang)新(xin)火種從未如此(ci)燎(liao)原(yuan),我們無(wu)比期待(dai)看到,中國科(ke)技企業(ye)在時代(dai)的(de)浪(lang)尖揚帆起航。


熱門文章
隨著人工智能技術從云端向終端遷移,端側AI直接在終端設備上運行AI模型算法,實現本地化數據處理,具有低延遲、高隱私性、低成本等優勢。端側AI正成為推動終端設備向更高階智能革新的核心力量。當AI開始擁抱
2025-04-08
X