智東西12月5日報(bao)道,今天,以“智能躍進 創造無(wu)限”為主題的2024中國生成(cheng)式AI大會(上海站)正(zheng)式開幕,大會現場(chang)座(zuo)無(wu)虛(xu)席。
大會為期兩(liang)天,共有50+位(wei)嘉賓基于(yu)前(qian)瞻(zhan)性視(shi)角為大家解(jie)構和(he)把(ba)脈生成式(shi)AI的技術產品創(chuang)新(xin)、商業(ye)落地解(jie)法、未來趨勢走向(xiang)與前(qian)沿(yan)研(yan)究焦點。
大會首日,由復旦大學計算機科學技術學院教(jiao)授、上海市(shi)智能信息處理實(shi)驗室副(fu)主任張奇領銜,17位嘉賓圍(wei)繞(rao)通(tong)用大語言模(mo)型、多模(mo)態大模(mo)型、行(xing)業大模(mo)型、垂直(zhi)大模(mo)型、智能體、具身(shen)智能、大模(mo)型對齊與安全、投資風向(xiang)等前沿議題,分享了最新(xin)的研發與實(shi)踐經(jing)驗。
“大模型技術作為人工智能領(ling)域的重要分支,正在(zai)不斷推動(dong)著產(chan)業(ye)的創新和轉型。”上(shang)海市(shi)人(ren)工(gong)(gong)智能行業(ye)協會副秘書長徐琦在(zai)致辭中(zhong)表(biao)示(shi),“在(zai)此背景(jing)下(xia),舉辦此次生(sheng)成式(shi)AI大會,旨在(zai)進(jin)一步推動(dong)上(shang)海市(shi)生(sheng)成式(shi)AI產(chan)業(ye)的發展,促進(jin)院校(xiao)和研究機(ji)構(gou)(gou)的學術(shu)成果傳播,同(tong)時,加強與(yu)長三角地區優秀企業(ye)和機(ji)構(gou)(gou)的聯動(dong)交流,共同(tong)探索人(ren)工(gong)(gong)智能的未來(lai)發展之路(lu)。”
▲上海市(shi)人工智(zhi)能行業協會副秘書長(chang)徐琦
徐琦指出,上(shang)海一直在AI領(ling)域扮演(yan)著引領(ling)者(zhe)的角色。產(chan)業規模方(fang)面(mian)(mian),上(shang)海規模以上(shang)AI企(qi)業已從2018年(nian)的183家增(zeng)長到2023年(nian)的348家,產(chan)業規模從1340億元(yuan)增(zeng)長到3808億元(yuan),居全國(guo)前列。創(chuang)新成果方(fang)面(mian)(mian),目前上(shang)海已有46款大(da)模型通過備案,多款通用人(ren)形機(ji)器人(ren)原型機(ji)發布(bu)。產(chan)業生態方(fang)面(mian)(mian),上(shang)海加快打造(zao)創(chuang)新載(zai)體(ti),吸引企(qi)業集(ji)聚;持(chi)續(xu)優化算力(li)基(ji)礎設施(shi)布(bu)局,加大(da)算力(li)資源統(tong)籌供給;完善語料數據基(ji)礎支撐體(ti)系(xi)。
面向未來,上海(hai)將牢牢把握(wo)通用人工(gong)智能發(fa)展(zhan)機遇,與(yu)海(hai)內外(wai)企(qi)業、機構等緊密合作,持續(xu)推(tui)動人工(gong)智能創新發(fa)展(zhan),加快(kuai)塑造高(gao)質量發(fa)展(zhan)新動能、新優勢(shi)。
作為智一(yi)科(ke)技傾力打造的產(chan)業峰(feng)會(hui)(hui)IP,2024中國(guo)生(sheng)(sheng)成式AI大會(hui)(hui)由(you)智東西和(he)智猩猩聯(lian)合主辦(ban),此(ci)(ci)次會(hui)(hui)議超(chao)過3000人(ren)報名參會(hui)(hui),現(xian)場座(zuo)無虛席。中國(guo)生(sheng)(sheng)成式AI大會(hui)(hui)已在(zai)北京成功舉辦(ban)兩屆,此(ci)(ci)次是中國(guo)生(sheng)(sheng)成式AI大會(hui)(hui)首次登陸(lu)上海舉辦(ban)。
智一科技聯合創(chuang)始人、CEO龔(gong)倫常代表主辦(ban)方(fang)為大(da)(da)會致(zhi)辭:“七年前,我(wo)們(men)的(de)(de)首(shou)屆(jie)AI產業大(da)(da)會在(zai)上海(hai)成功舉(ju)辦(ban),正式(shi)開(kai)啟(qi)了我(wo)們(men)在(zai)AI領域舉(ju)辦(ban)產業峰會的(de)(de)征程。7年后,我(wo)們(men)的(de)(de)生(sheng)成式(shi)AI大(da)(da)會再次回到(dao)上海(hai)。”他提到(dao)與(yu)生(sheng)成式(shi)AI大(da)(da)會北京站相比(bi),上海(hai)站大(da)(da)會從產業和(he)技術兩個維度,圍繞(rao)模(mo)型(xing)、AI Infra、應用、技術四個方(fang)向(xiang)對內容(rong)進行了升級。
▲智一科(ke)技聯合創始人、CEO龔倫常
龔倫常還預告了今年以及明年多個重要會議——下月初,第四屆全球自動駕駛峰會將在北京舉辦;2025年上海車展期間也將舉辦產業峰會;2025年,AI芯片、生成式(shi)AI等(deng)領(ling)域(yu)品牌(pai)峰會將(jiang)持(chi)續舉辦(ban)。歡迎(ying)大家參會。
高(gao)端對話環節以“大(da)模型時代,資本市(shi)場(chang)的(de)新(xin)風(feng)向”為主題(ti),由(you)智(zhi)(zhi)一(yi)科技聯合創始人、智(zhi)(zhi)車芯產媒矩陣總編(bian)輯張國仁主持,靖(jing)亞(ya)資本合伙(huo)人任曉東、BV百度風(feng)投(tou)執行董事溫永騰、達晨財智(zhi)(zhi)晨云子基金(jin)合伙(huo)人朱翔就生(sheng)成式AI投(tou)資策(ce)略、大(da)模型市(shi)場(chang)格(ge)局、大(da)模型商業(ye)化路徑(jing)等話題(ti)分享觀點。
張國仁談道,從社(she)會的(de)發展來看,這(zhe)一(yi)波生(sheng)成式AI引領的(de)科技發展是百年一(yi)遇(yu)的(de)新生(sheng)產力革(ge)命,無論是個(ge)人交互陪伴,還是生(sheng)活、工作、學(xue)習都(dou)在發生(sheng)一(yi)輪新變革(ge)。但不管(guan)風向(xiang)如何改變,我們(men)對AI新技術的(de)發展仍保持美(mei)好向(xiang)往。
▲智一(yi)科(ke)技聯合創始人、智車芯產(chan)媒(mei)矩陣總編輯(ji)張國仁
靖(jing)亞資(zi)本合伙人任曉東認為(wei),大(da)模型產品分為(wei)公(gong)有云和私有化兩(liang)類(lei),公(gong)有云由(you)于技術開源(yuan),大(da)廠易實現導致初創(chuang)(chuang)公(gong)司(si)機會極少(shao);在(zai)私有化部(bu)署(shu)上,初創(chuang)(chuang)公(gong)司(si)可(ke)以根(gen)據企業場(chang)景進行定制(zhi)部(bu)署(shu),大(da)廠在(zai)這方面優(you)勢不明顯。另外,在(zai)AI基礎設施(shi)軟件領域,創(chuang)(chuang)業公(gong)司(si)如果選擇開源(yuan)則難有作為(wei),難以和大(da)廠進行競爭(zheng)。
他(ta)還強(qiang)調,在AI投(tou)資(zi)中,合(he)規(gui)是第一原則,要符合(he)國家政策法規(gui)以及與LP簽(qian)訂的協議(yi),什么領(ling)域(yu)不能投(tou)資(zi)、什么應該披(pi)露等都予以遵守。
▲靖亞資本合伙人任曉東(dong)
BV百度風(feng)投執(zhi)行董事(shi)溫(wen)永(yong)騰(teng)說,BV自2021年起密集關注生成(cheng)(cheng)式(shi)AI創企,從最初到現(xian)在(zai)(zai),一直(zhi)認為生成(cheng)(cheng)式(shi)AI會重(zhong)塑內容生產(chan)和(he)分發方(fang)式(shi),Diffusion的(de)出現(xian)讓他們在(zai)(zai)多模態(tai)領域找到了生數科技以及其(qi)他模態(tai)方(fang)向上(shang)的(de)優秀(xiu)公司(si)。現(xian)在(zai)(zai),AI Agent的(de)發展使(shi)其(qi)開(kai)始思(si)考對智能勞動力的(de)投資。
Sequoia Capital(紅杉資(zi)本美國(guo))分析,去年(nian)全球生成式AI的(de)商業化達30億美金。產業中很難看到(dao)一個剛開始受關注一年(nian)的(de)市(shi)場方向,在一年(nian)內(nei)就實現巨(ju)大(da)的(de)收(shou)入增長。因(yin)為大(da)模型公司普遍都(dou)遵從強研發投(tou)入的(de)運營(ying)模式,融資(zi)和(he)商業化都(dou)是關鍵(jian)問(wen)題,尤(you)其是B端商業化的(de)進展(zhan)還是需要時(shi)間和(he)耐心。但他(ta)相信(xin)實現更(geng)大(da)增長的(de)這一天一定(ding)會來,只是時(shi)間問(wen)題。
▲BV百度風投執行董事溫永騰
達(da)晨財智晨云子(zi)基(ji)金合伙(huo)人朱翔談(tan)道,國(guo)內大模型創企(qi)仍在追(zhui)趕OpenAI的節奏,處(chu)于軍備(bei)競(jing)賽階段,且部分公司因融資問題(ti)發展(zhan)較慢。
生成式AI領(ling)域開始涌(yong)現與OpenAI不同的(de)訓練方(fang)向,如世(shi)(shi)界(jie)模型(xing)和具身智能。近期,李飛(fei)飛(fei)和谷(gu)歌(ge)DeepMind發布了(le)新世(shi)(shi)界(jie)模型(xing),新的(de)Scaling Law通過合(he)成數據推動更高效的(de)模型(xing)生成,可以(yi)有(you)效避免(mian)Scaling Law放緩的(de)問(wen)題。
朱翔說,具身(shen)智(zhi)能(neng)是AGI的關鍵載體,但面臨高訓練成本和硬件限(xian)制等挑戰。他預測,具身(shen)智(zhi)能(neng)量(liang)產前可能(neng)會經歷2-3年(nian)的“瓶頸期(qi)”,期(qi)間(jian)部分(fen)公司(si)將退出市場。
▲達晨(chen)財智晨(chen)云子基金合伙(huo)人(ren)朱(zhu)翔
在今(jin)日大(da)會上(shang),復旦大(da)學(xue)計算機科(ke)學(xue)技(ji)術學(xue)院教授(shou)、上(shang)海(hai)市智能(neng)信息處理實驗室副主(zhu)(zhu)任張(zhang)奇深入解(jie)讀了大(da)語言模(mo)(mo)型(xing)(xing)的能(neng)力(li)邊(bian)界及發展(zhan)思考,MiniMax副總裁劉(liu)華探討了大(da)模(mo)(mo)型(xing)(xing)今(jin)年大(da)模(mo)(mo)型(xing)(xing)發展(zhan)重(zhong)點的變化,西(xi)湖(hu)大(da)學(xue)助理教授(shou)張(zhang)馳分享了全場景(jing)通(tong)用的單目(mu)深度估計大(da)模(mo)(mo)型(xing)(xing),北京(jing)大(da)學(xue)(臨(lin)港)大(da)模(mo)(mo)型(xing)(xing)對齊執行中心主(zhu)(zhu)任、北京(jing)阿萊門科(ke)技(ji)有限公(gong)司(si)CEO徐驊討論了模(mo)(mo)型(xing)(xing)安(an)全。
張奇認為,大模(mo)型發展迅速但目前仍處(chu)于“記(ji)憶階段”。大模(mo)型訓(xun)練(lian)有不同階段,從知識(shi)壓縮和表示學習、能力注入到生(sheng)成式任務能力提升,訓(xun)練(lian)只需(xu)要非常少的(de)數據,完成某個(ge)領(ling)域(yu)知識(shi)問答僅需(xu)要60條訓(xun)練(lian)數據,但“怎么加數據”是最(zui)難(nan)的(de)問題。
▲復旦大學(xue)計算機科學(xue)技術學(xue)院教(jiao)授、上海市(shi)智能信(xin)息處理實驗室(shi)副主任張奇
他(ta)讓大模(mo)型做(zuo)了今年高考(kao)數學題后發現,大模(mo)型在數學運(yun)算中(zhong)的(de)計算過程和答(da)案選擇不一致。結果表(biao)明,模(mo)型雖能完成特定任(ren)務推理(li),但(dan)并(bing)非真(zhen)正獲得了與人相似的(de)能力(li)。
張奇總結大(da)模(mo)型(xing)發展(zhan)有兩(liang)條路徑:一是跟(gen)隨OpenAI,以替代所有腦力(li)勞(lao)動為(wei)目標(biao);二(er)是不追(zhui)求替代通用任務(wu),只(zhi)完成特定事(shi)情。最關(guan)鍵的是落地場景(jing)選擇和大(da)模(mo)型(xing)能力(li)邊(bian)界判(pan)斷。
對(dui)于今年(nian)(nian)大(da)模(mo)型領域(yu)的變化,MiniMax副總裁(cai)劉(liu)華認為,與2022-2023年(nian)(nian)基礎大(da)模(mo)型在文本領域(yu)能(neng)力的飛速提(ti)升(sheng)(sheng)相(xiang)比,2024年(nian)(nian)基礎大(da)模(mo)型能(neng)力的提(ti)升(sheng)(sheng)更(geng)全面,體現在了文本、語音(yin)、音(yin)樂、視頻等多個領域(yu)。
他表示(shi),目前多模態大(da)模型(xing)已賦能我國(guo)的(de)千行百業,轉化為新質生產力。比如,MiniMax在(zai)國(guo)內服務了(le)3萬多家客戶(hu);公司的(de)視頻大(da)模型(xing)受到180個(ge)國(guo)家AI創(chuang)業者的(de)喜愛,并在(zai)文(wen)化創(chuang)意、電商直(zhi)播等領域(yu)得到了(le)成熟應(ying)用。
▲MiniMax副總裁劉華
他判斷,多模(mo)(mo)態(tai)(tai)大(da)模(mo)(mo)型(xing)仍(reng)處于快速發展階段,尚未(wei)看到(dao)模(mo)(mo)型(xing)能力的(de)上限(xian)。面向(xiang)未(wei)來(lai),MiniMax將繼續(xu)快速迭代自研的(de)多模(mo)(mo)態(tai)(tai)大(da)模(mo)(mo)型(xing),并聚焦于降(jiang)低模(mo)(mo)型(xing)錯誤率(lv)、實現無(wu)限(xian)長的(de)輸(shu)(shu)入和輸(shu)(shu)出、推動多模(mo)(mo)態(tai)(tai)更加(jia)自然融合這3個方(fang)面。
西湖大(da)(da)(da)學助理教授(shou)張馳(chi)分享(xiang)了(le)全(quan)(quan)場景通用的(de)單目(mu)(mu)深(shen)(shen)度(du)(du)估計(ji)大(da)(da)(da)模(mo)型,在解決傳統(tong)單目(mu)(mu)深(shen)(shen)度(du)(du)估計(ji)方式痛點方面的(de)思考。傳統(tong)單目(mu)(mu)深(shen)(shen)度(du)(du)估計(ji)方式依賴激(ji)光雷達等專業設備,數(shu)據(ju)采集(ji)難度(du)(du)大(da)(da)(da)、成本高,導致數(shu)據(ju)少且(qie)分散。基于AI大(da)(da)(da)模(mo)型,其可(ke)以更(geng)高效地(di)利用大(da)(da)(da)數(shu)據(ju)訓練(lian)、視覺大(da)(da)(da)模(mo)型先驗和(he)訓練(lian)優化范(fan)式,從而(er)追(zhui)求全(quan)(quan)場景泛化。
▲西湖大學助理教授(shou)張馳
同時,他提到Zero-shot單目深度估計(ji)方式勝(sheng)在靈活易搭載(zai),可(ke)應用于機器人、自動駕駛、AI文生3D、AI圖生3D等領域。
西湖(hu)心(xin)辰CEO、西湖(hu)大(da)(da)學深(shen)(shen)度學習實驗室成(cheng)(cheng)果轉化負責人醒辰介紹了西湖(hu)心(xin)辰在AI情(qing)感(gan)理解與(yu)(yu)多模(mo)(mo)態長程對(dui)話(hua)領域(yu)的探(tan)索與(yu)(yu)成(cheng)(cheng)果。他們團隊自創立(li)以(yi)(yi)來便(bian)致力(li)于研(yan)發超擬人的情(qing)商型(xing)(xing)(xing)大(da)(da)模(mo)(mo)型(xing)(xing)(xing),以(yi)(yi)適配各種涉及(ji)復雜情(qing)感(gan)的人機互動場景。旗下自研(yan)的多模(mo)(mo)態通用(yong)基座(zuo)大(da)(da)模(mo)(mo)型(xing)(xing)(xing)“西湖(hu)大(da)(da)模(mo)(mo)型(xing)(xing)(xing)”采用(yong)深(shen)(shen)度對(dui)齊(qi)技術(shu)與(yu)(yu)多模(mo)(mo)態情(qing)感(gan)識(shi)別(bie)技術(shu),增強了AI的情(qing)感(gan)識(shi)別(bie)與(yu)(yu)需(xu)求理解能力(li),讓(rang)人機長程對(dui)話(hua)成(cheng)(cheng)為現實。
▲西湖心辰(chen)CEO、西湖大學深度(du)學習實驗室成果轉化(hua)負責人醒辰(chen)
今年該(gai)公司推(tui)出(chu)的(de)國內首(shou)個端到端通用語音大模型心(xin)(xin)辰Lingo,補足了(le)語音交互能(neng)力,讓AI更像人(ren)、懂人(ren)心(xin)(xin)、說人(ren)話。這些“超擬人(ren)”技(ji)術已被應用于心(xin)(xin)辰旗下的(de)AI心(xin)(xin)理咨詢陪伴(ban)產品“聊(liao)會小天”。
大(da)模(mo)(mo)型(xing)(xing)創(chuang)新技術的(de)演進(jin)也(ye)在加速。RockAI CTO楊華分享(xiang)了(le)非(fei)Transformer架構大(da)模(mo)(mo)型(xing)(xing)Yan在端側的(de)實踐。Transformer架構雖在大(da)模(mo)(mo)型(xing)(xing)領域(yu)取得巨(ju)大(da)成功,但人(ren)們也(ye)開(kai)始思考是否(fou)過度依(yi)賴(lai)它以及(ji)現有(you)大(da)模(mo)(mo)型(xing)(xing)形態(tai)的(de)可持續性(xing)。
▲RockAI CTO楊華
Yan架構包(bao)含類腦(nao)激活機(ji)制和MCSD,前者參(can)照人腦(nao)神經網絡(luo),后者在訓(xun)練(lian)時可(ke)充分利用GPU計算能力,降低功耗。基于此架構的多(duo)模態大(da)模型(xing)在手(shou)機(ji)、電腦(nao)、機(ji)器(qi)人、無人機(ji)、樹(shu)莓派等端側設(she)備(bei)上均可(ke)部署,且模型(xing)具有強大(da)的指令跟隨能力、多(duo)應用場(chang)景(jing)。自主學習、群(qun)體(ti)智能也是RockAI在大(da)模型(xing)領域的思考和探索(suo)。
AI應用的(de)安全(quan)至(zhi)關重要。北京大(da)學(臨港(gang))大(da)模型對齊執(zhi)行中心主任、北京阿萊門科技有限公(gong)司CEO徐驊(hua)分析了(le)大(da)模型安全(quan)與實用性的(de)矛盾,分享(xiang)了(le)多模態對齊的(de)探索。
▲北(bei)(bei)京大學(臨港)大模型對齊執(zhi)行中(zhong)心(xin)主任、北(bei)(bei)京阿萊門(men)科技有(you)限公司CEO徐(xu)驊
徐驊談道,過度追求安全(quan)可能犧(xi)牲實用(yong)性(xing)。為此,他提(ti)出了價值(zhi)對(dui)齊方案,設定“3H原則”(Helpful、Honest、Harmless)為目標,確(que)保模型符(fu)合人(ren)類價值(zhi)觀。他強調,Aligner對(dui)齊器方案在多模態(tai)場景(jing)中平衡安全(quan)與實用(yong)性(xing),下一(yi)步(bu)將聚焦提(ti)升模型在醫療、教(jiao)育等領域的適配能力(li),突破人(ren)類專家(jia)上限,推動(dong)AGI發展。
大(da)模(mo)型的落地應(ying)用是2024年的熱點話題,具身智(zhi)能、3D生成、AI智(zhi)能體、音樂(le)生成等創新(xin)玩法層出不窮。
1、AI Agent已實現具體算法落地,商務場景應用價值凸顯
AI Agent的多模(mo)態(tai)感知(zhi)、記憶增強和推理(li)能力正逐步提升(sheng),聯匯科技(ji)CEO兼首(shou)席科學家趙天成(cheng)談道,行業正在從“LLM-First”轉(zhuan)向更加符合人類認知(zhi)的“Agent-First”架構。通過新(xin)算法,AI Agent能夠(gou)在視覺信息(xi)不(bu)清晰時動態(tai)放大(da)畫面(mian)并進(jin)行信息(xi)分析,從而提升(sheng)多模(mo)態(tai)感知(zhi)能力,使7b模(mo)型推理(li)精度(du)可以超越(yue)gpt-4o大(da)模(mo)型,達到(dao)接(jie)近人類基準的水平。
▲聯匯(hui)科技CEO兼(jian)首席科學家趙天成(cheng)
在推(tui)理、記憶和感知三個核心場景中(zhong),AI Agent已(yi)經實現(xian)了(le)具(ju)體的(de)(de)算法落地(di)。聯匯科(ke)技(ji)推(tui)出了(le)全面開源的(de)(de)Agent框架,通過構建標準化的(de)(de)基本框架支持AI Agent持續優化。
WeMeet薈神(shen)基于大模型構建了多(duo)(duo)智能(neng)體商(shang)務互聯平臺(tai),WeMeet薈神(shen)創始人(ren)顧學(xue)斌提到AI在商(shang)務場景應(ying)用具(ju)有(you)多(duo)(duo)方面重要(yao)價(jia)值(zhi)。
▲WeMeet薈神創始人顧學斌(bin)
例如為(wei)商務(wu)(wu)人士(shi)配備(bei)的AI助理;在不同語言環(huan)境下(xia)為(wei)商務(wu)(wu)活動提供支持幫助人們(men)跨越(yue)語言障礙(ai)進行交流(liu);解決商機生(sheng)成的問(wen)題,讓潛在買家和(he)產業賣家之間的聯系更加(jia)緊(jin)密;還(huan)可(ke)以快速生(sheng)成會議應(ying)用等。最后(hou),他還(huan)強調了(le)安全問(wen)題,要做好生(sheng)成式(shi)AI服務(wu)(wu)備(bei)案,確保商務(wu)(wu)場景下(xia)AI應(ying)用穩定、可(ke)靠地發展。
2、端到端具身多模態大模型,瞄準機器人泛化
銀(yin)河通用機器(qi)(qi)人聯(lian)創合伙人、大(da)(da)模型(xing)(xing)負責(ze)人,北京(jing)智(zhi)源(yuan)人工(gong)智(zhi)能研究院具身智(zhi)能PI張直政博(bo)士談道(dao),具身智(zhi)能從模型(xing)(xing)到(dao)(dao)產品再到(dao)(dao)新質生(sheng)產力(li),僅關(guan)(guan)注“任務自動(dong)化”還不(bu)夠,銀(yin)河通用正(zheng)在追求的是“流程自動(dong)化”。而(er)實(shi)現(xian)這(zhe)一點的關(guan)(guan)鍵在于利用大(da)(da)規模仿真合成(cheng)數(shu)據驅(qu)動(dong)機器(qi)(qi)人從底層向上實(shi)現(xian)環(huan)境感知與(yu)動(dong)作(zuo)技能學(xue)習能力(li)的突破。從將3D小(xiao)模型(xing)(xing)與(yu)動(dong)作(zuo)大(da)(da)模型(xing)(xing)結合的大(da)(da)模型(xing)(xing)系統(tong)到(dao)(dao)端到(dao)(dao)端具身多(duo)模態大(da)(da)模型(xing)(xing),銀(yin)河通用全(quan)面布局,重點提升機器(qi)(qi)人在真實(shi)場景中的泛化工(gong)作(zuo)能力(li)。
▲銀河通(tong)用機器人(ren)聯創合(he)伙人(ren)、大模型(xing)負責(ze)人(ren),北京智源(yuan)人(ren)工智能研究院(yuan)具(ju)身智能PI張直政博士
談及未(wei)來,他認為具身智能的發展方(fang)向是“機器人大腦、小腦與(yu)(yu)硬(ying)件(jian)本體(ti)”協同進化(hua),重點(dian)關注其在“流程自動(dong)化(hua)”中(zhong)的泛(fan)化(hua)性(xing)突(tu)破(po),從而推(tui)(tui)動(dong)機器人在推(tui)(tui)理與(yu)(yu)執行任(ren)務(wu)中(zhong)更加高效、智能地(di)完成(cheng)更復雜(za)的移動(dong)操作任(ren)務(wu)。
3、3D、音樂生成到達爆發節點,展現多場景商業化應用潛力
在(zai)3D生成方面,VAST CTO梁鼎分析了(le)在(zai)大(da)模(mo)型加持下,3D AIGC的(de)發展與應用。在(zai)他看來,3D和其(qi)他多模(mo)態大(da)模(mo)型發展歷程(cheng)(cheng)類似,都會經(jing)歷從技術積累到某(mou)個時間(jian)點(dian)爆(bao)發的(de)過(guo)程(cheng)(cheng),3D目前已經(jing)到了(le)爆(bao)發節(jie)點(dian)。
▲VAST CTO梁鼎
他認為3D AIGC在多個場景都能進行商業化應用,如在傳統游戲影視動畫中實現降本增效及帶來新玩法;工業中能實現3D打印定制化生產;社交直播電商等元宇宙領域也可應(ying)用(yong),還能用(yong)于定制(zhi)玩(wan)具及與教育結合。
2024年是AIGC音(yin)樂(le)爆發(fa)元(yuan)年,趣丸科技(ji)副總裁賈朔認為,人(ren)工(gong)智能(neng)的創新發(fa)展大大降低了(le)音(yin)樂(le)創作門檻,國產(chan)AI音(yin)樂(le)的歌聲自然度更是突破人(ren)耳識(shi)別閾值,效果比肩美(mei)國頭部模型(xing)。他分享了(le)人(ren)與音(yin)樂(le)的AI交互形式的變化(hua),從文(wen)生(sheng)(sheng)音(yin)樂(le),到三(san)鍵成(cheng)曲,再到哼唱成(cheng)曲。今年6月份,天譜樂(le)全球(qiu)首發(fa)多模態音(yin)樂(le)生(sheng)(sheng)成(cheng)模型(xing),支(zhi)持視頻成(cheng)曲和圖片成(cheng)曲功能(neng),一(yi)鍵根據用(yong)戶視頻或圖片生(sheng)(sheng)成(cheng)一(yi)首完(wan)整(zheng)的音(yin)樂(le)。
▲趣丸科(ke)技副(fu)總裁賈(jia)朔
此外,賈(jia)朔在現場首次預告了天(tian)譜(pu)樂(le)的新功(gong)能——MidiRender,模型如同一個精準、可控音樂(le)版的Control Net,可依據原創(chuang)音樂(le)片段填充歌(ge)詞(ci)、完成編曲。
4、法律、醫療垂直賽道模型落地,螞蟻加速AI商業化
華院(yuan)計算大(da)模(mo)(mo)型(xing)(xing)和(he)(he)知識(shi)推理算法(fa)(fa)(fa)負責人蔡華拆解了(le)華院(yuan)法(fa)(fa)(fa)律大(da)模(mo)(mo)型(xing)(xing)的(de)底層技術架構(gou)(gou)及其(qi)5大(da)主要(yao)落地場景。一般(ban)的(de)通用大(da)模(mo)(mo)型(xing)(xing)不(bu)足以(yi)覆(fu)蓋法(fa)(fa)(fa)律領域(yu)的(de)需求,為(wei)了(le)讓大(da)模(mo)(mo)型(xing)(xing)更適(shi)用于法(fa)(fa)(fa)律專業領域(yu),該公司(si)收集了(le)多源異構(gou)(gou)知識(shi)數(shu)據,包括6大(da)類型(xing)(xing)的(de)基礎知識(shi),并以(yi)法(fa)(fa)(fa)條和(he)(he)案(an)件為(wei)中心節(jie)點(dian)搭建關系圖譜。
▲華院計算大模型和知識推理算法負責人蔡華
目前,其(qi)應(ying)用場(chang)景(jing)主要分為法(fa)治業務和(he)(he)法(fa)治決(jue)策兩(liang)大板塊,具體(ti)有類(lei)案推薦(jian)、法(fa)條推薦(jian)、判決(jue)文書生成、普(pu)法(fa)反詐宣(xuan)傳(chuan)數字人(ren)一體(ti)機(ji)和(he)(he)小雪(xue)人(ren)法(fa)律(lv)智能助手等(deng)。
騰訊(xun)優圖(tu)實驗室天衍研究中心負責人、專家研究員吳賢提到了目前基于醫(yi)療(liao)大(da)模型(xing)的十大(da)應用場景,包括(kuo)科室導診、醫(yi)生(sheng)推(tui)薦、預問診、醫(yi)患對(dui)話領域的病情追問、病例生(sheng)成、出院(yuan)小(xiao)結(jie)生(sheng)成、醫(yi)藥知識回答、臨(lin)床執業醫(yi)師考試、藥企內部效率提升(sheng)以及醫(yi)學(xue)科普(pu)文章生(sheng)成。
▲騰訊優圖實(shi)驗(yan)室天衍(yan)研究中心負責人、專家研究員吳賢
他還(huan)介紹了在減輕大模型(xing)幻覺,語言不均衡問題,大模型(xing)評測問題,以及多語言,多模態醫學任(ren)務上的最新研(yan)究(jiu)進展。
螞蟻(yi)(yi)集團基礎智能技術部總(zong)監趙耀(yao)分享(xiang)了大(da)語言模(mo)型(xing)在業務中的應用以及如何(he)通過(guo)技術手段解決推理(li)(li)效率、可靠(kao)性(xing)(xing)和可用性(xing)(xing)問題。螞蟻(yi)(yi)集團通過(guo)知識(shi)蒸餾和知識(shi)遷移(yi),平衡(heng)了推理(li)(li)效率與(yu)精(jing)度,其中蒸餾將大(da)模(mo)型(xing)知識(shi)轉移(yi)至小(xiao)模(mo)型(xing),減少(shao)計算量并保持(chi)精(jing)度;知識(shi)遷移(yi)幫助(zhu)模(mo)型(xing)快速適應不同場景,提(ti)升應用效果(guo)。
▲螞蟻集(ji)團基礎智(zhi)能技術(shu)部總監趙耀(yao)
此外,螞蟻(yi)集團還通(tong)過壓縮和剪枝技術降(jiang)低成本與(yu)能耗(hao),提(ti)升(sheng)計算效(xiao)率,減少硬件投入。公司目(mu)標是推動AI商業化,普及應用。
除上(shang)述嘉賓外(wai),還有6位青年學者(zhe)和(he)(he)技(ji)術專家在下午的(de)端側生(sheng)成式(shi)AI技(ji)術研討會上(shang)進行了干貨分享和(he)(he)圓(yuan)桌Panel討論。
繼連(lian)續在(zai)北(bei)京(jing)舉辦兩場聚(ju)(ju)焦生(sheng)成(cheng)式(shi)AI的(de)高規格創新峰會,今天,智東西與智猩(xing)猩(xing)首(shou)次落地上海聯合舉辦聚(ju)(ju)焦生(sheng)成(cheng)式(shi)AI領域的(de)行業盛會,希(xi)望通(tong)過豐富(fu)的(de)議(yi)程(cheng)設(she)置、多(duo)元化的(de)嘉賓經驗分享與觀點碰撞(zhuang),讓大(da)家不虛此行。
明(ming)日(ri)精彩繼續,25位產(chan)學研代(dai)表將(jiang)圍(wei)繞(rao)AI Infra、AI視頻生(sheng)成、具身(shen)智能等議題,共探中(zhong)國(guo)生(sheng)成式AI產(chan)業的脈搏。