看不懂生成式AI時代的商業化前路?對大模型訓練和部署成本感到困擾?來,聽聽54位產學研投大咖的回答。
爆!爆!爆!好火爆的一(yi)場AI主題(ti)盛會。
智(zhi)東(dong)西4月19日報(bao)道,為期兩天的(de)2024中國生成(cheng)式AI大(da)會,今日在京圓滿收官。
54位產(chan)學研投嘉賓代表全程干貨爆棚,報(bao)名咨詢人數(shu)逾5200人,超(chao)過(guo)1800位觀眾到(dao)場參會,線上觀看(kan)人次更是超(chao)過(guo)850萬。
參會(hui)觀眾們的熱情溢滿了1230平(ping)方米主會(hui)場,連分(fen)會(hui)場收費制(zhi)的具身智(zhi)能、AI智(zhi)能體技術研討會(hui)和(he)免(mian)費開放的中國智(zhi)算中心創新論壇都座無虛席(xi),展(zhan)區附近交流討論聲此起彼伏。
▲中(zhong)(zhong)國智算中(zhong)(zhong)心創新論壇座無(wu)虛席(xi),連追加兩排座椅,還有(you)不少觀眾(zhong)站(zhan)著聽會(hui)
還有多個“行業首發”:會上(shang),2024「AI生產(chan)力創新(xin)先(xian)鋒(AiiP)-中(zhong)國生成(cheng)式AI企業TOP50」正式揭曉,李(li)未可科技發布面(mian)向眼鏡等未來終端定向優(you)化的(de)自研(yan)WAKE-AI多模(mo)(mo)態(tai)大模(mo)(mo)型,58同城宣布其(qi)大語言(yan)模(mo)(mo)型平臺今(jin)晚將(jiang)上(shang)線Llama 3。
▲智一(yi)科技(ji)聯(lian)合創始人、智車芯產媒矩陣總編輯張(zhang)國仁公布(bu)年度榜單
大會以“重構世界(jie) 奔赴未(wei)來”為(wei)主題,聚集(ji)54位產(chan)學研投嘉賓代(dai)表同臺共探生成(cheng)式AI全產(chan)業鏈的發展現狀與未(wei)來趨勢,為(wei)業界(jie)把握(wo)時代(dai)脈(mo)搏提供原創(chuang)性、高質量的洞(dong)見(jian)參考。
清華大學計算機NLP實驗室是國內開展NLP研究最早、深具影響力的科研單位。清華NLP實驗室的學術帶頭人——歐洲人文和自然科學院外籍院士、清華大學人工智能研究(jiu)院常(chang)務副院長孫(sun)茂(mao)松(song)教授(shou),為(wei)生(sheng)成式(shi)AI大會作開(kai)場報告(gao)。孫(sun)茂(mao)松(song)分享(xiang)道(dao),通(tong)用(yong)人(ren)工智(zhi)能已開(kai)始登上歷史舞臺,生(sheng)成式(shi)AI會開(kai)啟人(ren)類全新的創(chuang)造(zao)模(mo)式(shi)。原來的創(chuang)作往往是從人(ren)類創(chuang)造(zao)的現(xian)實空間出(chu)發,現(xian)在機器創(chuang)造(zao)了(le)更大的現(xian)實可能空間,使人(ren)們能通(tong)過鑒賞選(xuan)擇(ze)和修(xiu)改提升(sheng)進行創(chuang)作。
當前生(sheng)成(cheng)(cheng)式(shi)(shi)AI的(de)(de)基本定位是啟發、輔助人類,不會取代人類,因(yin)為(wei)(wei)其(qi)均屬于(yu)概率式(shi)(shi)方法范式(shi)(shi),兼具(ju)創造與幻覺一枚硬幣的(de)(de)兩面,難以精確操控。生(sheng)成(cheng)(cheng)式(shi)(shi)AI面臨(lin)的(de)(de)近期挑戰,一是走(zou)向(xiang)多智(zhi)能體,需要讓模型在盡量(liang)減少人為(wei)(wei)干(gan)預的(de)(de)情況下(xia)完成(cheng)(cheng)某(mou)些任務更加“靠譜”,二是走(zou)向(xiang)具(ju)身智(zhi)能,其(qi)中的(de)(de)關(guan)鍵難點是如何有效建立可計(ji)算的(de)(de)世界模型。
▲歐(ou)洲(zhou)人(ren)文(wen)和自然科學院外籍院士、清(qing)華大學人(ren)工智能研究院常務副院長孫茂松(song)
國(guo)內資深大(da)模型行業投(tou)資人,“清華系”、“北大(da)系”、“前(qian)大(da)廠(chang)高管”等光環加身的明星創業者(zhe)(zhe),國(guo)內外頂(ding)級AI大(da)廠(chang)的資深算(suan)法專家,三大(da)國(guo)內頭部AI研究機構的科學家與青年學者(zhe)(zhe),最懂AI基礎(chu)設(she)施的大(da)廠(chang)與創企嘉賓代表,異軍突起(qi)的爆款AIGC應用(yong)先行者(zhe)(zhe),他們(men)悉數而來(lai)。
大(da)會(hui)首日,25位嘉賓暢談大(da)語(yu)言模型、視頻生成、具身智能、音樂生成、世界模型、垂類(lei)行業大(da)模型、AI全棧(zhan)軟件、加速(su)大(da)模型端側部(bu)署等前沿議題。()
今日,來自生成式(shi)AI前線(xian)的(de)學術(shu)代(dai)表、商(shang)業領袖、技(ji)術(shu)專家(jia)、青年學者們,繼續分享對(dui)關(guan)鍵技(ji)術(shu)創(chuang)新(xin)、全棧軟件及智(zhi)算基礎設施升級、AI應用落地探(tan)索實踐、可(ke)持續商(shang)業模式(shi)的(de)趨勢(shi)洞察。其(qi)中多(duo)位嘉賓cue到了昨(zuo)夜(ye)新(xin)鮮(xian)登場的(de)Llama 3。
01.
AI Infra專場:攻克這些“基建”挑戰,
才能通往高階AGI
頂尖大(da)模型的(de)強大(da)性能(neng),不止有(you)賴(lai)于(yu)技術研發實(shi)力,還(huan)需要扎(zha)實(shi)的(de)工程功底。底層算力基(ji)礎設施和AI軟件基(ji)礎設施的(de)升級(ji),都在加速(su)大(da)模型訓練與部署的(de)過程中發揮了關鍵作用。
開源大模(mo)型(xing)領導者Meta最新發布的(de)開源力作Llama 3 8B和70B,再度例證攻克“基(ji)建(jian)”難關何其重要。據Meta披露,兩(liang)款(kuan)模(mo)型(xing)是(shi)同體量中最好(hao)的(de)開源模(mo)型(xing),Llama 3 400B還在訓練中;Llama 3用兩(liang)個定(ding)制24K GPU集群(qun)進(jin)行訓練,訓練數據量逾15T tokens,比Llama 2的(de)7倍還多。
▲Meta研究(jiu)團隊(dui)在4月15日評(ping)估了(le)預訓(xun)練(lian)和Instruct版中經過部分(fen)訓(xun)練(lian)的模型,并報告了(le)性能數據
這背后,Meta采(cai)用指令微調技術來改善對(dui)話效果(guo),并(bing)結合了數據并(bing)行、模型并(bing)行、流水線(xian)并(bing)行三類(lei)并(bing)行方式(shi)來訓(xun)練(lian)Llama 3,再加上其(qi)他優化策略,綜合訓(xun)練(lian)效率比Llama 2提高了約3倍。
在大(da)(da)會AI Infra專(zhuan)場,來自潞晨科(ke)技(ji)、NVIDIA、星環科(ke)技(ji)、中科(ke)加禾、天津大(da)(da)學&派歐云(yun)、阿(a)里云(yun)、焱融科(ke)技(ji)、Zenlayer的嘉賓代表,分(fen)(fen)享(xiang)了類Sora開源架構(gou)、大(da)(da)模(mo)型全棧AI解決方案、應(ying)用開發工具鏈、編譯器(qi)、分(fen)(fen)布式算力網絡、高效(xiao)存儲等(deng)方向(xiang)的技(ji)術、挑戰與(yu)策略。
新(xin)加坡國立大(da)學校長(chang)青(qing)年教(jiao)授、潞晨科(ke)技創(chuang)始人(ren)兼董事長(chang)尤(you)洋談到模型(xing)訓練流程開源(yuan)的(de)重要(yao)性(xing),包括(kuo)模型(xing)架構(gou)、模型(xing)權重、訓練細(xi)節、數據處理(li)等。正如Meta最(zui)新(xin)發布Llama 3,其超過4000億個參數的(de)版本開源(yuan)后(hou),將造福(fu)大(da)量開發者。
面向視(shi)頻(pin)生(sheng)成領(ling)域,他認(ren)為(wei)現(xian)在正處于“GPT-2時刻”,還沒(mei)有出現(xian)成熟(shu)的(de)應用。尤洋帶領(ling)團(tuan)隊開源的(de)全球首個(ge)類(lei)Sora架構(gou)視(shi)頻(pin)生(sheng)成模型(xing)Open-Sora采用STDiT架構(gou),相比DiT成本(ben)大幅降(jiang)低。Open-Sora未(wei)來的(de)發展(zhan)方(fang)向主要是完善(shan)數據處理流程以及訓(xun)練(lian)視(shi)頻(pin)壓縮Encoder。
▲新(xin)加坡國立大學(xue)校長(chang)(chang)青(qing)年(nian)教授、潞晨科技(ji)創始人(ren)兼董事(shi)長(chang)(chang)尤洋(yang)
NVIDIA解(jie)決方案架構與工程總監王淼談到大(da)語(yu)言模(mo)型生態系統四大(da)趨勢(shi),一是(shi)新(xin)(xin)基礎大(da)語(yu)言模(mo)型發布(bu)提速,最新(xin)(xin)代表便是(shi)Meta剛發布(bu)的Llama 3,二是(shi)新(xin)(xin)算子和定制技(ji)術持續優化,三(san)是(shi)模(mo)型規(gui)模(mo)繼續增加,四是(shi)從(cong)Dense到MoE轉變(bian)趨勢(shi)形成。這(zhe)意(yi)味(wei)著需要全(quan)棧AI解(jie)決方案助力模(mo)型開發和應用部署(shu)。
NVIDIA如何搭建(jian)大語(yu)言模型基礎(chu)(chu)設(she)施?王淼分(fen)享(xiang)說,NVIDIA為GPU增加的(de)FP8支(zhi)持相比FP16、BF16實現2倍吞吐(tu)性能提升,同時進一步將(jiang)數(shu)據精度縮減到FP4并勝任(ren)推(tui)理(li)任(ren)務。他還分(fen)享(xiang)了NVIDIA在(zai)網絡基礎(chu)(chu)設(she)施上的(de)布局,包括融合標(biao)準以太網連(lian)接和專業高性能架構的(de)NVIDIA Spectrum-X以太網平臺(tai)、助攻(gong)大語(yu)言模型應(ying)用落地(di)全流程的(de)NVIDIA NeMo、NVIDIA Triton推(tui)理(li)服務器等。
▲NVIDIA解決(jue)方案架構與工程總監(jian)王淼(miao)
星環科技大(da)模型(xing)產(chan)品負責人(ren)童欣(xin)欣(xin)談道(dao),當下(xia)大(da)模型(xing)幻覺問題(ti)凸顯,通用的大(da)模型(xing)難(nan)以解(jie)決特定場(chang)景(jing)的問題(ti)。企業內部(bu)落地大(da)模型(xing)應用時,可通過組合提示詞(ci)工程、檢索增強(qiang)、智(zhi)能體(ti)、有監督微調及預訓練(lian)等不同方式,來解(jie)決垂直場(chang)景(jing)的業務問題(ti)。他(ta)還(huan)表示大(da)模型(xing)及應用開發和落地不是(shi)一錘(chui)子(zi)買賣,需要企業級別(bie)的長期運維(wei)和監控。
Sophon LLMOps是(shi)星環科(ke)技推出的企業級(ji)大(da)模(mo)型(xing)和(he)應(ying)(ying)用(yong)開(kai)(kai)發工(gong)具(ju)鏈,提供語料知識精(jing)細化(hua)處理入庫、提示詞(ci)開(kai)(kai)發、語料數(shu)據標注(zhu)、大(da)模(mo)型(xing)微調訓練、大(da)模(mo)型(xing)評估部署到大(da)模(mo)型(xing)應(ying)(ying)用(yong)構建和(he)應(ying)(ying)用(yong)部署上線的全鏈路工(gong)具(ju)能力。此(ci)外,星環科(ke)技還推出大(da)模(mo)型(xing)和(he)應(ying)(ying)用(yong)開(kai)(kai)發服(fu)務一體(ti)機(ji),通過預裝Sophon LLMOps工(gong)具(ju)平臺,用(yong)戶可按(an)需快速的體(ti)驗大(da)模(mo)型(xing)開(kai)(kai)發和(he)應(ying)(ying)用(yong)的全流程能力。
▲星環科技(ji)大模型產品負(fu)責(ze)人(ren)童欣欣
中科加禾創始人、CEO崔慧敏談道,在AI芯片落地過程(cheng)中(zhong),關鍵是要構建整個基(ji)礎軟件(jian)的(de)(de)能力,從而增強可(ke)持(chi)續發(fa)展能力。正如CUDA成就(jiu)了英(ying)偉達,軟件(jian)生態(tai)成為AI基(ji)礎設施的(de)(de)標準和競(jing)爭優勢,決定了芯片的(de)(de)可(ke)用(yong)性和市場接(jie)受度。
崔(cui)慧敏強調了跨(kua)平(ping)臺編(bian)譯技術的(de)重要(yao)性(xing),對標CUDA層次,能跨(kua)多種(zhong)芯片的(de)底層編(bian)譯工具(ju)是解決國(guo)產芯片長期可持續的(de)重要(yao)基礎能力(li)。中(zhong)科(ke)加禾利用編(bian)譯技術構(gou)建(jian)的(de)大模(mo)型推理(li)引(yin)擎可以實現一套軟件(jian)對多種(zhong)AI加速卡(ka)的(de)支(zhi)持。
▲中科(ke)加禾創始人、CEO崔慧敏(min)
天津大學(xue)計(ji)算(suan)機科(ke)學(xue)與技(ji)術學(xue)院教授、PPIO派(pai)歐云(yun)首(shou)席科(ke)學(xue)家(jia)王曉飛分(fen)享了三個AGI時代的(de)思考:首(shou)先(xian),計(ji)算(suan)與算(suan)力(li)供需(xu)長尾化且分(fen)布不均;其次,計(ji)算(suan)任務和需(xu)求是否完美(mei)匹配(pei)、能否精準(zhun)調度;第三,“核(he)心+邊緣(yuan)”分(fen)層協(xie)同的(de)算(suan)力(li)網絡計(ji)算(suan)范式(shi)及算(suan)力(li)經濟。
基(ji)于(yu)上(shang)述思(si)考,他認為要(yao)搭建AGI Infra,分布式算(suan)力(li)網絡是云邊端協同計算(suan)基(ji)礎(chu)設施(shi)的收(shou)斂形態(tai)。PPIO推(tui)出的“派歐算(suan)力(li)云”覆蓋全國數千個分布式算(suan)力(li)節點,通過智(zhi)能(neng)調(diao)度(du)和推(tui)理(li)加速技術,可以實現算(suan)力(li)性價(jia)比提升(sheng)數十(shi)倍,推(tui)理(li)成本(ben)大幅度(du)降低。
▲天津大學(xue)計算機科(ke)學(xue)與技術學(xue)院教授、PPIO派(pai)歐云首席科(ke)學(xue)家王(wang)曉飛
阿里(li)云(yun)高級技術(shu)專家、阿里(li)云(yun)異構(gou)計算(suan)AI推(tui)理(li)團隊負責(ze)人李鵬(peng)談道,大(da)(da)模型(xing)的發展給計算(suan)體(ti)系(xi)結構(gou)帶來了功耗墻、內存墻和通訊(xun)墻等(deng)多重(zhong)挑戰。其中,大(da)(da)模型(xing)訓練層面,用戶在模型(xing)裝(zhuang)載、模型(xing)并行、通信等(deng)環(huan)節面臨(lin)各種現(xian)實問(wen)題;在大(da)(da)模型(xing)推(tui)理(li)層面,用戶在顯存、帶寬、量化上面臨(lin)性能(neng)瓶頸。
對于如何進(jin)一步釋放(fang)云(yun)上(shang)性(xing)(xing)能(neng)?阿里云(yun)彈性(xing)(xing)計算為云(yun)上(shang)客戶(hu)提(ti)供了(le)ECS GPU DeepGPU增(zeng)強工具包(bao),幫(bang)助(zhu)用戶(hu)在(zai)云(yun)上(shang)高(gao)效(xiao)地(di)構建AI訓練和AI推理基礎設施(shi),從(cong)而提(ti)高(gao)算力利用效(xiao)率。目前,阿里云(yun)ECS DeepGPU已經幫(bang)助(zhu)眾多客戶(hu)實(shi)現性(xing)(xing)能(neng)的大幅提(ti)升(sheng)。其(qi)中,LLM微調訓練場景下性(xing)(xing)能(neng)最高(gao)可(ke)提(ti)升(sheng)80%,Stable Difussion推理場景下性(xing)(xing)能(neng)最高(gao)可(ke)提(ti)升(sheng)60%。
▲阿(a)里云高級(ji)技術(shu)專(zhuan)家(jia)、阿(a)里云異構計算AI推理團隊負責人李鵬(peng)
焱融科(ke)技(ji)CTO張文(wen)濤解讀(du)了(le)存(cun)儲對大(da)(da)模型訓(xun)練和推理的(de)重要性,從數據加載、協議(yi)、模型加載到Checkpoint保存(cun)等,過程(cheng)中存(cun)在(zai)大(da)(da)量小的(de)讀(du)寫請(qing)求、GPU傳輸等。對于多(duo)模態大(da)(da)模型,高性能(neng)存(cun)儲對訓(xun)練的(de)提升效果(guo)更好,效率可提升20-40%。
針對(dui)訓(xun)練推(tui)理,焱融科技推(tui)出了(le)多云存儲(chu)解決方(fang)案,基于統(tong)一的數(shu)(shu)(shu)(shu)(shu)據(ju)湖底(di)座(zuo),通過數(shu)(shu)(shu)(shu)(shu)據(ju)編排將數(shu)(shu)(shu)(shu)(shu)據(ju)按需加(jia)載(zai)到數(shu)(shu)(shu)(shu)(shu)據(ju)中心,并異步(bu)將新增的模(mo)型數(shu)(shu)(shu)(shu)(shu)據(ju)推(tui)到數(shu)(shu)(shu)(shu)(shu)據(ju)湖。數(shu)(shu)(shu)(shu)(shu)據(ju)加(jia)載(zai)支持對(dui)接OSS、COS、BOS等各大主流對(dui)象存儲(chu)平(ping)臺。
▲焱融(rong)科技CTO張文濤
Zenlayer行(xing)業(ye)拓展總(zong)監(jian)陳秀忠(zhong)談(tan)道,通往更(geng)(geng)高(gao)級AGI的(de)(de)(de)挑戰在(zai)于更(geng)(geng)即時的(de)(de)(de)交互、更(geng)(geng)廣的(de)(de)(de)數據、更(geng)(geng)廣的(de)(de)(de)算力。因此(ci),面向(xiang)AGI的(de)(de)(de)全球邊緣云方(fang)案需要考慮支(zhi)持實(shi)時交互的(de)(de)(de)全球網絡、數據本(ben)地存(cun)儲(chu)和全球流動、大量的(de)(de)(de)邊緣節點(dian)。
專(zhuan)(zhuan)線對(dui)中(zhong)國企業(ye)在海(hai)外部署(shu)關鍵應用(yong)十分重要。陳秀忠(zhong)稱,安全合規(gui)的跨境專(zhuan)(zhuan)線是企業(ye)連接全球(qiu)的第一跳。Zenlayer通過邊(bian)緣數據中(zhong)心服務,可為企業(ye)提供定制化的機(ji)房(fang)托(tuo)管(guan)和托(tuo)管(guan)主(zhu)機(ji)解(jie)決方案。
▲Zenlayer行業拓展總(zong)監陳(chen)秀忠(zhong)
02.
AIGC應用專場:核心問題是高質量數據,
3D生成今年將實現真正可用
過去(qu)一年,中國生成式AI產業出現(xian)很(hen)多代(dai)表性的商業化(hua)探索成果。在手機、互聯網(wang)、影視、音樂、游戲、金融(rong)、電商、文娛、教(jiao)育、工業、自動(dong)駕駛、生活服務等應用場景,搜索、辦公、寫作(zuo)、創意到繪畫、修圖、視頻編輯(ji)、3D建模等AI提效工具如雨(yu)后春筍般蓬勃而生。
探索視頻生(sheng)成(cheng)(cheng)(cheng)和世界(jie)模型(xing)(xing)的(de)(de)極(ji)佳(jia)科技(ji),用(yong)(yong)AIGC賦能影(ying)視行(xing)業(ye)的(de)(de)天圖萬境,將3D生(sheng)成(cheng)(cheng)(cheng)帶入秒(miao)級時(shi)代的(de)(de)VAST,為生(sheng)活服務(wu)打造垂(chui)類大模型(xing)(xing)的(de)(de)58同城,提供決策式AI和生(sheng)成(cheng)(cheng)(cheng)式AI相(xiang)輔相(xiang)成(cheng)(cheng)(cheng)技(ji)術(shu)方案的(de)(de)百(bai)融云(yun)創,打造游戲(xi)行(xing)業(ye)一站(zhan)式AI賦能平臺的(de)(de)行(xing)者AI,提供全鏈(lian)路電(dian)商內容生(sheng)成(cheng)(cheng)(cheng)引擎的(de)(de)極(ji)睿(rui)科技(ji),用(yong)(yong)AIGC降低(di)音樂(le)制作門檻的(de)(de)靈動音DeepMusic,均在今天下午的(de)(de)AIGC應用(yong)(yong)專場(chang)進行(xing)分享。
極(ji)佳科(ke)(ke)技(ji)創始人(ren)兼CEO黃冠(guan)認為,當下所有(you)“通用智能(neng)”都在走向(xiang)“端(duan)到端(duan)大模(mo)(mo)型”,一(yi)(yi)切問題都變成(cheng)了“高質(zhi)量(liang)數據(ju)(ju)”問題。“世(shi)界模(mo)(mo)型”是未來(lai)具身智能(neng)最重要的“高質(zhi)量(liang)數據(ju)(ju)”來(lai)源,它結(jie)合互聯網數據(ju)(ju)、仿真數據(ju)(ju)、遙(yao)操(cao)數據(ju)(ju)、真實采集數據(ju)(ju)等(deng)多種數據(ju)(ju),學習、訓(xun)練、組合,從而得(de)到交(jiao)互式物理世(shi)界模(mo)(mo)擬(ni)器。 極(ji)佳科(ke)(ke)技(ji)正基于世(shi)界模(mo)(mo)型打造新一(yi)(yi)代(dai)數據(ju)(ju)平臺,面向(xiang)端(duan)到端(duan)自(zi)動(dong)駕(jia)駛和通用機器人(ren)提供服務。極(ji)佳科(ke)(ke)技(ji)DriveDreamer自(zi)動(dong)駕(jia)駛世(shi)界模(mo)(mo)型、WorldDreamer通用世(shi)界模(mo)(mo)型目前已成(cheng)功商業化落地。
▲極(ji)佳科(ke)技(ji)創始人兼CEO黃冠
天圖萬境創始人圖拉古認為,AI應(ying)(ying)該是(shi)(shi)能夠給(gei)人們帶來溫暖、彌合世界(jie)的創作工(gong)具,而不是(shi)(shi)取代人工(gong)作的的“內(nei)卷武器”。因此AI不能離開應(ying)(ying)用(yong)(yong)談技術(shu),而是(shi)(shi)要建立到(dao)應(ying)(ying)用(yong)(yong)端的完整產(chan)業(ye)鏈。天圖萬境從AI文本創作,到(dao)視頻(pin)生成(cheng),再到(dao)服(fu)務用(yong)(yong)戶的應(ying)(ying)用(yong)(yong)端,打造(zao)了(le)全產(chan)業(ye)鏈技術(shu)解決方(fang)案,且(qie)都早(zao)于(yu)國際(ji)巨(ju)頭發布了(le)對(dui)應(ying)(ying)產(chan)品,目前正在快(kuai)速迭代中。
其展示的聲(sheng)音(yin)生成工具Sora Opera,可以自動感知(zhi)、智(zhi)能識別視頻畫面中的物(wu)理邏(luo)輯,精(jing)準配出風格多變(bian)的音(yin)樂音(yin)效(xiao),為視頻增加(jia)聲(sheng)音(yin)的魅力。還有聲(sheng)音(yin)克隆(long)工具SoundMax,它不走傳(chuan)統TTS路線,而(er)是(shi)將輸入的人(ren)聲(sheng)轉換(huan)成其他(ta)聲(sheng)線。這樣的人(ren)工智(zhi)能工具,不會讓配音(yin)演員失業,而(er)是(shi)讓他(ta)們(men)在演繹不同角色時插上飛翔(xiang)的創意(yi)翅膀。
▲天(tian)圖(tu)(tu)萬境創始人(ren)圖(tu)(tu)拉古(gu)
從(cong)文字、圖片到視頻、3D,信息載體(ti)不斷升(sheng)級,VAST創始人兼CEO宋亞宸談(tan)道(dao),3D的體(ti)驗質量、信息密度不斷提升(sheng)且更(geng)具互動性(xing)。他認為(wei)目前3D生成(cheng)已(yi)經達到類(lei)似Midjourney V3的效(xiao)果(guo),今年9月將達到類(lei)V4效(xiao)果(guo),年底達到類(lei)V5效(xiao)果(guo),實現真正可用。
為了應對3D生(sheng)成創作成本(ben)和門(men)檻過高的(de)挑戰,VAST將(jiang)3D內容平(ping)臺和大(da)眾(zhong)級創作者平(ping)臺結(jie)合。VAST的(de)3D大(da)模型Tripo已實現模型生(sheng)成數量超150萬(wan)個。
▲VAST創(chuang)始人(ren)兼CEO宋亞宸
58同(tong)(tong)城TEG-AI Lab大(da)語(yu)言模(mo)(mo)型算(suan)法部負責(ze)人孫啟明認為,通用(yong)大(da)模(mo)(mo)型+提示不會代替一切(qie),應用(yong)方需(xu)要(yao)結合自身業務場景,微(wei)調出自己的(de)大(da)模(mo)(mo)型。58同(tong)(tong)城構建了(le)模(mo)(mo)型領(ling)先、敏捷易(yi)用(yong)的(de)AI平臺,助力AI應用(yong)在(zai)內(nei)部各業務線快速落(luo)地(di)。
58同城(cheng)搭建了一套(tao)支持大(da)語(yu)言模(mo)(mo)型(xing)(xing)(xing)訓(xun)練、推理(li)的平(ping)臺,集成開(kai)源(yuan)通用大(da)模(mo)(mo)型(xing)(xing)(xing),今晚將上線Meta最(zui)新推出的Llama 3模(mo)(mo)型(xing)(xing)(xing)。基于大(da)語(yu)言模(mo)(mo)型(xing)(xing)(xing)平(ping)臺,58同城(cheng)已推出了垂類大(da)語(yu)言模(mo)(mo)型(xing)(xing)(xing)靈犀大(da)模(mo)(mo)型(xing)(xing)(xing)(ChatLing),相比(bi)官(guan)方(fang)開(kai)源(yuan)大(da)模(mo)(mo)型(xing)(xing)(xing)實現了更好效果。
▲58同城TEG-AI Lab大語言模型算法部負責人孫(sun)啟明
百融云創AI創新負責(ze)人談道,生成式AI是AGI的先導(dao),其(qi)與決策(ce)式AI最大的區(qu)別(bie)在于(yu)問(wen)題空間的擴大。傳統模型提供的優化候選集合約為數千個。而Llama 2提供詞表(biao)中包含3.2萬個選項(xiang),對信(xin)息的壓(ya)縮比達到14倍;剛剛發(fa)布的Llama 3候選詞表(biao)擴充(chong)超過了12萬個,對信(xin)息的壓(ya)縮比也(ye)提升(sheng)到30倍以上(shang)。
面向金融(rong)行業,百融(rong)云創開(kai)發了百融(rong)大模型一站式應用(yong)(yong)開(kai)發平臺(tai),針對信(xin)息安全(quan)、復(fu)雜溝通等需求構建了BR-Coder編程助(zhu)手(shou)、數字員工和交互式數字人Web-Copilot等應用(yong)(yong)。
▲百融云創AI創新負責人(ren)分享生成式(shi)AI是AGI的先導
行者AI創(chuang)始人&CEO尹學淵(yuan)認為,此(ci)前AI輔助內(nei)容創(chuang)作在快、好、便宜之間(jian)的“不可能三(san)角”,被生(sheng)成式AI打破(po)了,并(bing)為教育(yu)、文旅行業開啟了交互式、沉浸式新(xin)體驗。
在(zai)他看(kan)來,大模(mo)型走(zou)向落地時(shi),“最后一(yi)公里”需要結合具體行業、具體領域工作流(liu),一(yi)致、可(ke)(ke)控(kong)、高精(jing)度是工業化AI成為工具必不(bu)可(ke)(ke)少的(de)特性。而行者AI的(de)解決方案可(ke)(ke)以將產品策(ce)劃、美術總監等用(yong)戶的(de)工作效率提升3-5倍。
▲行者AI創(chuang)始人&CEO尹(yin)學淵
極睿(rui)科(ke)技創始人兼CEO武彬談道,當下(xia)電商行業圖文和短(duan)視頻的內(nei)容數量與(yu)需(xu)求都(dou)在大幅上升(sheng),內(nei)容關(guan)聯著平臺(tai)、賣家與(yu)買家的核心交易訴(su)求,但(dan)內(nei)容制作效(xiao)率嚴(yan)重(zhong)不足。
成立于2017年的極睿科(ke)技專注于打造電(dian)商(shang)(shang)內容生(sheng)成引(yin)擎,推出了(le)ECGPT+FashionCLIP基(ji)座模(mo)(mo)型及多種電(dian)商(shang)(shang)垂直(zhi)大模(mo)(mo)型,可支持(chi)商(shang)(shang)品AI拍(pai)攝、AI排版上(shang)新、AI直(zhi)播切片、AI生(sheng)成商(shang)(shang)品短視(shi)頻、AI帶貨、一(yi)站式AI技術與數據服務平臺、智能(neng)商(shang)(shang)品操作系統等多種功能(neng),目前已(yi)合(he)作超4萬電(dian)商(shang)(shang)客戶。
▲極睿科技創(chuang)始人(ren)兼(jian)CEO武(wu)彬
DeepMusic CEO劉曉光分(fen)享說,當前(qian)的音(yin)(yin)樂商業格局,主要面向泛音(yin)(yin)樂愛好(hao)者的聽歌(ge)及淺度實踐(jian)用(yong)戶的唱(chang)歌(ge)消費體驗,而中間有1億以上活躍(yue)的音(yin)(yin)樂人、音(yin)(yin)樂實踐(jian)者群體,其需求尚未得到好(hao)的產(chan)品滿足;同(tong)時(shi)音(yin)(yin)樂制(zhi)作流程長、門檻(jian)高,這使得音(yin)(yin)樂AIGC技術有用(yong)武(wu)之(zhi)地(di)。
對(dui)此,DeepMusic構建了(le)跨平臺一站式AI音樂工作(zuo)站“和弦派”,以更直觀的(de)音樂知(zhi)識呈(cheng)現、編輯形式,解決(jue)音樂中歌詞、旋(xuan)律(lv)、伴奏等不同模態之間溝通困難的(de)問題(ti),覆(fu)蓋音樂創(chuang)作(zuo)、制(zhi)(zhi)作(zuo)多個(ge)流程;未(wei)來DeepMusic也(ye)會通過積(ji)累的(de)精(jing)細(xi)化標(biao)注(zhu)數據數據,實現對(dui)音頻(pin)模型的(de)精(jing)細(xi)化控制(zhi)(zhi)。
▲DeepMusic CEO劉曉(xiao)光
除了上述嘉(jia)(jia)賓外(wai),另有7位(wei)嘉(jia)(jia)賓在(zai)分會(hui)場的中(zhong)國智(zhi)算中(zhong)心(xin)創新論壇進行分享,6位(wei)嘉(jia)(jia)賓在(zai)分會(hui)場收費(fei)制的智(zhi)猩猩AI智(zhi)能體(ti)技術研討會(hui)上輸(shu)出干貨。
智東(dong)西后續將整理中國智算中心創新論(lun)壇(tan)的(de)精(jing)華(hua)報(bao)道(dao),以及部分嘉賓的(de)演講干貨(huo),敬請關(guan)注(zhu)。
03.
結語:下一站,上海見!
“我們正站在歷史的轉折處,見證和參與由生成式AI引領的新一輪科技變革。”智一科技聯合創始人、CEO龔倫常代表主辦方為大會致辭。過去一年,生成式AI狂飆突進,整個產業鏈成為全球創新、投資和應用最活躍的領域之一,每位參與者都在與時間賽跑。作為智能產業的長期觀察者,我們期待見證并記錄中國生成式AI浪潮之變,并將持續邀請這股浪潮中的生力軍們,分享他們最新的技術進展與商業化探索。今日,為期兩天的2024中國生成式AI大會·北京站圓滿收官。半年后的11月份,我們將在上海,為中國生成式AI產業再辦一場秋日盛會。除此之外,智一科技旗下AI與硬科技知識分享社區智猩猩()將聯(lian)合(he)智能汽車產業新(xin)媒體(ti)車東西(xi)、芯(xin)片產業新(xin)媒體(ti)芯(xin)東西(xi),6月在上海舉行中國智能汽車算力峰(feng)(feng)會,9月在深圳舉行第六屆全(quan)球AI芯(xin)片峰(feng)(feng)會,12月在深圳舉行第四屆全(quan)球自動駕駛峰(feng)(feng)會。歡迎參會交流。