“從(cong)北京冬(dong)奧會開始,我將全年無休(xiu)用AI智慧為聽障(zhang)用戶提供手語(yu)服(fu)務,讓他們快捷的獲取比賽資訊” ,11月24日,央視(shi)新(xin)聞(wen)聯合百度(du)智能云傾(qing)心(xin)打造的總(zong)臺首個(ge)AI手語(yu)主(zhu)播正式亮相。
她有著“真(zhen)人般”的皮膚、頭發、眼睛,形象(xiang)親切自然,氣(qi)質優雅獨(du)特(te)。
萬眾期(qi)盼(pan)的2022年北京冬奧會將在(zai)2月4日舉行(xing),歷時(shi)16天(tian)。這是(shi)中國歷史上第一次舉辦冬季奧運會。
在關注(zhu)冬奧會的(de)(de)(de)(de)觀眾中(zhong),有(you)(you)一個(ge)特殊(shu)的(de)(de)(de)(de)群(qun)體,他們聽不到賽場的(de)(de)(de)(de)聲音。但他們關注(zhu)著冬奧賽事,希(xi)望(wang)了解比賽動態,渴望(wang)感受(shou)比賽的(de)(de)(de)(de)激情。全球約4.3億人有(you)(you)中(zhong)度及(ji)以上程度的(de)(de)(de)(de)聽力障礙。根據全國第(di)二次(ci)殘疾人抽樣調查數據,中(zhong)國有(you)(you)聽障人士2780萬。
“我們(men)用技(ji)術(shu)跨越聲音的障礙”,這是央視新聞聯合百度智能云推(tui)出AI手(shou)語主(zhu)播(bo)的初心。
百度智能云采用語音識別、自然語言處理等人工智能技術,構(gou)建出一套復(fu)雜(za)而精確(que)的(de)手(shou)語(yu)(yu)翻(fan)譯(yi)引擎(qing),實(shi)現了(le)文字(zi)及音(yin)視(shi)頻內容(rong)到手(shou)語(yu)(yu)的(de)翻(fan)譯(yi);再通過專為手(shou)語(yu)(yu)優化的(de)自(zi)然動(dong)作引擎(qing),進行虛(xu)擬形象的(de)驅(qu)動(dong),將手(shou)語(yu)(yu)實(shi)時演繹為數(shu)字(zi)人的(de)表情動(dong)作。這使得央視(shi)新聞AI手(shou)語(yu)(yu)主(zhu)播具備高可(ke)懂度的(de)手(shou)語(yu)(yu)表達能力(li)和(he)精準連貫的(de)手(shou)語(yu)(yu)呈現效果(guo)。
央視新聞AI手語主播(bo)掌握的手語詞匯規(gui)范(fan)都來自《國家通用手語詞典》標準(zhun),經(jing)過長時間(jian)的智能學習,能夠(gou)為觀眾(zhong)朋友提供專業(ye)、準(zhun)確的手語解說。
央視(shi)新聞AI手語(yu)主(zhu)播由百度(du)智能(neng)云的(de)“數字(zi)明星運營平(ping)臺”提供技術(shu)支持和服(fu)務。“數字(zi)明星運營平(ping)臺”集數字(zi)人(ren)生成、內(nei)容生產為(wei)(wei)一體(ti)的(de)平(ping)臺級產品,為(wei)(wei)廣電、互娛、品牌等客戶(hu)提供一站式的(de)虛擬主(zhu)持人(ren)、虛擬偶像、品牌代言人(ren)的(de)創(chuang)建與運營服(fu)務,可(ke)以降(jiang)低數字(zi)虛擬人(ren)的(de)應用(yong)門檻。
目前,“數(shu)(shu)(shu)字(zi)明星運營平臺”在(zai)生成(cheng)維度支持二(er)次(ci)元、2D、3D高(gao)精多種數(shu)(shu)(shu)字(zi)人(ren)(ren)風格,不僅(jin)通(tong)過(guo)全棧(zhan)的(de)(de)(de)AI能力實現(xian)了二(er)次(ci)元數(shu)(shu)(shu)字(zi)人(ren)(ren)的(de)(de)(de)“一(yi)句(ju)話(hua)生成(cheng)”,還通(tong)過(guo)基(ji)于(yu)任意(yi)單個2D人(ren)(ren)臉(lian)(lian)重建高(gao)精度3D人(ren)(ren)臉(lian)(lian)技術,對虛(xu)擬人(ren)(ren)人(ren)(ren)臉(lian)(lian)3D模型進行編(bian)輯,實現(xian)將(jiang)任意(yi)2D人(ren)(ren)臉(lian)(lian)低(di)成(cheng)本替換到3D虛(xu)擬人(ren)(ren)上(shang),解決(jue)了2D數(shu)(shu)(shu)字(zi)人(ren)(ren)風格豐(feng)富性(xing)差的(de)(de)(de)痛點難點,更將(jiang)可(ke)被(bei)AI驅動(dong)的(de)(de)(de)高(gao)精3D數(shu)(shu)(shu)字(zi)人(ren)(ren)生成(cheng)成(cheng)本由3個月降低(di)到一(yi)星期。
在內容生產(chan)維度,支持真人(ren)驅動(dong)(dong)、AI驅動(dong)(dong)、融合(he)驅動(dong)(dong)等(deng)多種(zhong)直播方式;支持真人(ren)場景下(xia)多樣化內容的視頻(pin)快速生成。 基于(yu)面部4D數據(3D+時序)的高(gao)精數字人(ren)“文字到形狀(zhuang)的跨模態面部表情生成技術”,使(shi)得口型合(he)成準確(que)性達98.5%。
“數(shu)字(zi)明星運(yun)營(ying)平臺(tai)” 讓(rang)數(shu)字(zi)虛擬(ni)人(ren)的(de)(de)(de)開發和(he)運(yun)營(ying)變(bian)得簡單(dan)、快捷、高效。這(zhe)也就意味著,現(xian)有(you)眾(zhong)多高創作力、低技術能力的(de)(de)(de)IP開發方,直接(jie)具備(bei)轉化(hua)自己的(de)(de)(de)IP為(wei)虛擬(ni)人(ren)的(de)(de)(de)能力,可以無需建模、快速做出自己的(de)(de)(de)數(shu)字(zi)虛擬(ni)人(ren),甚至是虛擬(ni)偶像。
這個冬奧會,讓我(wo)們通過央視(shi)新(xin)聞AI手語主播,更酣暢(chang)淋漓地感受(shou)冰雪(xue)運動的激情與榮(rong)耀。
資訊(xun)來源:封面新聞