騰訊自研芯片“滄海”已經廣泛應用到實際環境,并斬獲 8 項世界第一。
4 月 15 日,莫斯科(ke)國立大(da)學舉辦(ban)的(de)(de) MSU 硬(ying)件(jian)視(shi)頻編(bian)碼(ma)比(bi)賽成績揭曉。經(jing)過數(shu)月的(de)(de)嚴格(ge)測試,騰訊自研的(de)(de)編(bian)解(jie)(jie)碼(ma)芯片(pian)“滄海(hai)”包攬(lan)了(le)所參(can)加的(de)(de)兩(liang)個賽道(dao) 8 項評分的(de)(de)全部第一。據了(le)解(jie)(jie),滄海(hai)芯片(pian)已在業(ye)務場景中(zhong)投用(yong)數(shu)萬片(pian),服務騰訊自研業(ye)務及公(gong)有云(yun)客戶。
MSU 是視(shi)頻壓縮領(ling)域最具(ju)影響力的頂級賽事,迄今已連續(xu)舉辦了十七(qi)屆,吸引了包括亞(ya)馬(ma)遜、英偉達、Intel、AMD、字節、快手、阿里和騰訊(xun)在內(nei)的國內(nei)外知(zhi)名企業參與(yu)。
具體來看,SSIM (結(jie)構相似(si)性)、PSNR(峰值信(xin)噪比)和 VMAF(視頻(pin)多方(fang)法評(ping)估融合(he))等(deng)多項評(ping)價指標(biao),滄海(hai)芯(xin)片大幅領先(xian)行(xing)業 GPU 等(deng)標(biao)品(pin)硬件。值得一提的是,在 120fps 的高幀率(lv)檔位上,在同(tong)等(deng)畫(hua)質下(xia)滄海(hai)較行(xing)業領先(xian) ASIC 水(shui)平(ping)能再節省(sheng) 10%碼率(lv)。
作(zuo)為全真(zhen)互(hu)聯時代的交互(hu)模式和關鍵技術,音(yin)視(shi)(shi)頻背后的編(bian)(bian)解(jie)碼(ma)能力至關重(zhong)要。基于自研芯片(pian)與軟件的聯合調優,騰訊(xun)云的音(yin)視(shi)(shi)頻編(bian)(bian)解(jie)碼(ma)能力已(yi)達業(ye)界領先水平。



多媒體業(ye)(ye)務進入音(yin)視頻直播時(shi)(shi)代(dai),4K/8K 的(de)超高清內容對(dui)(dui)云計算基礎設施提出了(le)難題。如何在降(jiang)低(di)成(cheng)本的(de)同時(shi)(shi),最大(da)化(hua)還(huan)原畫質、實(shi)現低(di)延遲,是全真互(hu)聯(lian)時(shi)(shi)代(dai)面(mian)臨的(de)難題。業(ye)(ye)界已有的(de)通(tong)用處(chu)理(li)器,并非針對(dui)(dui)數據中心轉碼場景定制開發(fa),部(bu)署中很難兼顧真實(shi)場景的(de)全方(fang)位挑戰。
2019 年初(chu),騰訊蓬萊實驗室、香農實驗室聯合啟動(dong)編(bian)解(jie)碼芯片”滄海“研發。對硬件編(bian)解(jie)碼的算法、架構和工(gong)程進行深度(du)攻關,向高(gao)畫質、低(di)延遲、低(di)成本(ben)的“不可能三角”發起挑戰(zhan)。
基于自身在底層軟硬件架(jia)構和(he)音(yin)視頻領域的(de)多年積累(lei),研發團(tuan)隊對每個模(mo)塊(kuai)(kuai)的(de)計算(suan)(suan)任(ren)務都作(zuo)了并行(xing)拆解。通過分(fen)配(pei)不同(tong)的(de)計算(suan)(suan)單元,從(cong)而疊加大(da)量處理(li)任(ren)務;為滄海芯片內置(zhi)視頻編碼加速專用功(gong)能模(mo)塊(kuai)(kuai),讓流水控制邏輯更純粹,減少重復計算(suan)(suan)和(he)分(fen)支判(pan)斷,帶來更低的(de)功(gong)耗(hao)和(he)成本(ben)。
滄海芯片的(de)編碼(ma)(ma)器(qi)設計中完整(zheng)實現了高(gao)精(jing)度運動(dong)搜索、全(quan)率失真優化、高(gao)效自適應量化等所有主(zhu)流編碼(ma)(ma)工具,并融合騰(teng)訊云軟件(jian)編碼(ma)(ma)器(qi)碼(ma)(ma)率控制等方面的(de)領先技術,壓縮(suo)率高(gao)于市(shi)面標品 35%以上。
在硬(ying)件(jian)架構上(shang),通(tong)過將視頻預分析(xi)計算單元進(jin)一步(bu)卸載到硬(ying)件(jian)中,滄海(hai)芯片大幅減(jian)少了高密(mi)度轉碼場景下任務對 CPU 性(xing)能(neng)的依(yi)賴,將轉碼性(xing)能(neng)提升到更(geng)強。通(tong)過靈活(huo)的多核擴展架構、高性(xing)能(neng)編(bian)碼流水(shui)線、層級(ji)化 Memory 布局,滄海(hai)芯片能(neng)滿足高吞吐、低時延和實時性(xing)要求(qiu)。
根(gen)據(ju) MSU 實測數(shu)據(ju),從各(ge)項指標看,在同碼率下,相(xiang)較于業界(jie) GPU 等標品(pin)硬件,滄海(hai)能大幅改善畫(hua)面(mian)質量;在 120fps 的(de)(de)(de)高(gao)幀率檔位(wei)上,同等質量下,滄海(hai)比行業領(ling)先(xian)水平(ping)進一(yi)步節省(sheng) 10%以上的(de)(de)(de)碼率;另外,滄海(hai)芯片的(de)(de)(de)單幀 1080p 的(de)(de)(de)編(bian)碼耗(hao)時僅(jin) 4 毫秒,吞吐性能幾乎不受到編(bian)碼參(can)數(shu)、視(shi)頻類型的(de)(de)(de)影響。
去年 3 月(yue),滄海芯片順利“點(dian)亮”,目(mu)前(qian)已經量產并投用數萬(wan)片,在(zai)云游戲、直點(dian)播等場景中(zhong),面(mian)向騰訊自研業務和公有云客戶提供服務。
在(zai)直播平臺中(zhong)(zhong),觀(guan)看人數小于 200 人的中(zhong)(zhong)長尾直播是主(zhu)體(ti),滄(cang)海(hai)芯片(pian)能幫助節(jie)省大量計算成本;在(zai) 4K/8K 超高(gao)(gao)清、高(gao)(gao)幀(zhen)率場(chang)景中(zhong)(zhong),相對軟(ruan)件編碼(ma),滄(cang)海(hai)芯片(pian)能實現(xian)低延時的高(gao)(gao)質(zhi)量轉碼(ma)。
騰訊豐富的(de)多媒體應用場景,提供(gong)了充分的(de)分析和驗證條件,讓滄(cang)海芯(xin)片迭代出更有針對性的(de)場景解決(jue)方案。
例如,針(zhen)對云(yun)游戲場(chang)景(jing),滄海芯片(pian)的瑤池板卡,可以靈活(huo)配比不(bu)同(tong)廠商 GPU。針(zhen)對視(shi)頻轉碼(ma)場(chang)景(jing),滄海芯片(pian)提供(gong)單機 1024 路的高密(mi)轉碼(ma)能力(li),將轉碼(ma)成(cheng)本降至最(zui)低。
軟(ruan)硬件的(de)聯合調優,也為騰(teng)訊云媒(mei)體處(chu)理(li)(MPS)帶來了領先的(de)產品(pin)優勢。現在,騰(teng)訊云能(neng)提供音畫質增強、云原生錄制(zhi)、實時特效渲染、智能(neng)編輯、內容分析理(li)解等服務(wu),為用戶提供更低(di)(di)成本、更低(di)(di)延時、更極致(zhi)壓縮的(de)處(chu)理(li)效果。
在去年專業流(liu)媒體(ti)技術(shu)社區 SLC 發布(bu)的報告中,騰訊云 MPS 超越亞馬遜 AWS、微軟(ruan) Azure 等(deng)國際云廠商,摘(zhai)得三大場景下性能(neng)全(quan)部最優。
芯(xin)片(pian)是硬(ying)件中最(zui)核心的部(bu)分(fen)。面向(xiang)業(ye)務(wu)需(xu)求強(qiang)烈的場景,騰訊(xun)有(you)著長期的芯(xin)片(pian)研發規(gui)(gui)劃和投入,結合算力場景,推(tui)動自研芯(xin)片(pian)規(gui)(gui)模落地。目前,騰訊(xun)已經實現芯(xin)片(pian)端到端設計(ji)、驗證全(quan)覆蓋。
除滄海芯片(pian)外,騰訊(xun)自研(yan)的 AI 推(tui)理(li)芯片(pian)”紫霄“,采(cai)用自研(yan)存算(suan)架構和自研(yan)加速(su)(su)模塊,可以提供高達 3 倍的計(ji)算(suan)加速(su)(su)性能和超過 45%的整體成本節省,目(mu)前(qian)也已在內部業務(wu)中投用;高性能網絡芯片(pian)“玄(xuan)靈”,助力云計(ji)算(suan)場景(jing)實現(xian)虛(xu)擬化零損耗。
基(ji)于底(di)層軟硬件技(ji)術的(de)持(chi)續突(tu)破,騰訊(xun)正持(chi)續探索最優性(xing)(xing)能和最佳性(xing)(xing)價比,助力更多的(de)企(qi)業和開發(fa)者云(yun)上創新。