
“做通義聽悟的(de)(de)(de)初心不是做宣傳做引流,或者造一波聲勢,而是希望借(jie)助技術能(neng)力(li)能(neng)讓AI產生真實的(de)(de)(de)價值,通過更多的(de)(de)(de)AI助手(shou),真正幫助工(gong)作生活等(deng)日常的(de)(de)(de)方方面面。”阿里云(yun)CTO周靖(jing)人在近日的(de)(de)(de)阿里云(yun)峰會上對搜狐科技等(deng)媒體表示。
周靖人認為,大模型將帶來新的機會,各種APP、業務場景及業務系統都可以基于大模型重新做,而通義聽悟就是一款大模型應用,可以真正把大模型的能力變成工作學習的AI助手。
至于為什么要選擇音視頻賽道做這款產品,通義聽悟技術負責人鄢志杰解釋稱,通義聽悟的前身是聽悟,此前主要做語音記錄等,只是一款工具。“當我們第一次看到大模型能夠提取摘要能力的時候,覺得這就是game-changer,它在客觀(guan)指標和主觀(guan)體(ti)驗上都帶(dai)來明顯的提升。”
因此鄢志杰認為,當大模型的能力跟工具相結合以后,很有可能它已經不再是工具,而是變成了智能助手,不僅是幫助用(yong)戶,還可能提供建(jian)議(yi)來激(ji)發、啟發用(yong)戶。
據介紹,通義聽悟是一款聚焦在音視頻領域的產品,能夠幫助用戶高效完成對音視頻內容的轉寫、翻譯、檢索、摘要和整理,適用于開會、上課、訪談、培訓、面試、直播、看視頻、聽播客等場景,已自6月1日起開啟公測。
搜狐科技實測顯示,通義聽悟的音頻轉寫速度比市面上部分產品較(jiao)快,對于轉(zhuan)寫記錄能自動生成(cheng)關鍵詞、摘要、章節(jie)速(su)覽和發言人總結,但生成(cheng)內容(rong)也(ye)會有(you)錯別字、不準確(que)等瑕(xia)疵,英文提(ti)煉能力也(ye)相(xiang)對較(jiao)弱。此外(wai),該產品還與(yu)阿里云盤打通,生成(cheng)PPT、chorme插(cha)件(jian)等功能也(ye)將在后續上線。
在商業(ye)(ye)化方(fang)面,聽悟(wu)除個人版本外,還將推出企(qi)業(ye)(ye)版。“企(qi)業(ye)(ye)版是(shi)為企(qi)業(ye)(ye)的場景所定制,每個企(qi)業(ye)(ye)有(you)(you)不同的需(xu)求,也有(you)(you)數(shu)據(ju)安全、數(shu)據(ju)隱私等要(yao)求,這(zhe)方(fang)面會有(you)(you)完(wan)整的企(qi)業(ye)(ye)級產品(pin)系列。”周靖人表示。
他還介紹稱,目前聽悟企業版已在阿里集團內部使用,釘釘的“釘閃記”背后也集成了聽悟,后續也將在夸克APP、阿里云盤等端口提供服務。對于企業用戶擔心的潛在的數據安全和隱私的問題,周靖人表示,大模(mo)型技(ji)術(shu)并不代表損(sun)失隱(yin)私,更多(duo)是提高了開(kai)發的效(xiao)率。
“在智能化時代,所有的企業都站在同一起跑線,誰能更有效利用好模型,就能更好跟自己的業務場景有機結合,這樣的企業就會脫穎而出,更加敏捷、更加地快速探索出一條業務發展創新的道路,從而在新的時代占據有利位置。”周靖人表示。
隨著大模型的蓬勃興起,阿里云提出了模型即服務(MaaS)的云服務模式,但這(zhe)也導致和SaaS之(zhi)間的界限越來越模糊。
對此,周靖人表示,通義聽悟即屬于MaaS,但歡迎它被各種各樣的業務系統集成,集成進更多智能化服務中,最終打造基于業務場景的SaaS服務。
他判(pan)斷(duan),模型(xing)(xing)即服務(wu)將變(bian)成行業標準。“通過一系(xi)列基礎(chu)模型(xing)(xing),把創新的(de)(de)能力用在上(shang)層的(de)(de)二次開發,甚(shen)至(zhi)根據技(ji)術模型(xing)(xing)以(yi)及業務(wu)場景(jing)來做一系(xi)列的(de)(de)創新。”
周靖人還透露,阿里云在持續進行大模型的研發投入的同時(shi),也會做基于大模型(xing)一系列產品(pin)(pin)的創新。除了(le)聽悟,接下來還會推(tui)出其它更多(duo)的產品(pin)(pin)。
“我們希望務實地把技術真正做到普惠,通過技術創新不斷降低模型訓練和模型服務的成本,能夠讓大家快速使用起來,更多在云上進行創新,只有這樣能夠讓大模型真正意義上大規模地去服務全社會。”周靖人表示。