在智能語音和人工智能產業中,技(ji)術(shu)革新很快,想要(yao)贏得領跑局面就必須從源頭技(ji)術(shu)上保持(chi)領先(xian)(xian)。而保持(chi)領先(xian)(xian)的秘密是“甘坐十年(nian)冷板凳“的決心,是對企業科研人員反復實驗,去窮盡每一(yi)種可(ke)能,推動技(ji)術(shu)上的微小改(gai)變(bian)的耐心,也是直(zhi)面失敗的恒心。
正如(ru)創立22年的科大訊飛(fei)在探(tan)索人工智能實現路徑上的曲折(zhe),作為(wei)“年輕后浪“的熊世富(fu)在接(jie)下科大訊飛(fei)語音識別技術這個接(jie)力棒(bang)以來,失敗也是他最常面對(dui)的事情。
人(ren)工(gong)智(zhi)能被很多(duo)人(ren)稱之(zhi)為改變未來的(de)顛(dian)覆性(xing)技(ji)術,而深度學習則是(shi)加速(su)人(ren)工(gong)智(zhi)能發展的(de)顛(dian)覆性(xing)創(chuang)新。
2010年以前(qian),語(yu)音(yin)識(shi)別(bie)(bie)(bie)的主流方式是使(shi)用高(gao)斯(si)混合(he)模(mo)型(GMM)來建模(mo),雖然(ran)語(yu)音(yin)識(shi)別(bie)(bie)(bie)的錯誤率有效的降(jiang)低了(le),但GMM在自(zi)然(ran)場景(jing)下卻無法(fa)達到實(shi)用的級別(bie)(bie)(bie)。想要(yao)實(shi)現語(yu)音(yin)識(shi)別(bie)(bie)(bie)技術更廣泛(fan)的商用,必(bi)須有新(xin)的突破。2010年,微軟通過研究(jiu)如何(he)利用深層神經網絡(luo)改善大詞匯(hui)量語(yu)音(yin)識(shi)別(bie)(bie)(bie),成功地使(shi)得大規(gui)模(mo)的語(yu)音(yin)識(shi)別(bie)(bie)(bie)得到突破性進(jin)展,而(er)這一(yi)研究(jiu)也改變(bian)了(le)世(shi)界語(yu)音(yin)識(shi)別(bie)(bie)(bie)業界格局(ju)。
而科(ke)大(da)訊飛(fei)也成(cheng)為(wei)除了微軟總(zong)部以外,第一批接觸深度學習并著手開始研究的團隊。一年后,科(ke)大(da)訊飛(fei)已經(jing)將深度神經(jing)網(wang)絡(DNN)成(cheng)功應用(yong)到中文語音識(shi)別領域(yu),并通過語音云平(ping)臺(tai)提供給廣大(da)開發者使用(yong)。
熊世富便是在那(nei)個技(ji)術引領變革的時代(dai),開啟了對人工智能語音領域的深入探索,從一(yi)個代(dai)碼小白一(yi)步(bu)步(bu)蛻變為行(xing)業專(zhuan)家。

如今,在加入(ru)科大(da)(da)訊(xun)(xun)飛的第七年,熊(xiong)世(shi)富帶(dai)(dai)領(ling)團隊成功研(yan)發新一(yi)(yi)代端(duan)到端(duan)語音識別系統并全網上線,又一(yi)(yi)次保持了(le)科大(da)(da)訊(xun)(xun)飛語音識別國際領(ling)先的地位(wei)。旁人(ren)總以為(wei)這位(wei)享(xiang)譽公司(si)的技(ji)術大(da)(da)咖(ka)應該“天(tian)賦(fu)異稟”,自帶(dai)(dai)“碼力超強(qiang)”的光環。殊不(bu)(bu)知,技(ji)術能力并不(bu)(bu)是(shi)一(yi)(yi)蹴而就,是(shi)要(yao)(yao)經(jing)過(guo)時(shi)間打磨、沉淀出來。研(yan)究(jiu)生(sheng)培養方式不(bu)(bu)同于本科生(sheng),除了(le)理論知識,還要(yao)(yao)求工(gong)程實踐能力。在中科大(da)(da)語音研(yan)究(jiu)實驗室攻讀(du)研(yan)究(jiu)生(sheng)的第一(yi)(yi)年,當(dang)時(shi)熊(xiong)世(shi)富導師要(yao)(yao)求大(da)(da)家寫一(yi)(yi)個程序,他(ta)想了(le)想,撓了(le)撓頭,于是(shi)請(qing)教了(le)同學:“哎(ai),Hello Word,用(yong)編程語言咋(za)寫來著?”
孤身一人(ren)來(lai)到一個(ge)雖(sui)不(bu)算陌(mo)生的領域(yu),但(dan)這里的一切規則都要重新學(xue)習、探尋,岔路曲徑通幽(you),沿途(tu)也有驚喜的收獲(huo)。
初識深(shen)度學(xue)習(xi)是熊世富(fu)在科(ke)大訊飛實習(xi)的(de)期間。從最開始的(de)跨語(yu)言遷移學(xue)習(xi)的(de)任務到提升(sheng)深(shen)度學(xue)習(xi)的(de)訓(xun)練(lian)效率,帶著(zhu)升(sheng)級打怪的(de)快樂,熊世富(fu)總在語(yu)音(yin)方(fang)向里探索(suo)最前瞻的(de)技術領域。
而魄(po)力,則是他個人在探索深度(du)學習(xi)技(ji)術(shu)上的優勢和個人特色。從(cong)職(zhi)業生涯的開(kai)始即選擇了一條(tiao)大規(gui)模深度(du)學習(xi)探索之路,而這種(zhong)選擇也一直延續(xu)至(zhi)今(jin)。
2013年,當業(ye)(ye)界詬病深度學習的(de)訓(xun)(xun)練效率之(zhi)時,還是(shi)實(shi)(shi)習生(sheng)的(de)熊(xiong)世富隨即想到了(le)多(duo)卡(ka)訓(xun)(xun)練這條(tiao)路徑(jing),多(duo)卡(ka)背后(hou)的(de)代(dai)名詞是(shi)計算(suan)資源,大資源加持(chi)實(shi)(shi)驗才能找到答案。“也是(shi)幸運,當時我(wo)的(de)導(dao)師是(shi)現(xian)今已(yi)為我(wo)們(men)首席(xi)科(ke)學家的(de)魏思,跟著他一(yi)起探索了(le)很多(duo)前沿的(de)方向。當時要申請計算(suan)資源,研(yan)(yan)究(jiu)院都會批準,雖然我(wo)只是(shi)一(yi)個實(shi)(shi)習生(sheng)。”熊(xiong)世富每次回憶,都感(gan)嘆AI研(yan)(yan)究(jiu)院對(dui)(dui)于前瞻研(yan)(yan)究(jiu)重視,對(dui)(dui)于技術的(de)包容以(yi)及對(dui)(dui)人才的(de)支持(chi)。也正(zheng)是(shi)研(yan)(yan)究(jiu)院的(de)這種氛圍,讓這位(wei)中科(ke)大高材生(sheng)畢業(ye)(ye)之(zhi)后(hou)留了(le)下來。
科大訊飛董事(shi)長人劉慶峰(feng)曾(ceng)經(jing)不(bu)止一(yi)次講過這樣一(yi)段話:“一(yi)定(ding)要(yao)(yao)對未來人工智能的(de)(de)核心技術(shu)突破,不(bu)能抱著急功近利的(de)(de)想法。基礎(chu)理論的(de)(de)創新,源頭(tou)技術(shu)的(de)(de)創新,往往是具有最大的(de)(de)不(bu)確(que)定(ding)性的(de)(de)。人家說三年(nian)不(bu)鳴,一(yi)鳴驚(jing)人,事(shi)實上真正做原創,可能你要(yao)(yao)坐十年(nian)冷(leng)板凳(deng)、甚至(zhi)一(yi)輩子冷(leng)板凳(deng)的(de)(de)心理準備。”
這也是中國科(ke)研工作(zuo)者(zhe)需要(yao)攀越的下一(yi)座高山(shan):如果不(bu)知道(dao)哪一(yi)年看到曙光,那么(me)做技術(shu)的人(ren)還會(hui)用盡全力么(me)?
“甘坐十年冷板凳這(zhe)(zhe)句話對(dui)我們(men)這(zhe)(zhe)些科(ke)研人員的(de)影響力是巨大的(de),這(zhe)(zhe)也是我們(men)對(dui)技術的(de)追求,因為我們(men)相信科(ke)技創新才能真(zhen)正引領未來。”熊(xiong)世富說到。
2018年,科大訊飛提(ti)出了引領(ling)性的(de)(de)全新語音(yin)識別框(kuang)架(jia)——深度(du)全序列卷(juan)積神經網絡(DFCNN),進一(yi)步提(ti)高(gao)語音(yin)轉寫的(de)(de)準確率(lv),引領(ling)語音(yin)識別技術的(de)(de)發展(zhan)。而在(zai)此(ci)之前,最好的(de)(de)語音(yin)識別系統(tong)(tong)采用(yong)雙向長短時記憶網絡(LSTM),但是,這一(yi)系統(tong)(tong)存在(zai)訓練復雜度(du)高(gao)、解碼(ma)時延高(gao)的(de)(de)問題,尤其在(zai)工業界的(de)(de)實時識別系統(tong)(tong)中很難應(ying)用(yong)。
而(er)在(zai)另一(yi)(yi)邊,熊世(shi)富早已(yi)在(zai)2017年悄然開(kai)始(shi)了下一(yi)(yi)代(dai)(dai)(dai)(dai)的端(duan)到端(duan)語音識別系統(tong)的研(yan)發(fa)(fa)。“研(yan)發(fa)(fa)一(yi)(yi)代(dai)(dai)(dai)(dai)儲備一(yi)(yi)代(dai)(dai)(dai)(dai),這是我們對(dui)技(ji)術(shu)的要求。”所以,當上一(yi)(yi)代(dai)(dai)(dai)(dai)技(ji)術(shu)DFCNN尚未成熟之時,熊世(shi)富就已(yi)經(jing)開(kai)始(shi)研(yan)究更新一(yi)(yi)代(dai)(dai)(dai)(dai)的端(duan)到端(duan)智能語音系統(tong)了。
相(xiang)比傳統(tong)(tong)語音系(xi)統(tong)(tong),端(duan)(duan)到端(duan)(duan)系(xi)統(tong)(tong)具有結構簡(jian)潔(jie)、通用性強、不依賴(lai)語言學知(zhi)識等(deng)優(you)點。進(jin)一(yi)步它能(neng)夠通過縮減人工預(yu)處理(li)和后續處理(li),盡可能(neng)使模型從(cong)原始(shi)輸入到最終輸出,給模型更多(duo)可以(yi)根(gen)據數據自動調(diao)節的(de)空間,增加模型的(de)整(zheng)體契合度(du),避免(mian)了多(duo)個模型間的(de)誤(wu)差傳導(dao)。更通俗一(yi)些(xie),端(duan)(duan)到端(duan)(duan)技(ji)術(shu)即針對需要多(duo)階段的(de)或多(duo)步解決的(de)問題,模型可以(yi)堆在一(yi)起優(you)化。因此(ci)它也被(bei)認為(wei)是(shi)未來智(zhi)能(neng)語音的(de)主(zhu)流(liu)技(ji)術(shu)框(kuang)架。
思想很簡單,但(dan)簡潔(jie)背后(hou)總逃不過“字(zi)越(yue)少,事(shi)越(yue)大(da)”定律(lv)。該技術思想原本(ben)在翻譯任(ren)務中發揮重要作(zuo)用,而(er)將(jiang)端到(dao)端技術運用語(yu)音方面的研究(jiu)也是一個(ge)個(ge)頂尖(jian)團(tuan)隊嘗試(shi)的方向,然而(er)其效果始終沒有敵(di)過非端到(dao)端技術。
構建端到端智能語(yu)音系(xi)統,熊世富(fu)花了整(zheng)整(zheng)兩年(nian)半的時間。
“確(que)實啃(ken)下了(le)(le)不少硬骨頭(tou),尤其是項(xiang)目后半段在區分性訓練技術上,明明已經在大數據(ju)上驗證(zheng)了(le)(le),但仍(reng)然無(wu)法達到想要(yao)的效果(guo)”。為了(le)(le)突破這項(xiang)技術,熊世(shi)富就花了(le)(le)整整三(san)個月時間攻關。
沒有(you)結(jie)果的時候(hou),自我質疑是(shi)(shi)常態。“其(qi)實這三個(ge)月有(you)一個(ge)半月是(shi)(shi)無用功。從科研的角度來看,做(zuo)任(ren)何事情都(dou)可能面臨失敗,十個(ge)項目能夠成功兩個(ge)已(yi)經是(shi)(shi)非常了不起的成績了,我們要接受做(zuo)的大部(bu)分事情都(dou)可能是(shi)(shi)失敗的結(jie)局。”
“可是(shi)從前(qian)期的(de)實驗結果和我(wo)過多年做語(yu)音(yin)(yin)識(shi)別(bie)的(de)經驗來看,我(wo)相信端到端語(yu)音(yin)(yin)識(shi)別(bie)技術一定是(shi)有前(qian)景(jing)的(de),可能真的(de)會比上(shang)一代(dai)(dai)更(geng)好。”熊世富(fu)一邊(bian)(bian)沉淀數據、一邊(bian)(bian)迭代(dai)(dai)算法的(de)系統(tong),繼續尋找問(wen)題所在。
2018年,科大訊(xun)飛(fei)端(duan)到端(duan)技術初露鋒芒,就在(zai)國際口語(yu)機器翻(fan)(fan)譯評測比賽(sai)(International Workshop on Spoken Language Translation,簡稱IWSLT)中,以(yi)在(zai)英德方向語(yu)音(yin)翻(fan)(fan)譯任(ren)務上端(duan)到端(duan)模(mo)型(xing)(End-to-End Model)顯(xian)著優勢,獲(huo)得世(shi)界第(di)一(yi)。
如果說 2010年(nian)深度(du)學(xue)習(xi)的(de)引入,是語(yu)音識(shi)別(bie)領域(yu)上一(yi)(yi)次顛覆性創(chuang)新(xin)(xin),那么新(xin)(xin)一(yi)(yi)代(dai)端(duan)到端(duan)語(yu)音識(shi)別(bie)的(de)研究(jiu),無疑標志著語(yu)音識(shi)別(bie)新(xin)(xin)一(yi)(yi)輪創(chuang)新(xin)(xin)的(de)里程碑。
新(xin)(xin)一代端到端語音(yin)識(shi)(shi)別系(xi)(xi)統(tong)(tong)(tong)帶來的(de)(de)效果提(ti)升非常顯(xian)著(zhu) —— 識(shi)(shi)別效果相比傳統(tong)(tong)(tong)語音(yin)識(shi)(shi)別系(xi)(xi)統(tong)(tong)(tong)提(ti)升了15%-30%,在特(te)定場(chang)(chang)景下,特(te)別是時(shi)下的(de)(de)應用(yong)熱(re)點端側語音(yin)識(shi)(shi)別場(chang)(chang)景上(shang),新(xin)(xin)系(xi)(xi)統(tong)(tong)(tong)能(neng)實現(xian)效果不降,系(xi)(xi)統(tong)(tong)(tong)資(zi)源(yuan)占(zhan)用(yong)大幅下降。
同時,科大訊飛也成為使(shi)用這(zhe)項技(ji)術最廣泛的(de)一(yi)家(jia)公司(si),系統于2019年(nian)在業界首(shou)次(ci)全(quan)網(wang)上線,并(bing)在訊飛輸入法、翻(fan)譯(yi)機、語(yu)音轉寫(xie)等重點業務上使(shi)用,并(bing)為語(yu)音識別帶來了(le)更(geng)大的(de)想象空間和更(geng)豐(feng)富的(de)產品形態,如方(fang)言(yan)免(mian)切換(huan)、多語(yu)種(zhong)統一(yi)建模、中英隨心說等。
回憶起(qi)端(duan)到端(duan)語(yu)音(yin)識別系統成功的(de)(de)原因,熊世富(fu)認(ren)為(wei):“當時(shi)業(ye)(ye)界大部分團隊包括公司(si)內部也有團隊都在(zai)做(zuo)小數(shu)據的(de)(de)訓練,而我(wo)認(ren)為(wei)只(zhi)能用大數(shu)據,才有成功的(de)(de)可能性,而這(zhe)后來也證(zheng)明(ming)是(shi)成功的(de)(de)關(guan)鍵突破。另外的(de)(de)難點(dian)在(zai)于算法框架(jia)的(de)(de)參數(shu)調整難度(du)非(fei)常高,而這(zhe)卻是(shi)我(wo)個(ge)人的(de)(de)優勢所(suo)在(zai),在(zai)科大訊飛,我(wo)經歷了一(yi)代(dai)(dai)代(dai)(dai)最新語(yu)音(yin)識別框架(jia)的(de)(de)迭代(dai)(dai)和更新,也可以說一(yi)直在(zai)接觸業(ye)(ye)界最前沿的(de)(de)技術。”

從研發到(dao)一項技(ji)術真正(zheng)的(de)(de)落地,人們對(dui)它(ta)的(de)(de)要(yao)求通常是苛(ke)刻的(de)(de)。這一點從Gartner技(ji)術曲線便可以(yi)看出(chu):一項新技(ji)術剛出(chu)現的(de)(de)時候是萌芽期(qi),然后進(jin)入期(qi)望膨脹期(qi),然后再回落到(dao)低(di)谷期(qi)。在(zai)低(di)谷期(qi),各種各樣的(de)(de)困難逐步(bu)找到(dao)解決(jue)方式(shi),才能夠進(jin)入穩步(bu)的(de)(de)爬升期(qi),再形(xing)成一個生(sheng)產成熟(shu)期(qi)。
開(kai)發的(de)(de)新一(yi)代端(duan)(duan)到端(duan)(duan)語音識別(bie)系統(tong),是熊(xiong)世富和他團隊所做努力(li)的(de)(de)第一(yi)步。“端(duan)(duan)到端(duan)(duan)語音識別(bie)技術一(yi)個(ge)難點在于它非(fei)常依賴數據(ju),在通用領域(yu)數據(ju)積累(lei)豐(feng)富,但在垂直(zhi)領域(yu)里(li),會有各(ge)(ge)種(zhong)面向行業的(de)(de)專有名詞,端(duan)(duan)到端(duan)(duan)的(de)(de)效(xiao)果還不夠好。所以端(duan)(duan)到端(duan)(duan)系統(tong)現在面臨的(de)(de)是如何深入各(ge)(ge)個(ge)領域(yu),去(qu)解決一(yi)個(ge)領域(yu)的(de)(de)效(xiao)果問(wen)題。只有攻(gong)克(ke)這(zhe)一(yi)難題,端(duan)(duan)到端(duan)(duan)模型才能真正‘走出去(qu)’。”
或許,可以(yi)(yi)將(jiang)聲(sheng)學(xue)模(mo)(mo)型和語言(yan)建模(mo)(mo)能力結合可以(yi)(yi)打(da)破(po)數(shu)據的(de)(de)限制(zhi)(zhi),來解(jie)決垂直領(ling)域(yu)的(de)(de)一個個定制(zhi)(zhi)問題。“比(bi)如我想去(qu)看西虹(hong)市首富,模(mo)(mo)型非常容易(yi)直接(jie)輸出(chu)食(shi)物品種的(de)(de)西紅柿,想要達(da)到精(jing)準的(de)(de)轉(zhuan)化非常難。上一代深(shen)度學(xue)習只是進行聲(sheng)學(xue)建模(mo)(mo),而(er)目前我們在嘗試將(jiang)聲(sheng)學(xue)和語言(yan)解(jie)耦,雖然是聯合訓練(lian),但是可以(yi)(yi)達(da)到把特(te)定領(ling)域(yu)的(de)(de)詞語單(dan)獨拎(lin)出(chu)來替(ti)換為我們想要的(de)(de)語言(yan)。”
熊世(shi)富(fu)創新性提(ti)出的熱詞(ci)(ci)整詞(ci)(ci)建模方(fang)法,顯(xian)著的提(ti)升(sheng)了熱詞(ci)(ci)識別效果(guo),也為攻克(ke)端(duan)到端(duan)語(yu)音識別的領域定制(zhi)問題奠定了關鍵的基礎。
不過,伴(ban)隨著人工智能技術(shu)門檻的降低,核心技術(shu)領先的窗口期也(ye)在(zai)(zai)逐步(bu)縮短。帶領團(tuan)隊持續提升公司(si)語音識(shi)別的領先水平,屹(yi)立(li)于世界的前沿是(shi)熊世富(fu)和他團(tuan)隊持續在(zai)(zai)做的努力。“壓力一直都在(zai)(zai),不敢有絲毫松懈。始終保(bao)持每年技術(shu)進步(bu)30%,這是(shi)我(wo)(wo)們對技術(shu)的要(yao)求(qiu),也(ye)是(shi)科大訊飛每一位科研人員(yuan)的自我(wo)(wo)要(yao)求(qiu)。”
而隨著萬物互聯的時代到來,物理空間和現實空間融合共生,每一次科技的技術突破,都是為了讓人們可以使用更為貼近“自然”的方式與機器進行溝通。“未來不管是我們和人工之智能,還是和機器人之前,都應該是自然的交互。如智能汽車、智能家居,都能(neng)和(he)你對話和(he)交(jiao)流,并能(neng)夠理解你所講的(de)話,從(cong)而(er)提供服務。“
尋找下(xia)一代人機(ji)交互的方式,則是熊世富和團隊(dui)的終(zhong)極使(shi)命。

“或許(xu)多模(mo)(mo)態技(ji)術(shu)(shu)能夠打通(tong)人機交互的最后一公里(li),進而(er)帶來顛覆性的交互體驗。”熊(xiong)世富預測道(dao)。多模(mo)(mo)態技(ji)術(shu)(shu),也(ye)(ye)叫深度學習多模(mo)(mo)態融合(he),指機器從文本、圖像(xiang)、語(yu)(yu)(yu)音、視(shi)頻等(deng)多個領(ling)域(yu)獲取信息,實現信息轉換(huan)和融合(he),從而(er)提升模(mo)(mo)型性能的技(ji)術(shu)(shu)。如在車(che)載(zai)交互領(ling)域(yu),科大(da)訊飛的汽車(che)級視(shi)線追蹤技(ji)術(shu)(shu)讓用戶(hu)注視(shi)即可實現喚(huan)醒(xing)交互,目光所至皆(jie)可控制。同時,唇(chun)(chun)音融合(he)語(yu)(yu)(yu)音技(ji)術(shu)(shu)的創新型加入,具備唇(chun)(chun)音免喚(huan)醒(xing)、唇(chun)(chun)音檢(jian)出、唇(chun)(chun)音增強三大(da)核心能力,開口說話就能一語(yu)(yu)(yu)直達,就算是輕(qing)聲(sheng)細語(yu)(yu)(yu),也(ye)(ye)能聽(ting)清。
從面(mian)對國內語音市場的一片空白到如今技術實力代表著全(quan)球領先(xian)水平(ping),科大(da)訊飛(fei)智能語音發展的歷程也在一定程度上(shang)代表了(le)科大(da)訊飛(fei)的一路走來的創業(ye)歷程。
可以(yi)說,在智能(neng)時代(dai),科大訊(xun)飛就是一面中國(guo)智能(neng)語(yu)(yu)音(yin)的(de)旗幟。中國(guo)語(yu)(yu)音(yin)產業(ye)聯盟(meng)剛(gang)剛(gang)發布(bu)的(de)《2020-2021 中國(guo)智能(neng)語(yu)(yu)音(yin)行(xing)業(ye)白皮書》引用德(de)勤數據顯(xian)示(shi),作為大型智能(neng)語(yu)(yu)音(yin)科技企業(ye)的(de)代(dai)表,科大訊(xun)飛憑借較強的(de)研發優勢,以(yi)60%的(de)市(shi)場份額穩居第一,競爭優勢明顯(xian)。
而科大訊飛(fei)的理(li)想也從讓機器開口說話到讓機器能(neng)(neng)聽會說,能(neng)(neng)理(li)解會思考,用(yong)人工智能(neng)(neng)建(jian)設美(mei)好世界。
我們曾經將科大(da)訊(xun)飛(fei)比(bi)喻(yu)為一個(ge)很(hen)寬、很(hen)深的生成式神(shen)經網(wang)絡。
一個典型的生成式(shi)神(shen)經網絡包括了輸(shu)入(ru)層(ceng)、編碼層(ceng)、輸(shu)出層(ceng),對于一個AI企(qi)業而(er)言(yan),輸(shu)入(ru)是(shi)AI三要素:算力、數據、算法,輸(shu)出是(shi)技術和(he)產品(pin),編碼層(ceng)則是(shi)企(qi)業的組織方式(shi)和(he)技術方法論,以及(ji)企(qi)業的人(ren)才。
在《不一樣的(de)科(ke)(ke)大(da)訊飛,他們(men)(men)把計算機(ji)視覺(jue)踢(ti)進“世界杯”》這篇文章中(zhong)(zhong),我們(men)(men)了解了科(ke)(ke)大(da)訊飛對人(ren)才的(de)重視,以及獨(du)特的(de)組織(zhi)方式。而在《科(ke)(ke)大(da)訊飛認知智能,從場(chang)景中(zhong)(zhong)來,到行(xing)業(ye)中(zhong)(zhong)去》這篇文章中(zhong)(zhong),我們(men)(men)則窺探了這個無限拓寬的(de)神經網絡的(de)秘密——如(ru)何(he)定(ding)義并建立對不同行(xing)業(ye)的(de)真正認知。
這其(qi)中保(bao)證這個很(hen)寬(kuan)、很(hen)深的(de)生成式神經(jing)網絡發展張力的(de)源泉(quan),或許(xu)可(ke)以(yi)從創(chuang)業之初的(de)故(gu)事來的(de)探尋——在(zai)公(gong)司歷(li)史上(shang)著名的(de)“半湯會議(yi)”上(shang),當(dang)團隊聚集在(zai)一起(qi)對于公(gong)司未(wei)來議(yi)論紛紛之際,最終創(chuang)始人劉慶峰(feng)拍板,“繼(ji)續(xu)做語(yu)音(yin),誰不(bu)樂意直接(jie)走人”,堅定了“智能語(yu)音(yin)”的(de)戰略(lve)方(fang)向。“燃燒最亮(liang)的(de)火把(ba),要(yao)么(me)率(lv)先(xian)燎原,要(yao)么(me)最先(xian)熄(xi)滅”,劉慶峰(feng)在(zai)當(dang)年的(de)年度(du)大(da)會上(shang)說的(de)話至今仍被掛在(zai)科大(da)訊飛大(da)廈的(de)墻上(shang),激勵(li)著公(gong)司在(zai)智能語(yu)音(yin)與人工智能道(dao)路上(shang)不(bu)忘初心(xin),堅守前(qian)行。
如(ru)今科大訊飛已經在這個(ge)領域深耕了22年(nian),這其(qi)中保證這個(ge)很(hen)(hen)寬、很(hen)(hen)深的(de)生(sheng)成式神(shen)(shen)經網絡發展張力的(de)源泉就是——源于(yu)熱(re)愛(ai)的(de)初心(xin)(xin)堅守(shou)。因為熱(re)愛(ai),才(cai)會(hui)22年(nian)不斷堅守(shou),從(cong)未(wei)改變初心(xin)(xin);因為相信,才(cai)會(hui)甘坐十年(nian)冷板凳的(de)精神(shen)(shen)從(cong)源頭創(chuang)新持續(xu)突破,讓人工(gong)智能多項核心(xin)(xin)技術世界(jie)領先,在國(guo)際競(jing)爭中擁有話語權(quan),或許這也(ye)是科大訊飛創(chuang)業22年(nian)來(lai)最大的(de)財富。而他(ta)們(men)一(yi)路走(zou)來(lai),在引領中國(guo)人工(gong)智能行業的(de)變革中,也(ye)讓世界(jie)更加美好(hao)。