近(jin)日(ri),云知(zhi)聲創始(shi)人梁家(jia)恩博士與智次方進行了(le)(le)深度對話,本文摘(zhai)取了(le)(le)兩位大咖(ka)對話中(zhong)的(de)部分精華內容。
當前,人工智能技術的(de)發展已經(jing)進入了新拐點,AI技術范式(shi)正從(cong)過(guo)去的(de)“預訓練模(mo)型(xing)(xing)-特定(ding)任務(wu)精調”向“基礎模(mo)型(xing)(xing)-應(ying)用(yong)反饋學習”變遷,這(zhe)種遷移也必然創造更(geng)多應(ying)用(yong)可能,各行各業(ye)也在紛紛探索(suo)AI新范式(shi),包(bao)括通用(yong)大(da)模(mo)型(xing)(xing)演(yan)進和利用(yong)大(da)模(mo)型(xing)(xing)范式(shi)解決醫(yi)療、工業(ye)、辦公等場(chang)景問題(ti),新產品也已經(jing)快(kuai)速融入各行各業(ye),不(bu)斷塑造新業(ye)態、新場(chang)景,帶來巨大(da)的(de)商業(ye)價值(zhi)。
作為國內頂尖的語音人工智能獨角獸企業,云知聲十年來構建了以語音、語言和知識圖譜為核心,涵蓋感知、認知與生成的全棧AI技術體系,并向多模態人工智能方向拓展。對于云知聲而言,已經把ChatGPT技術升級作為公司AGI能力構建的新起點,并優先解決在智慧物聯和智慧醫療領域的應用問題。
近期,云知聲創始人、董事長兼CTO梁家恩博士與智次方·物聯網智庫創始人彭昭聊了聊大模型在(zai)不同場景中的(de)應用。

從鑒別式AI到生成式AI的轉變
彭昭(zhao):過去十年是(shi)鑒別式AI為主流,未來十年則是(shi)生成式AI的(de)(de)天下,眾所周知,生成式AI對于數據(ju)、算法、算力這(zhe)三個方(fang)(fang)面都(dou)提出了(le)更高(gao)的(de)(de)要求(qiu),請(qing)問云知聲在這(zhe)三方(fang)(fang)面都(dou)做了(le)怎樣(yang)的(de)(de)準備和布局?
梁家恩(en):生(sheng)成(cheng)式AI其實和過去的(de)鑒別(bie)式AI,在(zai)(zai)核(he)心算法框架上來(lai)說差別(bie)并沒(mei)有(you)那(nei)么(me)大,鑒別(bie)式AI主(zhu)要研(yan)究的(de)是數據(ju)分布,根(gen)據(ju)數據(ju)分布來(lai)區分不同的(de)類(lei)型,而(er)生(sheng)成(cheng)式AI,則(ze)是在(zai)(zai)數據(ju)分布做建模的(de)基礎之上,還要去研(yan)究數據(ju)的(de)生(sheng)成(cheng)結(jie)構(gou),特別(bie)是現在(zai)(zai)跟自(zi)然(ran)語(yu)言(yan)結(jie)合在(zai)(zai)一起以(yi)后,就(jiu)可(ke)以(yi)用(yong)自(zi)然(ran)語(yu)言(yan)的(de)方(fang)式去靈活控制它(ta)的(de)生(sheng)成(cheng)的(de)結(jie)果。
在(zai)人工智能領域,數據(ju)、算(suan)(suan)力(li)和算(suan)(suan)法早(zao)已(yi)成(cheng)(cheng)為(wei)不可缺(que)少的“三(san)駕馬車”,對(dui)于云知聲來說,實際(ji)上我(wo)們在(zai)2012年成(cheng)(cheng)立時(shi)就已(yi)經(jing)開始(shi)布局(ju)這三(san)方面(mian),也(ye)是把(ba)深(shen)度學(xue)習最早(zao)用到產(chan)業(ye)界里的公司(si)(si)之一(yi)。在(zai)數據(ju)方面(mian),云知聲構(gou)建了(le)一(yi)個云平臺來匯集數據(ju);在(zai)算(suan)(suan)力(li)方面(mian),早(zao)期(qi)公司(si)(si)就布局(ju)了(le)GPU集群,但規模(mo)并(bing)不算(suan)(suan)大(da),在(zai)2016年的時(shi)候,我(wo)們開始(shi)把(ba)GPU集群升級為(wei)Atlas大(da)規模(mo)機器(qi)學(xue)習超(chao)算(suan)(suan)平臺,為(wei)未(wei)來同(tong)時(shi)調度上千塊GPU做大(da)模(mo)型做了(le)很(hen)好的準(zhun)備(bei);在(zai)算(suan)(suan)法方面(mian),現在(zai)語音、歌唱和虛擬人合(he)成(cheng)(cheng)技術已(yi)經(jing)比(bi)較成(cheng)(cheng)熟(shu),云知聲在(zai)這方面(mian)的技術儲備(bei)也(ye)很(hen)充(chong)分,未(wei)來還需要(yao)在(zai)多(duo)模(mo)態領域延伸,比(bi)如圖像和視頻的生成(cheng)(cheng)。多(duo)模(mo)態生成(cheng)(cheng)目(mu)前(qian)也(ye)都是通過(guo)自然語言來銜接(jie)在(zai)一(yi)起的,需要(yao)繼(ji)續增加(jia)算(suan)(suan)力(li)和數據(ju),并(bing)結合(he)應用場(chang)景進行拓展。
彭昭(zhao):ChatGPT背后(hou)使(shi)用的(de)(de)(de)是數年前的(de)(de)(de)Transformer架構,但依(yi)然取得了驚人的(de)(de)(de)效果(guo),這(zhe)在某種程(cheng)度上說明AI的(de)(de)(de)演(yan)(yan)進(jin)已經從以算(suan)法為中(zhong)心(xin)(xin)逐步變(bian)為以數據為中(zhong)心(xin)(xin),您覺得MaaS這(zhe)種模式會(hui)成為AIGC時代的(de)(de)(de)主(zhu)流嗎?未來還會(hui)如(ru)何演(yan)(yan)變(bian)?
梁家恩:在(zai)(zai)科技圈之(zhi)(zhi)外(wai),Transformer的(de)(de)強(qiang)大是在(zai)(zai)ChatGPT出現之(zhi)(zhi)后(hou)(hou)才(cai)被(bei)大眾才(cai)看到(dao)。其實在(zai)(zai)它(ta)剛(gang)剛(gang)出現之(zhi)(zhi)后(hou)(hou),GPT就已經用(yong)到(dao)了Transformer架(jia)(jia)構,雖然(ran)幾個月之(zhi)(zhi)后(hou)(hou)就被(bei)Google推(tui)出的(de)(de)BERT模(mo)型打敗(bai),但(dan)BERT本身也(ye)用(yong)到(dao)了Transformer架(jia)(jia)構。過(guo)去,用(yong)傳統的(de)(de)方(fang)法來處理(li)語(yu)言問題(ti)是非(fei)(fei)常(chang)困難的(de)(de),因為語(yu)言是個離散符號(hao)處理(li)問題(ti),要做詞法分析、句法分析等(deng)任務非(fei)(fei)常(chang)麻(ma)煩,直到(dao)通過(guo)深(shen)度學習轉化為詞向(xiang)量表示才(cai)有(you)實質(zhi)性突(tu)破。有(you)了Transformer架(jia)(jia)構以(yi)(yi)后(hou)(hou),利用(yong)它(ta)的(de)(de)自(zi)注意(yi)力(li)(self-attention)機(ji)制,只要訓(xun)練(lian)的(de)(de)數據量足夠大,就可以(yi)(yi)把序列(lie)映射(she)問題(ti)做到(dao)足夠好。當(dang)時,這篇論文(wen)的(de)(de)標題(ti)取的(de)(de)也(ye)非(fei)(fei)常(chang)“囂張”,叫“Attention is all you need”,意(yi)思是只要用(yong)自(zi)注意(yi)力(li)機(ji)制就可以(yi)(yi)搞(gao)定所(suo)有(you)問題(ti),結果它(ta)確實在(zai)(zai)機(ji)器翻譯(yi)上取得了非(fei)(fei)常(chang)大的(de)(de)突(tu)破。后(hou)(hou)來,業界就用(yong)這個框架(jia)(jia)去解(jie)決很多語(yu)義理(li)解(jie)的(de)(de)問題(ti),確實都有(you)很大的(de)(de)提升,這在(zai)(zai)過(guo)去是不(bu)可想(xiang)象的(de)(de)。不(bu)過(guo),這些都是普通用(yong)戶感(gan)覺不(bu)到(dao)的(de)(de),用(yong)戶真正(zheng)能夠感(gan)覺到(dao)的(de)(de)是模(mo)型在(zai)(zai)理(li)解(jie)之(zhi)(zhi)外(wai),生成(cheng)的(de)(de)應答(da)效果如何。
而(er)ChatGPT的(de)(de)回(hui)應超出(chu)了用戶(hu)的(de)(de)預期,大家才覺得終(zhong)于比過去看到(dao)的(de)(de)對(dui)話機(ji)器人的(de)(de)智商有了質(zhi)的(de)(de)突(tu)破(po),但其實技術在這些(xie)年里一(yi)直都有突(tu)破(po)和進(jin)展,只不過是現在的(de)(de)應用形式讓大家突(tu)然感覺到(dao)進(jin)展確實非(fei)常大。
剛才(cai)說到“以算(suan)法(fa)為中心轉(zhuan)向以數據(ju)為中心”的(de)趨勢(shi)是(shi)非常明確的(de),因為在框(kuang)架(jia)統一之后,模型的(de)性能就(jiu)取決(jue)于究竟(jing)給什么樣的(de)數據(ju)去訓(xun)練(lian),數據(ju)就(jiu)決(jue)定了模型性能的(de)上限,數據(ju)質量(liang)越(yue)高、規模越(yue)大,往往模型效果就(jiu)越(yue)好。
未(wei)來,我認為(wei)Maas的(de)模式(shi)會成為(wei)大(da)趨勢。過(guo)去,要(yao)處(chu)(chu)理相對復(fu)雜業(ye)務(wu)(wu),都需(xu)要(yao)根據(ju)(ju)業(ye)務(wu)(wu)流(liu)程(cheng)(cheng)來編(bian)程(cheng)(cheng)解決,但現在就可(ke)(ke)以通過(guo)自然(ran)語言接口來處(chu)(chu)理這些任務(wu)(wu),在這種情況下(xia)就可(ke)(ke)以用模型優(you)化(hua)代替(ti)流(liu)程(cheng)(cheng)編(bian)碼(ma)來直接解決各種問題,只需(xu)要(yao)收集這個領域和(he)應用的(de)數據(ju)(ju)去訓練(lian)即(ji)可(ke)(ke),而(er)不需(xu)要(yao)自己編(bian)程(cheng)(cheng)來解決,這是模型處(chu)(chu)理業(ye)務(wu)(wu)和(he)編(bian)程(cheng)(cheng)處(chu)(chu)理業(ye)務(wu)(wu)方(fang)式(shi)的(de)本質區別。
大模型要更加注重數據安全
彭昭:如(ru)果轉(zhuan)變為Maas的(de)模式,如(ru)何判(pan)斷各種模型的(de)好壞(huai)呢?
梁(liang)家恩:其(qi)實最終都要(yao)(yao)(yao)從結果來評判的(de),ChatGPT比較好的(de)一點(dian)就在(zai)于它(ta)其(qi)實在(zai)隱藏(zang)了(le)中(zhong)間的(de)理(li)(li)解(jie)問題,用(yong)戶(hu)不(bu)需(xu)要(yao)(yao)(yao)關心模(mo)型中(zhong)間的(de)“意(yi)圖理(li)(li)解(jie)”環節,也不(bu)需(xu)要(yao)(yao)(yao)顯(xian)式做(zuo)句法分析(xi)、語(yu)義理(li)(li)解(jie)等動作,只(zhi)要(yao)(yao)(yao)看看ChatGPT最終給用(yong)戶(hu)的(de)反饋質量如何就可以。就像(xiang)圖靈測試一樣,只(zhi)要(yao)(yao)(yao)人類無(wu)法判斷是真人還(huan)是機器(qi)在(zai)回應,就是足夠智能。如果單獨處理(li)(li)“語(yu)義理(li)(li)解(jie)”任務(wu),過去像(xiang)BERT這種模(mo)型,要(yao)(yao)(yao)比GPT模(mo)型做(zuo)得更好,因為(wei)它(ta)使(shi)用(yong)了(le)雙向注意(yi)力(li)機制,但BERT架構沒法直接形(xing)成直觀的(de)高質量回復,所以讓非技術(shu)用(yong)戶(hu)感知到。
彭昭:如果(guo)以數據(ju)為中心的話,掌(zhang)握大(da)量數據(ju)的企業會(hui)有很強的競(jing)爭優勢(shi)嗎?
梁家恩:不論是(shi)過(guo)去的(de)傳(chuan)統(tong)算(suan)法(fa),還是(shi)現在的(de)機(ji)器(qi)學(xue)習(xi)算(suan)法(fa),數(shu)據都已經變(bian)得(de)非(fei)常重要,很多公(gong)司本質上也已經變(bian)成了數(shu)據公(gong)司。只要有很多的(de)數(shu)據沉淀下來,模型就可(ke)以變(bian)得(de)足夠聰(cong)明,只不過(guo)此前(qian)使(shi)用傳(chuan)統(tong)的(de)統(tong)計學(xue)習(xi)方(fang)法(fa)去挖(wa)掘這(zhe)種能力(li),而現在是(shi)用深度學(xue)習(xi)和(he)大模型的(de)方(fang)法(fa)去挖(wa)掘,精度和(he)能力(li)也就越(yue)(yue)來越(yue)(yue)強。
彭昭:相比(bi)于其(qi)它行業(ye)(ye)來說,醫療(liao)(liao)領(ling)域對安全的(de)(de)要求(qiu)更(geng)高甚至不容出錯,云(yun)知聲是(shi)如何(he)在醫療(liao)(liao)行業(ye)(ye)大模型(xing)中(zhong)滿足近乎(hu)嚴(yan)苛的(de)(de)要求(qiu),從(cong)而讓模型(xing)輸出的(de)(de)結果更(geng)專業(ye)(ye)、更(geng)可信(xin)的(de)(de)?
梁家恩(en):云知聲之(zhi)所(suo)(suo)以把醫(yi)(yi)(yi)療作為一(yi)個主要(yao)方向,是因為醫(yi)(yi)(yi)療行業的(de)(de)知識密集程度非常高,如果(guo)在醫(yi)(yi)(yi)療領域的(de)(de)問(wen)題都能夠(gou)處理好,相信很多其他(ta)行業也都能搞定,這對我們來說(shuo)是一(yi)個技術的(de)(de)制高點,所(suo)(suo)以需要(yao)攻克它(ta)。另外,醫(yi)(yi)(yi)療行業的(de)(de)應用場景、應用空間包括(kuo)社會價值也都很大。
在數據(ju)安全性方(fang)面,特別是有(you)些涉(she)及到用戶的隱私數據(ju),要求都是很高的,最(zui)難(nan)的就是真實的用戶治療案例,都必須經(jing)過(guo)數據(ju)的脫敏處理。另外,在我們和(he)醫院的合(he)作過(guo)程中(zhong),也(ye)會把數據(ju)做相應的加(jia)密和(he)tokenization,即(ji)把數據(ju)符號(hao)化(hua),只(zhi)有(you)機(ji)器能(neng)夠知道解碼后的含義。在算法方(fang)面,現在的聯(lian)邦學習也(ye)可以把各種特征融(rong)合(he)后再去計(ji)算,使得不接觸初始敏感信(xin)息的情況下,還(huan)可以繼(ji)續優化(hua)模型。
彭昭:OpenAI的(de)CEO也在積極的(de)做一些生態投(tou)資的(de)布局(ju),云知聲會(hui)(hui)不(bu)會(hui)(hui)擔心OpenAI投(tou)資醫療賽道(dao)?
梁(liang)家(jia)恩:我(wo)覺得不論是(shi)教育還是(shi)醫療,這(zhe)些行(xing)(xing)業其實都事(shi)關國計民生(sheng),所(suo)以這(zhe)里面(mian)中國一定(ding)要(yao)有(you)自己獨立的(de)解決方案,如果他愿(yuan)意(yi)投資這(zhe)方面(mian)的(de)企業,在(zai)國內來看(kan),我(wo)相信云知聲是(shi)很(hen)好的(de)標(biao)的(de)。過去我(wo)們已經有(you)很(hen)多行(xing)(xing)業已經遭受到所(suo)謂卡脖子的(de)問題,在(zai)這(zhe)個領域我(wo)們肯定(ding)不會讓它成為一個新的(de)卡脖子問題。
彭昭(zhao):云知(zhi)聲是以(yi)語音識別(bie)技術起家(jia)的(de)(de),從2012年至今積累了大量相關經驗(yan),早(zao)期(qi)的(de)(de)這些技術積累對于(yu)云知(zhi)聲推出行業大模型有怎樣的(de)(de)幫(bang)助?
梁家恩:當時起“云知聲”這個名字(zi)的時候,我們(men)就不僅僅停(ting)留在(zai)聲音領域了(le),聲音只是我們(men)的一個切(qie)入點,我們(men)更希望有(you)一個云端大腦,有(you)強(qiang)大的認知能(neng)力,能(neng)夠(gou)通過聲音的交(jiao)互去解(jie)決問題。
2012年時(shi)(shi),我(wo)(wo)們(men)開始布(bu)局(ju)“三駕馬車”,到(dao)2016年AlphaGo開始興起(qi)的(de)(de)時(shi)(shi)候,我(wo)(wo)們(men)就已經開始布(bu)局(ju)底層(ceng)的(de)(de)大規模(mo)計算(suan)能(neng)力,也(ye)(ye)就是(shi)(shi)Atlas超算(suan)平臺。在此之上(shang),我(wo)(wo)們(men)還拓展了知識圖譜(pu)和(he)認知技術體系(xi),從而形成(cheng)一(yi)個(ge)全棧(zhan)的(de)(de)技術體系(xi)。現在拓展到(dao)的(de)(de)大模(mo)型對我(wo)(wo)們(men)來說只是(shi)(shi)一(yi)個(ge)算(suan)法框架(jia)(jia)的(de)(de)升(sheng)級。類似過去用BERT主要是(shi)(shi)解決判(pan)別式(shi)(shi)問(wen)(wen)題(ti)的(de)(de),那現在就把它切換成(cheng)GPT的(de)(de)生(sheng)成(cheng)式(shi)(shi)框架(jia)(jia),而BERT實際上(shang)是(shi)(shi)Transformer的(de)(de)編碼器部分(fen),GPT則是(shi)(shi)Transformer的(de)(de)解碼器部分(fen),算(suan)法改變對我(wo)(wo)們(men)沒有(you)本質的(de)(de)挑戰,我(wo)(wo)們(men)也(ye)(ye)已經具(ju)備訓練大模(mo)型的(de)(de)基(ji)礎架(jia)(jia)構。除了算(suan)法和(he)算(suan)力支撐,在行業(ye)問(wen)(wen)題(ti)認知和(he)數(shu)據(ju)積累方面,也(ye)(ye)讓我(wo)(wo)們(men)充滿信心(xin)。包括(kuo)物聯(lian)網和(he)醫療領域(yu),我(wo)(wo)們(men)理解這(zhe)些行業(ye)業(ye)務的(de)(de)核心(xin)問(wen)(wen)題(ti),也(ye)(ye)有(you)相(xiang)關的(de)(de)數(shu)據(ju)積累,我(wo)(wo)們(men)是(shi)(shi)非常有(you)信心(xin)能(neng)把這(zhe)個(ge)大模(mo)型做(zuo)好的(de)(de)。
其(qi)實從ChatGPT的算法原理來說,早(zao)就已經有(you)了, OpenAI最(zui)重要(yao)的是率先把產品做了出(chu)來,從而(er)形(xing)成一個工程閉(bi)環。另外,大家對OpenAI的容忍度是遠遠高(gao)于Google的,如果(guo)OpenAI之前犯的那些(xie)錯誤Google同樣(yang)(yang)犯的話,我估計(ji)后果(guo)是完全不一樣(yang)(yang)的,所以不能說OpenAI在(zai)(zai)技術上是一騎絕(jue)塵的,像Google內部也有(you)DeepMind在(zai)(zai)研究AGI,相關儲備(bei)也已經非常(chang)充足。
在(zai)過去算法、算力和數據積累基(ji)礎(chu)上,對我(wo)們來說就是把過去以(yi)BERT為核(he)心的技術(shu)架(jia)(jia)構(gou)升(sheng)級成以(yi)ChatGPT為核(he)心的技術(shu)框架(jia)(jia),這(zhe)樣的好處就在(zai)于可以(yi)用生成式(shi)AI把理(li)解和生成打(da)通(tong),性(xing)能體驗(yan)、靈活性(xing)、擴(kuo)展性(xing)會強很多。
技術發展其實更符合對數曲線
彭昭(zhao):上周(zhou),OpenAI CEO表示誕(dan)生ChatGPT的(de)(de)研究策略已經結束,繼續擴展(zhan)模型(xing)規模帶來的(de)(de)收益(yi)將出現(xian)遞減(jian)。您覺(jue)得模型(xing)繼續向(xiang)參數(shu)(shu)量(liang)變大(da)的(de)(de)方(fang)向(xiang)發(fa)(fa)展(zhan)還(huan)會(hui)持續多久,除了(le)拼參數(shu)(shu)外,還(huan)有(you)哪些(xie)發(fa)(fa)展(zhan)方(fang)向(xiang)?
梁(liang)家(jia)恩:大家(jia)其實(shi)對于算(suan)法(fa)好像有(you)一種不(bu)切(qie)實(shi)際的預期(qi),覺得一個(ge)算(suan)法(fa)就能(neng)解決(jue)所有(you)問題,但不(bu)論是(shi)過(guo)去(qu)的統(tong)計學(xue)習、支持向量機,還是(shi)現(xian)在的深度學(xue)習,事實(shi)都(dou)并非如此,每種算(suan)法(fa)都(dou)有(you)它自身的局限性(xing),像OpenAI就是(shi)把(ba)GPT框架的潛力挖掘到盡(jin)頭,并不(bu)是(shi)說(shuo)競爭已(yi)經結束了(le),而(er)是(shi)按照(zhao)他們的這種探索策略,再繼續(xu)加大投入可能(neng)已(yi)經沒有(you)太大收益。因此,需要尋找一些(xie)新的策略、新的方法(fa),在這個(ge)基礎上去(qu)探索,而(er)不(bu)是(shi)說(shuo)這個(ge)游戲已(yi)經結束了(le)。
另外,單純擴(kuo)大(da)模型規(gui)模也有它的(de)(de)局限性,對于技術外行來說,大(da)都希(xi)望技術進(jin)步(bu)是(shi)一(yi)條“指數曲線(xian)”,但它其實是(shi)一(yi)條“對數曲線(xian)”,繼續擴(kuo)大(da)規(gui)模到(dao)一(yi)定程度(du)(du)后,進(jin)步(bu)的(de)(de)幅度(du)(du)就會平緩很多,通過嘗試(shi)新的(de)(de)方法可(ke)能再做出第二個對數曲線(xian)出來。
當然對于國內(nei)的(de)(de)企業來(lai)說,和OpenAI還是有(you)差距(ju)的(de)(de),那我們首先需(xu)要(yao)先做到現(xian)在GPT-3.5 或者GPT-4的(de)(de)水平,然后再繼續(xu)往前走,我覺得后面還有(you)持續(xu)的(de)(de)工作(zuo)要(yao)做,畢竟(jing)純靠(kao)參數(shu)量級的(de)(de)擴(kuo)大(da),哪怕是做到人腦(nao)神經元(yuan)的(de)(de)連接(jie)數(shu)量,也不是完全復制了(le)一個人,還有(you)其他的(de)(de)技術瓶頸需(xu)要(yao)突破。
彭昭:關于云知聲(sheng)將要推出的(de)UniGPT大模型,能(neng)否(fou)簡單透露(lu)一些信息?
梁家(jia)恩:其實去年我們看(kan)到(dao)ChatGPT出來后,就覺得這確實是一個顛(dian)覆性(xing)的(de)工作(zuo)。其實GPT-3就已(yi)經有很(hen)多新奇特性(xing),但當時大家(jia)覺得它的(de)可(ke)控性(xing)很(hen)差,可(ke)能(neng)無法駕馭好這種能(neng)力,直到(dao)ChatGPT展示出很(hen)好效果,才引(yin)起(qi)行業內外的(de)高度關注。深度學習到(dao)今天為止(zhi),最核心的(de)一個問題也還是可(ke)解釋性(xing)和(he)可(ke)控性(xing)不足(zu)。
而大(da)模型(xing)(xing)所謂(wei)的(de)(de)(de)(de)“思維鏈”能(neng)力(li),可以告(gao)訴(su)用戶(hu)推導的(de)(de)(de)(de)過程(cheng),從而知道中(zhong)間過程(cheng)里有(you)哪(na)些東西(xi)是(shi)錯(cuo)的(de)(de)(de)(de),優化的(de)(de)(de)(de)時候就可以獲得提示(shi)了,而不(bu)是(shi)像過去(qu)一樣只能(neng)看見和調整參數的(de)(de)(de)(de)權重(zhong)。此外,還(huan)有(you)一個(ge)比較早期的(de)(de)(de)(de)AutoGPT研究方向,但我(wo)覺得非常有(you)潛力(li),就是(shi)用大(da)模型(xing)(xing)來把大(da)模型(xing)(xing)用好(hao),形成AI for AI,未來的(de)(de)(de)(de)空間也會很大(da)。
云知(zhi)聲(sheng)的(de)(de)(de)UniGPT,就(jiu)是希望優先提升(sheng)行業應(ying)用(yong)中的(de)(de)(de)可控性和可解釋性,把大模(mo)型調教(jiao)到(dao)真正能解決(jue)行業問題的(de)(de)(de)程度(du),甚(shen)至(zhi)可以自動化完成,這樣(yang)未來滲透到(dao)其他各種(zhong)業務的(de)(de)(de)應(ying)用(yong)中,效率就(jiu)會高(gao)很多。
彭昭:現在(zai)好多人(ren)紛紛創業(ye)做(zuo)(zuo)大模(mo)型,請問(wen)云知聲的大模(mo)型和其他人(ren)創業(ye)做(zuo)(zuo)的大模(mo)型相比(bi),優勢在(zai)哪(na)里?
梁家恩(en):從技術(shu)(shu)(shu)原理角度來(lai)(lai)說,沒有(you)任何區別,我覺得現在做(zuo)大(da)模型的(de)無非(fei)是(shi)三類公(gong)司,一類就(jiu)是(shi)巨頭企業(ye),像微(wei)軟(ruan)、Google、百度等(deng),他(ta)(ta)們(men)都在做(zuo)這事,因為(wei)這對(dui)他(ta)(ta)們(men)主營業(ye)務來(lai)(lai)說確實(shi)太(tai)具顛覆性;第二類公(gong)司是(shi)以(yi)技術(shu)(shu)(shu)為(wei)核心的(de),包括云知聲、科大(da)訊飛和視(shi)覺四小龍等(deng)企業(ye),需要(yao)和行業(ye)玩家結合去做(zuo),大(da)家比的(de)就(jiu)是(shi)在不同的(de)行業(ye)里(li)誰能真(zhen)正有(you)效地解(jie)決問題(ti),畢竟(jing)只有(you)解(jie)決問題(ti)才(cai)能產生價值;第三類就(jiu)是(shi)從純學(xue)術(shu)(shu)(shu)屆出來(lai)(lai)新創(chuang)業(ye)的(de)公(gong)司,他(ta)(ta)們(men)的(de)挑戰更大(da)的(de)還是(shi)在工程上以(yi)及對(dui)行業(ye)應用(yong)的(de)理解(jie)上面(mian),與實(shi)際(ji)是(shi)會有(you)比較大(da)的(de)鴻溝(gou)。
對于(yu)巨頭企業(ye)(ye)來(lai)說(shuo),他們肯定是(shi)優先朝著更加通用的方向發展,守住自己的主業(ye)(ye),再逐步進入到垂(chui)直領域,但是(shi)其實我(wo)們并不(bu)懼怕任何巨頭團(tuan)隊(dui),我(wo)們很多標桿(gan)客戶都是(shi)這樣競爭(zheng)獲得的,因為必須先要(yao)守住各(ge)自的主營業(ye)(ye)務(wu),這才是(shi)第(di)一(yi)要(yao)務(wu)。