国产人妻精品区一区二区,国产农村妇女毛片精品久久,JAPANESE日本丰满少妇,日本公妇理伦a片,射精专区一区二区朝鲜

對話云知聲創始人梁家恩:大模型要在務實解決行業問題中演進!
作者 | 數字原生組織2023-04-25

近日,云知聲創始人梁(liang)家恩博(bo)士與智次(ci)方進行了(le)深(shen)度對話(hua),本(ben)文摘取了(le)兩(liang)位(wei)大咖對話(hua)中的部分精華內容。

當前,人工智能技術的發(fa)展已(yi)經(jing)進(jin)入了新(xin)拐點(dian),AI技術范(fan)式正從過去的“預訓(xun)練模(mo)(mo)型-特(te)定任(ren)務精調”向(xiang)“基礎模(mo)(mo)型-應用(yong)反(fan)饋學習(xi)”變遷,這種遷移也必然(ran)創造(zao)更多(duo)應用(yong)可(ke)能(neng),各(ge)行各(ge)業(ye)(ye)也在紛(fen)紛(fen)探(tan)索(suo)AI新(xin)范(fan)式,包括通用(yong)大(da)模(mo)(mo)型演進(jin)和利用(yong)大(da)模(mo)(mo)型范(fan)式解(jie)決醫療、工業(ye)(ye)、辦公等場(chang)景問題,新(xin)產品也已(yi)經(jing)快(kuai)速融入各(ge)行各(ge)業(ye)(ye),不斷塑(su)造(zao)新(xin)業(ye)(ye)態(tai)、新(xin)場(chang)景,帶來巨大(da)的商業(ye)(ye)價值。

作為國內頂尖的語音人工智能獨角獸企業,云知聲十年來構建了以語音、語言和知識圖譜為核心,涵蓋感知、認知與生成的全棧AI技術體系,并向多模態人工智能方向拓展。對于云知聲而言,已經把ChatGPT技術升級作為公司AGI能力構建的新起點,并優先解決在智慧物聯和智慧醫療領域的應用問題。

近期,云知聲創始人、董事長兼CTO梁家恩博士與智次方·物聯網智庫創始(shi)人彭昭聊了聊大模型在不同場景中的應用(yong)。

圖片

從鑒別式AI到生成式AI的轉變

彭昭:過(guo)去十年是(shi)鑒(jian)別式(shi)(shi)(shi)AI為(wei)主流,未來十年則是(shi)生成式(shi)(shi)(shi)AI的天下,眾(zhong)所周知(zhi),生成式(shi)(shi)(shi)AI對于數據、算法、算力這三個方面都(dou)提出了(le)更高的要求(qiu),請問云知(zhi)聲在這三方面都(dou)做了(le)怎樣的準備和布局?

梁家恩:生成(cheng)式(shi)(shi)AI其(qi)實和過去(qu)的(de)(de)(de)鑒(jian)別(bie)式(shi)(shi)AI,在核心算法框架(jia)上來說差別(bie)并沒有(you)那么大(da),鑒(jian)別(bie)式(shi)(shi)AI主(zhu)要研究的(de)(de)(de)是數(shu)據(ju)分(fen)布(bu),根據(ju)數(shu)據(ju)分(fen)布(bu)來區分(fen)不同(tong)的(de)(de)(de)類型(xing),而生成(cheng)式(shi)(shi)AI,則是在數(shu)據(ju)分(fen)布(bu)做(zuo)建模(mo)的(de)(de)(de)基礎之上,還要去(qu)研究數(shu)據(ju)的(de)(de)(de)生成(cheng)結(jie)構,特別(bie)是現在跟自然語言結(jie)合在一(yi)起以后,就可以用自然語言的(de)(de)(de)方式(shi)(shi)去(qu)靈活(huo)控(kong)制它的(de)(de)(de)生成(cheng)的(de)(de)(de)結(jie)果。

在人工智能領(ling)域,數(shu)據、算力(li)(li)和(he)(he)算法早已成(cheng)(cheng)為不可缺少的(de)“三(san)駕馬車”,對于(yu)云(yun)(yun)知聲來說,實(shi)際(ji)上我(wo)(wo)們(men)在2012年成(cheng)(cheng)立時就已經(jing)開始布(bu)局這三(san)方(fang)面(mian)(mian),也(ye)是把(ba)深度學習(xi)最(zui)早用(yong)到(dao)產(chan)業界里(li)的(de)公司之一。在數(shu)據方(fang)面(mian)(mian),云(yun)(yun)知聲構建了一個(ge)云(yun)(yun)平(ping)臺(tai)來匯(hui)集(ji)數(shu)據;在算力(li)(li)方(fang)面(mian)(mian),早期公司就布(bu)局了GPU集(ji)群,但(dan)規(gui)模(mo)并(bing)不算大,在2016年的(de)時候,我(wo)(wo)們(men)開始把(ba)GPU集(ji)群升級為Atlas大規(gui)模(mo)機器學習(xi)超(chao)算平(ping)臺(tai),為未(wei)來同時調度上千塊GPU做(zuo)大模(mo)型做(zuo)了很(hen)好(hao)的(de)準備(bei);在算法方(fang)面(mian)(mian),現在語(yu)音、歌唱和(he)(he)虛擬人合成(cheng)(cheng)技術已經(jing)比(bi)較(jiao)成(cheng)(cheng)熟,云(yun)(yun)知聲在這方(fang)面(mian)(mian)的(de)技術儲備(bei)也(ye)很(hen)充(chong)分,未(wei)來還需要(yao)在多模(mo)態(tai)領(ling)域延伸,比(bi)如圖(tu)像(xiang)和(he)(he)視(shi)頻的(de)生成(cheng)(cheng)。多模(mo)態(tai)生成(cheng)(cheng)目(mu)前也(ye)都是通過自然語(yu)言(yan)來銜接在一起(qi)的(de),需要(yao)繼續(xu)增加算力(li)(li)和(he)(he)數(shu)據,并(bing)結合應用(yong)場景進行拓展。

彭(peng)昭:ChatGPT背(bei)后使用的(de)(de)(de)是(shi)數年前(qian)的(de)(de)(de)Transformer架(jia)構,但依然取得了驚(jing)人的(de)(de)(de)效果,這在某種(zhong)程(cheng)度上(shang)說明AI的(de)(de)(de)演(yan)進已經從以算法為(wei)中(zhong)心逐步變(bian)為(wei)以數據為(wei)中(zhong)心,您覺(jue)得MaaS這種(zhong)模式會(hui)(hui)成為(wei)AIGC時(shi)代的(de)(de)(de)主(zhu)流(liu)嗎?未來(lai)還會(hui)(hui)如何演(yan)變(bian)?

梁家恩:在(zai)(zai)科技圈之(zhi)外,Transformer的(de)(de)(de)(de)強(qiang)大(da)(da)是(shi)(shi)在(zai)(zai)ChatGPT出現之(zhi)后(hou)才(cai)被大(da)(da)眾才(cai)看(kan)到(dao)。其(qi)實(shi)在(zai)(zai)它剛剛出現之(zhi)后(hou),GPT就(jiu)已經用到(dao)了Transformer架構,雖然幾個(ge)月之(zhi)后(hou)就(jiu)被Google推出的(de)(de)(de)(de)BERT模型打敗,但BERT本身也用到(dao)了Transformer架構。過(guo)去(qu),用傳統的(de)(de)(de)(de)方法(fa)來(lai)處理語言(yan)問題(ti)(ti)是(shi)(shi)非(fei)常(chang)困(kun)難的(de)(de)(de)(de),因為語言(yan)是(shi)(shi)個(ge)離散符(fu)號處理問題(ti)(ti),要做(zuo)詞(ci)法(fa)分析、句(ju)法(fa)分析等(deng)任(ren)務(wu)非(fei)常(chang)麻煩,直(zhi)到(dao)通(tong)過(guo)深度(du)學習轉化為詞(ci)向量表示才(cai)有(you)實(shi)質性突破。有(you)了Transformer架構以(yi)后(hou),利(li)用它的(de)(de)(de)(de)自(zi)注(zhu)意(yi)(yi)力(self-attention)機制,只(zhi)要訓練的(de)(de)(de)(de)數據量足夠(gou)(gou)大(da)(da),就(jiu)可(ke)(ke)以(yi)把序(xu)列映射問題(ti)(ti)做(zuo)到(dao)足夠(gou)(gou)好(hao)。當時(shi),這(zhe)(zhe)篇論文的(de)(de)(de)(de)標題(ti)(ti)取的(de)(de)(de)(de)也非(fei)常(chang)“囂(xiao)張”,叫“Attention is all you need”,意(yi)(yi)思(si)是(shi)(shi)只(zhi)要用自(zi)注(zhu)意(yi)(yi)力機制就(jiu)可(ke)(ke)以(yi)搞定所有(you)問題(ti)(ti),結果(guo)它確實(shi)在(zai)(zai)機器(qi)翻譯上取得了非(fei)常(chang)大(da)(da)的(de)(de)(de)(de)突破。后(hou)來(lai),業界就(jiu)用這(zhe)(zhe)個(ge)框架去(qu)解(jie)(jie)決很(hen)多語義(yi)理解(jie)(jie)的(de)(de)(de)(de)問題(ti)(ti),確實(shi)都有(you)很(hen)大(da)(da)的(de)(de)(de)(de)提升,這(zhe)(zhe)在(zai)(zai)過(guo)去(qu)是(shi)(shi)不可(ke)(ke)想(xiang)象的(de)(de)(de)(de)。不過(guo),這(zhe)(zhe)些都是(shi)(shi)普通(tong)用戶(hu)感(gan)覺不到(dao)的(de)(de)(de)(de),用戶(hu)真正能夠(gou)(gou)感(gan)覺到(dao)的(de)(de)(de)(de)是(shi)(shi)模型在(zai)(zai)理解(jie)(jie)之(zhi)外,生(sheng)成的(de)(de)(de)(de)應(ying)答效果(guo)如何。

而ChatGPT的回應超出(chu)了(le)用戶(hu)的預期,大(da)家才覺得終于比過去看到(dao)的對話機器人的智商有了(le)質的突破,但(dan)其(qi)實(shi)技術在這(zhe)些年(nian)里一直都有突破和進展(zhan),只(zhi)不過是現(xian)在的應用形式讓(rang)大(da)家突然(ran)感(gan)覺到(dao)進展(zhan)確實(shi)非常大(da)。

剛才說到“以(yi)算法為(wei)中(zhong)心(xin)轉向以(yi)數(shu)據(ju)為(wei)中(zhong)心(xin)”的(de)(de)趨勢(shi)是非常明確的(de)(de),因為(wei)在框架統一之(zhi)后,模(mo)型的(de)(de)性能就取決于究(jiu)竟給(gei)什么樣的(de)(de)數(shu)據(ju)去(qu)訓練(lian),數(shu)據(ju)就決定了(le)模(mo)型性能的(de)(de)上限(xian),數(shu)據(ju)質量(liang)越(yue)(yue)高、規模(mo)越(yue)(yue)大,往往模(mo)型效(xiao)果就越(yue)(yue)好(hao)。

未來(lai),我認為(wei)Maas的模式(shi)(shi)會成為(wei)大趨勢。過去,要處理(li)(li)相對復雜(za)業(ye)務,都需(xu)要根據業(ye)務流程(cheng)來(lai)編程(cheng)解(jie)(jie)(jie)決,但(dan)現在就可(ke)(ke)以通(tong)過自(zi)然語言接口來(lai)處理(li)(li)這(zhe)些任務,在這(zhe)種情況下就可(ke)(ke)以用模型(xing)優化代替流程(cheng)編碼來(lai)直接解(jie)(jie)(jie)決各(ge)種問題,只需(xu)要收(shou)集這(zhe)個領域(yu)和應用的數(shu)據去訓練即可(ke)(ke),而不需(xu)要自(zi)己編程(cheng)來(lai)解(jie)(jie)(jie)決,這(zhe)是(shi)模型(xing)處理(li)(li)業(ye)務和編程(cheng)處理(li)(li)業(ye)務方式(shi)(shi)的本(ben)質區別(bie)。

大模型要更加注重數據安全

彭昭(zhao):如(ru)果(guo)轉變為(wei)Maas的模式,如(ru)何判(pan)斷(duan)各種模型的好壞呢(ni)?

梁家恩:其(qi)實(shi)最(zui)終(zhong)都要從(cong)結果來評判(pan)的(de)(de),ChatGPT比較好的(de)(de)一點就在(zai)(zai)于它(ta)其(qi)實(shi)在(zai)(zai)隱藏了中間的(de)(de)理(li)(li)解問(wen)題,用戶(hu)不需(xu)要關心模(mo)型(xing)中間的(de)(de)“意(yi)圖理(li)(li)解”環節(jie),也不需(xu)要顯式(shi)做(zuo)句法(fa)分析、語義理(li)(li)解等動作(zuo),只(zhi)要看(kan)(kan)看(kan)(kan)ChatGPT最(zui)終(zhong)給用戶(hu)的(de)(de)反饋質量(liang)如何就可以(yi)。就像圖靈測(ce)試一樣(yang),只(zhi)要人類無(wu)法(fa)判(pan)斷是真人還是機器在(zai)(zai)回應,就是足夠智能。如果單獨處理(li)(li)“語義理(li)(li)解”任務,過(guo)去像BERT這種(zhong)模(mo)型(xing),要比GPT模(mo)型(xing)做(zuo)得更好,因為它(ta)使用了雙(shuang)向注(zhu)意(yi)力機制,但BERT架構沒法(fa)直接(jie)形成直觀的(de)(de)高質量(liang)回復(fu),所以(yi)讓非技術用戶(hu)感知到。

彭昭:如果以數據為中心的話(hua),掌握大量數據的企業(ye)會有很強的競爭優勢嗎?

梁(liang)家恩:不(bu)論(lun)是(shi)(shi)過(guo)去的(de)傳統(tong)算法,還(huan)是(shi)(shi)現(xian)在(zai)的(de)機(ji)器學(xue)習(xi)算法,數據都已經(jing)變(bian)得非常(chang)重(zhong)要(yao),很(hen)多公司本質上也(ye)已經(jing)變(bian)成了數據公司。只要(yao)有(you)很(hen)多的(de)數據沉淀下來,模型就(jiu)可以變(bian)得足夠(gou)聰明,只不(bu)過(guo)此前(qian)使用傳統(tong)的(de)統(tong)計學(xue)習(xi)方法去挖掘這種能(neng)力(li),而現(xian)在(zai)是(shi)(shi)用深度(du)(du)學(xue)習(xi)和(he)大模型的(de)方法去挖掘,精度(du)(du)和(he)能(neng)力(li)也(ye)就(jiu)越(yue)來越(yue)強。

彭昭(zhao):相比于其它(ta)行業(ye)來說,醫療(liao)領域對安(an)全的要求(qiu)更高甚至(zhi)不容出錯,云(yun)知聲是如何在醫療(liao)行業(ye)大(da)模型中滿足近乎嚴苛的要求(qiu),從(cong)而讓模型輸出的結果更專業(ye)、更可信的?

梁家(jia)恩:云知(zhi)聲之(zhi)所以把醫(yi)(yi)療作為一個(ge)主要方向,是因為醫(yi)(yi)療行(xing)業的知(zhi)識(shi)密集程度非(fei)常高(gao),如果在醫(yi)(yi)療領域的問(wen)題都(dou)能夠處理好(hao),相信很多其(qi)他行(xing)業也都(dou)能搞定,這(zhe)對我們(men)來說是一個(ge)技術的制高(gao)點(dian),所以需要攻克(ke)它(ta)。另(ling)外,醫(yi)(yi)療行(xing)業的應(ying)用場景、應(ying)用空間包括社會價值也都(dou)很大。

在(zai)數(shu)據(ju)安(an)全性方面,特(te)別是有些涉及到用(yong)戶的(de)(de)(de)(de)隱(yin)私數(shu)據(ju),要求都(dou)是很高的(de)(de)(de)(de),最(zui)難(nan)的(de)(de)(de)(de)就是真實(shi)的(de)(de)(de)(de)用(yong)戶治療案例(li),都(dou)必須經過(guo)數(shu)據(ju)的(de)(de)(de)(de)脫敏(min)處理。另外,在(zai)我們和(he)醫院的(de)(de)(de)(de)合(he)作過(guo)程中,也會把數(shu)據(ju)做(zuo)相應(ying)的(de)(de)(de)(de)加密和(he)tokenization,即(ji)把數(shu)據(ju)符號(hao)化(hua),只有機(ji)器能夠(gou)知(zhi)道解(jie)碼后的(de)(de)(de)(de)含義(yi)。在(zai)算法方面,現(xian)在(zai)的(de)(de)(de)(de)聯邦學習也可以(yi)把各種特(te)征融(rong)合(he)后再去計算,使(shi)得不接觸初始敏(min)感信(xin)息(xi)的(de)(de)(de)(de)情況(kuang)下(xia),還可以(yi)繼(ji)續優化(hua)模型。

彭昭:OpenAI的CEO也在積極的做一(yi)些生(sheng)態投(tou)資的布局,云知聲會不會擔(dan)心OpenAI投(tou)資醫療賽道?

梁家恩(en):我(wo)(wo)覺(jue)得不論是教育還是醫療,這(zhe)些行業其實都事關國計(ji)民生,所(suo)以(yi)這(zhe)里面中國一定(ding)要(yao)有自己獨立的(de)(de)解決方(fang)案,如果(guo)他愿(yuan)意投(tou)資這(zhe)方(fang)面的(de)(de)企業,在國內來看,我(wo)(wo)相信云知聲是很好的(de)(de)標的(de)(de)。過去我(wo)(wo)們已經(jing)有很多行業已經(jing)遭受到所(suo)謂卡脖(bo)子的(de)(de)問題,在這(zhe)個(ge)領域我(wo)(wo)們肯定(ding)不會讓它(ta)成為一個(ge)新的(de)(de)卡脖(bo)子問題。

彭昭:云知聲(sheng)是以語(yu)音(yin)識別技術(shu)起(qi)家(jia)的(de)(de),從2012年(nian)至今積(ji)累了大(da)(da)量相關經驗,早期的(de)(de)這些技術(shu)積(ji)累對于云知聲(sheng)推出行業大(da)(da)模型有怎樣的(de)(de)幫助?

梁(liang)家(jia)恩:當(dang)時起(qi)“云知(zhi)聲”這個名字的(de)時候,我(wo)們就不(bu)僅僅停留在聲音(yin)領域了,聲音(yin)只是我(wo)們的(de)一個切入點,我(wo)們更希(xi)望有(you)(you)一個云端大(da)腦,有(you)(you)強大(da)的(de)認(ren)知(zhi)能力,能夠(gou)通(tong)過(guo)聲音(yin)的(de)交互去(qu)解決問(wen)題。

2012年(nian)時,我(wo)們開(kai)始(shi)(shi)布局(ju)“三駕馬車”,到2016年(nian)AlphaGo開(kai)始(shi)(shi)興起的(de)時候,我(wo)們就已(yi)經開(kai)始(shi)(shi)布局(ju)底層的(de)大規模(mo)(mo)計(ji)算(suan)能(neng)力,也(ye)就是Atlas超算(suan)平(ping)臺。在此之(zhi)上(shang)(shang),我(wo)們還拓展(zhan)了知(zhi)識(shi)圖(tu)譜和(he)認(ren)知(zhi)技術(shu)體系(xi),從(cong)而形成(cheng)一(yi)個(ge)(ge)全棧的(de)技術(shu)體系(xi)。現(xian)在拓展(zhan)到的(de)大模(mo)(mo)型對我(wo)們來說(shuo)只(zhi)是一(yi)個(ge)(ge)算(suan)法(fa)框架(jia)(jia)的(de)升級。類似過去用BERT主(zhu)要是解決判(pan)別(bie)式(shi)問題(ti)的(de),那現(xian)在就把它切換(huan)成(cheng)GPT的(de)生成(cheng)式(shi)框架(jia)(jia),而BERT實際上(shang)(shang)是Transformer的(de)編碼(ma)器(qi)部(bu)分,GPT則是Transformer的(de)解碼(ma)器(qi)部(bu)分,算(suan)法(fa)改(gai)變對我(wo)們沒(mei)有本質的(de)挑戰,我(wo)們也(ye)已(yi)經具備訓練大模(mo)(mo)型的(de)基礎架(jia)(jia)構。除了算(suan)法(fa)和(he)算(suan)力支撐,在行業問題(ti)認(ren)知(zhi)和(he)數(shu)據積累(lei)方面,也(ye)讓我(wo)們充滿信心。包括物聯網和(he)醫療領域(yu),我(wo)們理(li)解這些(xie)行業業務的(de)核心問題(ti),也(ye)有相(xiang)關的(de)數(shu)據積累(lei),我(wo)們是非常有信心能(neng)把這個(ge)(ge)大模(mo)(mo)型做好的(de)。

其實從ChatGPT的(de)算(suan)法(fa)原理來說,早就已經(jing)有(you)了(le), OpenAI最重要的(de)是率先(xian)把產品做了(le)出來,從而形成一(yi)個工程閉環。另(ling)外,大家對OpenAI的(de)容(rong)忍度是遠(yuan)遠(yuan)高(gao)于Google的(de),如果OpenAI之前犯(fan)的(de)那(nei)些錯誤Google同樣犯(fan)的(de)話,我估計后果是完全(quan)不(bu)(bu)一(yi)樣的(de),所以不(bu)(bu)能說OpenAI在技術上是一(yi)騎絕塵的(de),像Google內(nei)部也有(you)DeepMind在研究AGI,相關儲(chu)備(bei)也已經(jing)非(fei)常充足。

在過(guo)去算法、算力和數據積累(lei)基礎(chu)上(shang),對我們來(lai)說就(jiu)是把(ba)過(guo)去以BERT為(wei)核(he)心的技術架(jia)構(gou)升級成以ChatGPT為(wei)核(he)心的技術框架(jia),這樣的好處就(jiu)在于可以用生(sheng)成式AI把(ba)理解和生(sheng)成打通(tong),性能體驗、靈活性、擴展(zhan)性會(hui)強很多。

技術發展其實更符合對數曲線

彭(peng)昭(zhao):上(shang)周(zhou),OpenAI CEO表示誕(dan)生ChatGPT的研究(jiu)策略已經(jing)結(jie)束,繼續擴展(zhan)模型規模帶來的收(shou)益將(jiang)出現遞(di)減(jian)。您(nin)覺得(de)模型繼續向(xiang)參數(shu)量變(bian)大的方向(xiang)發(fa)展(zhan)還會持續多久,除了拼參數(shu)外,還有哪些發(fa)展(zhan)方向(xiang)?

梁家恩:大(da)家其(qi)實對于算(suan)法(fa)(fa)好像有一種不切實際的(de)(de)(de)(de)預(yu)期,覺得一個(ge)算(suan)法(fa)(fa)就(jiu)能(neng)解決所有問題,但不論是(shi)過去的(de)(de)(de)(de)統計學習、支持向量機(ji),還是(shi)現(xian)在(zai)的(de)(de)(de)(de)深(shen)度學習,事實都并(bing)非如此(ci),每(mei)種算(suan)法(fa)(fa)都有它自(zi)身的(de)(de)(de)(de)局限性,像OpenAI就(jiu)是(shi)把GPT框架的(de)(de)(de)(de)潛力挖掘到盡頭(tou),并(bing)不是(shi)說(shuo)競爭(zheng)已(yi)經(jing)結(jie)束了(le),而是(shi)按照他們的(de)(de)(de)(de)這種探(tan)索策(ce)(ce)略,再繼續(xu)加大(da)投入(ru)可能(neng)已(yi)經(jing)沒有太大(da)收益。因此(ci),需要尋找一些新的(de)(de)(de)(de)策(ce)(ce)略、新的(de)(de)(de)(de)方法(fa)(fa),在(zai)這個(ge)基礎上去探(tan)索,而不是(shi)說(shuo)這個(ge)游戲(xi)已(yi)經(jing)結(jie)束了(le)。

另外,單純擴(kuo)大(da)模型規模也有它的(de)局限性,對(dui)于(yu)技術外行來說,大(da)都希望(wang)技術進步是一條(tiao)“指數(shu)曲線”,但(dan)它其實是一條(tiao)“對(dui)數(shu)曲線”,繼續擴(kuo)大(da)規模到(dao)一定程度后,進步的(de)幅(fu)度就會平(ping)緩很(hen)多,通過嘗試新(xin)的(de)方(fang)法(fa)可能(neng)再(zai)做出第二個對(dui)數(shu)曲線出來。

當然(ran)(ran)對于(yu)國(guo)內的(de)(de)企業來說,和OpenAI還(huan)是(shi)(shi)有(you)差距的(de)(de),那我們首先(xian)需要先(xian)做到(dao)現(xian)在GPT-3.5 或者GPT-4的(de)(de)水平,然(ran)(ran)后再繼續往(wang)前走,我覺得后面還(huan)有(you)持(chi)續的(de)(de)工作要做,畢竟純(chun)靠參數量級的(de)(de)擴大,哪怕是(shi)(shi)做到(dao)人腦(nao)神經元的(de)(de)連接(jie)數量,也不是(shi)(shi)完全復制(zhi)了一個人,還(huan)有(you)其他(ta)的(de)(de)技術瓶(ping)頸(jing)需要突破(po)。

彭(peng)昭:關于云知聲將要(yao)推(tui)出的UniGPT大模型,能否簡單透露一些信息?

梁(liang)家恩:其(qi)實去年我們(men)看(kan)到ChatGPT出(chu)來后(hou),就覺得這確(que)實是一個顛覆(fu)性(xing)(xing)的(de)(de)工作(zuo)。其(qi)實GPT-3就已經有很(hen)(hen)多新奇特性(xing)(xing),但(dan)當時大家覺得它(ta)的(de)(de)可控性(xing)(xing)很(hen)(hen)差,可能(neng)無法(fa)駕馭(yu)好這種能(neng)力,直(zhi)到ChatGPT展示出(chu)很(hen)(hen)好效果,才引起(qi)行業內外的(de)(de)高度(du)關注。深度(du)學習(xi)到今天為止,最核心的(de)(de)一個問題(ti)也還是可解釋性(xing)(xing)和可控性(xing)(xing)不足。

而(er)大模型(xing)所謂的“思維鏈”能力(li),可以告訴用戶推導(dao)的過程,從而(er)知(zhi)道中間過程里有哪些東西是(shi)錯的,優化(hua)的時候就可以獲得提示了,而(er)不是(shi)像過去一(yi)樣只能看見和調整參數(shu)的權(quan)重。此外,還有一(yi)個比較早期的AutoGPT研(yan)究方向,但我覺得非常(chang)有潛力(li),就是(shi)用大模型(xing)來把大模型(xing)用好,形(xing)成AI for AI,未來的空間也會很大。

云知聲的UniGPT,就(jiu)是希望(wang)優先提升行業應(ying)用中的可(ke)控(kong)性(xing)和可(ke)解釋性(xing),把大模型調(diao)教到真正能解決行業問題的程度,甚至(zhi)可(ke)以(yi)自(zi)動化完成,這樣未來滲(shen)透(tou)到其他各種(zhong)業務的應(ying)用中,效率就(jiu)會高很多。

彭昭:現在(zai)好多人紛紛創業(ye)做(zuo)大(da)模型(xing)(xing),請(qing)問云知聲(sheng)的(de)大(da)模型(xing)(xing)和其他人創業(ye)做(zuo)的(de)大(da)模型(xing)(xing)相比,優勢在(zai)哪里?

梁(liang)家恩:從技(ji)術原(yuan)理(li)角度來說(shuo),沒(mei)有(you)(you)任何區(qu)別,我覺得現在做大(da)(da)模型的(de)無非是(shi)(shi)三類公(gong)司,一類就是(shi)(shi)巨頭企業(ye),像微軟、Google、百度等(deng),他們(men)都(dou)在做這事,因為(wei)這對他們(men)主營業(ye)務來說(shuo)確實(shi)太(tai)具顛覆性;第二類公(gong)司是(shi)(shi)以技(ji)術為(wei)核心的(de),包(bao)括云(yun)知聲、科大(da)(da)訊飛和(he)視覺四小(xiao)龍等(deng)企業(ye),需要和(he)行業(ye)玩(wan)家結合去做,大(da)(da)家比(bi)的(de)就是(shi)(shi)在不同的(de)行業(ye)里誰能真正(zheng)有(you)(you)效地解(jie)決問題,畢竟只(zhi)有(you)(you)解(jie)決問題才能產生價值;第三類就是(shi)(shi)從純學術屆出(chu)來新創(chuang)業(ye)的(de)公(gong)司,他們(men)的(de)挑(tiao)戰更(geng)大(da)(da)的(de)還是(shi)(shi)在工程上以及對行業(ye)應用的(de)理(li)解(jie)上面,與實(shi)際是(shi)(shi)會有(you)(you)比(bi)較大(da)(da)的(de)鴻溝。

對于巨頭企業(ye)(ye)來(lai)說,他們(men)肯(ken)定是(shi)(shi)優先朝(chao)著更加通用的(de)方向發展,守住(zhu)自己的(de)主業(ye)(ye),再逐步進(jin)入到垂直(zhi)領域,但是(shi)(shi)其實我(wo)們(men)并不懼怕任何巨頭團隊,我(wo)們(men)很多標桿客(ke)戶都是(shi)(shi)這樣競(jing)爭獲得的(de),因(yin)為必須(xu)先要守住(zhu)各(ge)自的(de)主營業(ye)(ye)務(wu),這才是(shi)(shi)第一要務(wu)。

熱門文章
“格物致知,叩問蒼穹”。4月24日,“中國航天日”啟動儀式在安徽省合肥市舉行。當天,低軌衛星物聯網星座系統服務領先企業國電高科宣布:天啟星座合肥總部正式簽約落地。這意味著我國首個低軌衛星物聯網星座正邁
2023-04-25
X