5月6日,在(zai)安徽合肥濱(bin)湖國(guo)際會展中(zhong)心召開的訊飛星火(huo)認(ren)知大模型成果發布(bu)會上,劉慶峰詳細(xi)介紹(shao)了科大訊飛認(ren)知大模型“1+N”的能力,“1”是通(tong)用的認(ren)知智能大模型,“N”則是大模型在(zai)各個(ge)領域的落地(di),包(bao)括了教育、辦公、汽車、數字(zi)員(yuan)工四(si)大領域。
此前,在4月(yue)20日(ri)晚間的(de)(de)(de)投(tou)資者交流(liu)會上,科大訊(xun)飛董事長劉慶峰宣(xuan)布(bu),將原(yuan)本(ben)計劃(hua)在四季度發(fa)布(bu)的(de)(de)(de)訊(xun)飛星火認知大模型,提前到(dao)5月(yue)6日(ri)(今日(ri))發(fa)布(bu)。這(zhe)一次看似(si)不(bu)經意(yi)的(de)(de)(de)調整,實際上卻反映了其(qi)早已被(bei)險象環(huan)生的(de)(de)(de)外(wai)部環(huan)境逼(bi)到(dao)的(de)(de)(de)背(bei)水一戰(zhan)的(de)(de)(de)地步。
去年11月,驚艷(yan)亮相的ChatGPT可(ke)以說著實打(da)了全球所有AI公司一(yi)個措手(shou)不(bu)及,國內AI企業更是像(xiang)被“趕鴨子上架”一(yi)樣拉到了臺前,百度“文心一(yi)言”、阿里“通(tong)義千問”、360“智腦”、商湯“日日新”、昆侖萬維“天工”、達觀數據“曹(cao)植”、智源研究(jiu)院“悟道(dao)2.0”、復旦“MOSS”……一(yi)時間“萬家齊發”,很快(kuai)促成了如(ru)今的“百模大戰(zhan)”的名場面。
但(dan)有(you)ChatGPT珠(zhu)玉(yu)在(zai)前,國內亮相的(de)(de)大(da)模型雖(sui)然也(ye)盡力挖(wa)掘亮點,但(dan)總有(you)瓦片(pian)難當(dang)的(de)(de)感覺,無法讓(rang)人一下產(chan)生(sheng)與ChatGPT初(chu)次相遇時的(de)(de)“驚艷感”。因為大(da)模型僅僅憑借生(sheng)成式AI這一純粹的(de)(de)亮點來吊(diao)起外界的(de)(de)胃口顯(xian)然已經不夠了(le),如果不能(neng)夠實(shi)(shi)實(shi)(shi)在(zai)在(zai)看(kan)到對社會(hui)生(sheng)活生(sheng)產(chan)產(chan)生(sheng)的(de)(de)根本性、全面(mian)性的(de)(de)影(ying)響和重塑,也(ye)只不過是重復(fu)造(zao)車輪子罷了(le)。
今天,在安徽合肥濱湖國際會展中(zhong)心(xin)召開的訊(xun)(xun)飛(fei)(fei)星火認(ren)(ren)(ren)知(zhi)大(da)模型成果發(fa)布會上,劉(liu)慶峰(feng)給出了科(ke)大(da)訊(xun)(xun)飛(fei)(fei)的答案(an),同(tong)時(shi)也亮出科(ke)大(da)訊(xun)(xun)飛(fei)(fei)臨時(shi)起意調(diao)整(zheng)星火認(ren)(ren)(ren)知(zhi)大(da)模型發(fa)布時(shi)間的底氣。劉(liu)慶峰(feng)介紹了科(ke)大(da)訊(xun)(xun)飛(fei)(fei)認(ren)(ren)(ren)知(zhi)大(da)模型“1+N”的能(neng)力,“1”是通用的認(ren)(ren)(ren)知(zhi)智能(neng)大(da)模型,“N”則是大(da)模型在各個領域的落地,包(bao)括了教育、辦公、汽車、人機交互以及醫(yi)療等等。
除此之外,劉慶峰還宣布了,即日起科(ke)大訊飛在教育、辦公、汽(qi)車、數(shu)字(zi)員工四大領(ling)域的(de)硬件產品將基于訊飛火星大模型實現升級(ji),提(ti)供更加(jia)智能化的(de)語言理(li)解能力(li),提(ti)升用(yong)戶的(de)使用(yong)體驗。
星火大模型也可以喊“遙遙領先”
劉慶峰表示,當前通用人工智能最令人(ren)關注的有7個維(wei)度,分別是(shi)文(wen)本生(sheng)成(cheng)、語音(yin)理(li)解(jie)、知識問(wen)答、邏輯(ji)推理(li)、數學能力、代碼能力以(yi)(yi)及多(duo)模(mo)(mo)態能力,這7個方面能力的提(ti)升,可以(yi)(yi)讓通用大模(mo)(mo)型(xing)帶(dai)給人(ren)類(lei)生(sheng)活方式顛覆式的變革,產生(sheng)新的機遇(yu)。在會上(shang),劉(liu)慶峰(feng)聯手科大訊飛研究院院長劉(liu)聰,現場展示(shi)了(le)星(xing)火認知大模(mo)(mo)型(xing)這7大類(lei)核心能力。
在多風格多任務的本文(wen)生成(cheng)(cheng)能(neng)力(li)方(fang)面,它可(ke)以幫助(zhu)使用者撰寫發言稿(gao)、郵(you)件、新(xin)聞通稿(gao)、營銷方(fang)案等(deng)(deng)等(deng)(deng)。現場,劉聰使用星火認(ren)知(zhi)大(da)(da)(da)模(mo)(mo)型撰寫了(le)(le)一篇(pian)歡迎稿(gao),續(xu)寫了(le)(le)一段孫悟空(kong)與奧特(te)曼潛入今天會(hui)場后爭當星火認(ren)知(zhi)大(da)(da)(da)模(mo)(mo)型發言人的創意(yi)小故事,還嘗試編寫了(le)(le)郵(you)件和(he)品宣文(wen)案等(deng)(deng)等(deng)(deng)。從結果來(lai)看,星火大(da)(da)(da)模(mo)(mo)型出文(wen)速度(du)很快,且續(xu)寫故事增(zeng)添了(le)(le)更多新(xin)的元(yuan)素,比如在孫悟空(kong)和(he)奧特(te)曼之外,它還自主(zhu)編撰了(le)(le)一位(wei)神(shen)秘的老者。當然,依照老規矩(ju),如果不(bu)(bu)滿(man)意(yi)也能(neng)夠根據(ju)需要多次點(dian)擊,讓這(zhe)些文(wen)案生成(cheng)(cheng)不(bu)(bu)同的新(xin)版本。
另(ling)外,除(chu)了(le)中(zhong)文(wen)的(de)文(wen)本(ben)生成(cheng)能力之外,英文(wen)撰寫也(ye)不(bu)在話下。劉慶(qing)峰介紹,星火大模型從研發的(de)第一天就立足于多(duo)語種(zhong),因此中(zhong)英文(wen)是同步。他還(huan)透露(lu),在剛剛過去(qu)的(de)五一小(xiao)長假期間,科(ke)大訊飛的(de)翻譯機同期銷量增(zeng)長了(le)200%多(duo),幾乎(hu)成(cheng)了(le)出國必(bi)備(bei)的(de)神器(qi)。
當然,在這(zhe)(zhe)樣一(yi)個(ge)多元化(hua)的(de)(de)(de)世界里,文(wen)(wen)本格式并不是固定的(de)(de)(de)。現(xian)(xian)場,劉聰演示了文(wen)(wen)本生成的(de)(de)(de)多風格能力,比如(ru)生成小紅書風格的(de)(de)(de)文(wen)(wen)案,開口(kou)就是“小姐姐”也贏得(de)了現(xian)(xian)場觀眾的(de)(de)(de)拍(pai)手(shou)叫(jiao)絕。劉慶峰自豪的(de)(de)(de)說:“根據中(zhong)科院人工智能智能產業(ye)學院、創新聯盟(meng)以及(ji)長三角人工智能產業(ye)鏈細分任務(wu),在這(zhe)(zhe)些任務(wu)中(zhong),在目前已(yi)經推出的(de)(de)(de)認知大模(mo)型中(zhong),科大訊飛(fei)的(de)(de)(de)測試(shi)結果是明顯領先的(de)(de)(de),中(zhong)文(wen)(wen)水平已(yi)經超過了ChatGPT,英文(wen)(wen)如(ru)果以滿分5分來算,現(xian)(xian)在ChatGPT是4.48分, 我(wo)們已(yi)經達到了4.29分,已(yi)在快速的(de)(de)(de)進步之中(zhong)。”
在(zai)(zai)語(yu)(yu)言(yan)理解方面,星火大(da)模型在(zai)(zai)多(duo)層次跨語(yu)(yu)種的(de)語(yu)(yu)言(yan)理解方面具有較高的(de)水平,比如(ru)對(dui)英文(wen)單(dan)詞、語(yu)(yu)法(fa)、時態等檢(jian)查,最高級別能夠達到對(dui)情感(gan)的(de)分析。劉慶峰表示(shi),目前對(dui)英文(wen)的(de)語(yu)(yu)法(fa)句式(shi)以(yi)及(ji)關鍵單(dan)詞的(de)糾(jiu)錯能力,星火大(da)模型已經(jing)做到了業界(jie)最強,它不僅可以(yi)使(shi)用在(zai)(zai)訊飛的(de)學習產(chan)品中,甚至可以(yi)應用于(yu)商務及(ji)海(hai)外交流(liu)當中。
同樣在中(zhong)文方面,有(you)很多(duo)時候漢語的(de)造句通常是(shi)模棱兩可的(de),需要根據(ju)使(shi)用情(qing)(qing)景做出判斷。比如劉慶峰現(xian)場舉例,“小明拿到了冠軍,他默(mo)(mo)默(mo)(mo)地站(zhan)(zhan)了1分(fen)鐘”和“劉聰上課被老師批評,他默(mo)(mo)默(mo)(mo)地站(zhan)(zhan)了1分(fen)鐘”,同樣是(shi)針(zhen)對“默(mo)(mo)默(mo)(mo)地站(zhan)(zhan)了一分(fen)鐘”,星火(huo)大模型可以避免掉入機器“魚香肉絲”“紅燒獅子(zi)頭(tou)”這類表面文字的(de)陷阱中(zhong),從而(er)分(fen)析出前者(zhe)是(shi)高(gao)興(xing)自豪的(de)心(xin)情(qing)(qing),后者(zhe)是(shi)難(nan)過(guo)反思的(de)心(xin)情(qing)(qing)。
劉慶峰表示,語言理解將來是認知大(da)模(mo)型(xing)調用各(ge)種(zhong)插件和工具最(zui)核(he)心的(de)一項(xiang)(xiang)能力,根據測評,科大(da)訊(xun)飛在(zai)481項(xiang)(xiang)測試(shi)維(wei)度中有(you)119項(xiang)(xiang)詳細任務跟語言理解有(you)關。雖(sui)然與(yu)CahtGPT相比尚有(you)細微(wei)差距(ju),但在(zai)國內(nei),星火大(da)模(mo)型(xing)在(zai)國內(nei)可測的(de)現有(you)系統中是遙遙領先的(de)!
在知(zhi)識問答(da)方面,現場星(xing)火大模型能(neng)夠快速回答(da)關(guan)于生(sheng)(sheng)活、科學(xue)(xue)、常識、醫學(xue)(xue)甚至(zhi)是(shi)(shi)“玄學(xue)(xue)”等多個領域的(de)知(zhi)識,比(bi)如在向(xiang)其(qi)詢問了(le)“量子科學(xue)(xue)的(de)產業應(ying)用(yong)涵蓋(gai)了(le)哪些領域”后(hou),劉慶峰又接著問到“量子糾纏和心靈感應(ying)是(shi)(shi)不是(shi)(shi)一(yi)(yi)回事”這一(yi)(yi)被劉聰調侃為“玄學(xue)(xue)”的(de)問題。出乎意料的(de)是(shi)(shi)星(xing)火大模型并沒有像此前多個大模型一(yi)(yi)樣發(fa)生(sheng)(sheng)翻(fan)車現象,不僅沒有瞎編亂造答(da)案,甚至(zhi)還給出了(le)“兩(liang)者是(shi)(shi)完全(quan)不同的(de)概(gai)念”的(de)標準答(da)案。
劉(liu)慶峰介紹(shao),星火(huo)大(da)模(mo)(mo)型給出(chu)這些答案,是基于中(zhong)(zhong)國科學(xue)院的(de)支持,通(tong)(tong)(tong)過大(da)量的(de)科技文(wen)獻中(zhong)(zhong)不斷訓練的(de)結果。目前還(huan)有(you)很多問題還(huan)在研究中(zhong)(zhong),未(wei)來它(ta)不僅會根據歷史問題給出(chu)答復,甚(shen)至還(huan)會對未(wei)來的(de)展望給出(chu)使用(yong)者建設(she)性的(de)意見。比如在醫(yi)(yi)(yi)學(xue)方面(mian),通(tong)(tong)(tong)過與(yu)醫(yi)(yi)(yi)療(liao)(liao)機構(gou)的(de)合(he)(he)作(zuo),星火(huo)大(da)模(mo)(mo)型未(wei)來會變成個人的(de)智(zhi)能(neng)醫(yi)(yi)(yi)療(liao)(liao)助理。目前,科大(da)訊(xun)飛只(zhi)啟用(yong)了(le)訊(xun)飛醫(yi)(yi)(yi)療(liao)(liao)專(zhuan)業系統(tong)中(zhong)(zhong)的(de)部分醫(yi)(yi)(yi)療(liao)(liao)大(da)模(mo)(mo)型,原(yuan)因(yin)是醫(yi)(yi)(yi)療(liao)(liao)需要更加嚴謹對待,同時(shi)要符合(he)(he)相關(guan)的(de)法規,未(wei)來這些專(zhuan)業的(de)能(neng)力將通(tong)(tong)(tong)過與(yu)醫(yi)(yi)(yi)療(liao)(liao)機構(gou)的(de)合(he)(he)作(zuo)逐(zhu)漸釋放到通(tong)(tong)(tong)用(yong)大(da)模(mo)(mo)型中(zhong)(zhong)。
在邏輯(ji)推(tui)理方面,星火(huo)大(da)模(mo)(mo)型(xing)(xing)也得(de)(de)到(dao)了(le)大(da)幅(fu)度的(de)(de)(de)(de)提(ti)升,比(bi)如(ru)之前大(da)家會(hui)(hui)在給AI提(ti)問(wen)(wen)的(de)(de)(de)(de)過(guo)程中挖坑(keng),比(bi)如(ru)問(wen)(wen)“孔(kong)子(zi)在2008年奧(ao)(ao)運會(hui)(hui)上給大(da)家做漢(han)語(yu)培訓的(de)(de)(de)(de)故(gu)事”,星火(huo)大(da)模(mo)(mo)型(xing)(xing)可(ke)以機智應答(da)孔(kong)子(zi)不(bu)可(ke)能出現在08年奧(ao)(ao)運會(hui)(hui)上,這其中不(bu)僅是邏輯(ji)推(tui)理,同時也在常識上再次考驗了(le)大(da)模(mo)(mo)型(xing)(xing)的(de)(de)(de)(de)理解能力。另外(wai)對(dui)于雞(ji)兔(tu)同籠(long)幾(ji)只腳等數學(xue)游戲,星火(huo)大(da)模(mo)(mo)型(xing)(xing)也是手拿把掐,甚(shen)至(zhi)還可(ke)以頭(tou)頭(tou)是道(dao)的(de)(de)(de)(de)分(fen)析與實際應用相結合(he)的(de)(de)(de)(de)數學(xue)問(wen)(wen)題(ti),比(bi)如(ru)“一(yi)只股票昨(zuo)天漲10%,今天虧(kui)了(le)10%,結果持股人虧(kui)了(le)還是賺了(le)”,星火(huo)大(da)模(mo)(mo)型(xing)(xing)可(ke)以通過(guo)計算得(de)(de)出虧(kui)損(sun)的(de)(de)(de)(de)正確答(da)案。
在代(dai)碼能(neng)(neng)力(li)方面,星火(huo)大模(mo)型(xing)不(bu)僅可以生成代(dai)碼,還可以修改、理解、編譯代(dai)碼,并且多語言能(neng)(neng)力(li)也(ye)讓其精通了Python、Java等多種能(neng)(neng)力(li)。不(bu)過劉慶峰(feng)表示,星火(huo)大模(mo)型(xing)的(de)(de)代(dai)碼能(neng)(neng)力(li)目前還在起步中,預計(ji)在未來兩三個(ge)月會(hui)有一個(ge)非常大的(de)(de)提升(sheng)。按照科大訊(xun)飛內部(bu)的(de)(de)星火(huo)大模(mo)型(xing)演進歷程,將會(hui)在8月15日左右(you)實現代(dai)碼能(neng)(neng)力(li)登上一個(ge)新(xin)臺(tai)階。
最后是在(zai)(zai)多(duo)模(mo)態(tai)領(ling)域,劉慶(qing)峰表示(shi),相比ChatGPT最初只能(neng)夠使(shi)用文本(ben)對(dui)話的(de)(de)(de)(de)(de)形式,目(mu)前(qian)對(dui)在(zai)(zai)大(da)模(mo)型上(shang)使(shi)用更(geng)豐(feng)(feng)富的(de)(de)(de)(de)(de)形態(tai)去輸入(ru)(ru),用更(geng)豐(feng)(feng)富的(de)(de)(de)(de)(de)方式去表達已經成為(wei)關注的(de)(de)(de)(de)(de)重(zhong)點之一。在(zai)(zai)今天的(de)(de)(de)(de)(de)所(suo)有現場演示(shi)當中,劉聰與星(xing)火大(da)模(mo)型的(de)(de)(de)(de)(de)對(dui)話就全部(bu)通過語(yu)音實現,并(bing)且(qie)識(shi)別的(de)(de)(de)(de)(de)準確率保持(chi)在(zai)(zai)較(jiao)高的(de)(de)(de)(de)(de)水準。除此之外(wai),劉聰還演示(shi)了圖片輸入(ru)(ru),比如輸出一張英文菜(cai)單,讓其翻(fan)譯為(wei)中文。不僅如此,還能(neng)根據翻(fan)譯結果詢(xun)問每(mei)道(dao)菜(cai)的(de)(de)(de)(de)(de)味道(dao)、國家(jia)/地區等(deng)信息。當然(ran),目(mu)前(qian)支(zhi)持(chi)圖片識(shi)別的(de)(de)(de)(de)(de)Pro版本(ben)還處于研發內測(ce)當中,未來(lai)會全部(bu)開放。
除了多種方式輸入之外,星(xing)火大模(mo)型在輸出上也相交(jiao)有了進步,比如(ru)可以(yi)(yi)人生朗(lang)讀,還可以(yi)(yi)一鍵生成虛擬(ni)數(shu)字人,展現了更(geng)加豐富的信息交(jiao)互(hu)方式。
觸類旁通,顛覆行業應用
劉慶峰在(zai)發布會上表(biao)(biao)示,“認知大模型(xing)通(tong)過多種類(lei)型(xing)的數據去學習和(he)訓練,最終在(zai)通(tong)用領(ling)(ling)域(yu)(yu)給(gei)了(le)大家非(fei)常(chang)驚喜的表(biao)(biao)現,但(dan)關(guan)鍵的問題在(zai)于,它(ta)還會像(xiang)我們人類(lei)一樣觸類(lei)旁(pang)通(tong),在(zai)更多的領(ling)(ling)域(yu)(yu)實現智慧的涌現。”而除了(le)以(yi)上按照7個維度展(zhan)現的星(xing)火大模型(xing)的通(tong)用能(neng)(neng)力之外,科(ke)大訊飛也現場宣布將率先在(zai)教(jiao)育、辦公、汽車和(he)數字員(yuan)工(gong)四個領(ling)(ling)域(yu)(yu)集成人工(gong)智能(neng)(neng)技術,發布相(xiang)關(guan)產品級的產品。
在教育領域
劉慶峰介(jie)紹,過去的幾年時間里已經證明了(le)科大(da)訊(xun)飛在(zai)(zai)教(jiao)育(yu)行業的成功,實現在(zai)(zai)5萬多所(suo)中小學、多個(ge)(ge)國家智慧教(jiao)育(yu)示范區和先(xian)進教(jiao)育(yu)試驗(yan)區應用(yong),今天(tian)星火大(da)模型將再次升級語(yu)言(yan)(yan)學習的能力(li)。在(zai)(zai)劉慶峰看來,語(yu)言(yan)(yan)學習中有(you)兩個(ge)(ge)非(fei)常困(kun)難的挑戰,一個(ge)(ge)是(shi)作(zuo)文,一個(ge)(ge)是(shi)口語(yu)。
以作(zuo)(zuo)文(wen)(wen)為例,作(zuo)(zuo)文(wen)(wen)的批改(gai)(gai)難度大,花費時(shi)間長,同時(shi)還需要(yao)教會學(xue)生改(gai)(gai)進的方(fang)法,一(yi)篇作(zuo)(zuo)文(wen)(wen)的批改(gai)(gai)可(ke)能就(jiu)需要(yao)花費10分鐘,如(ru)果老(lao)師(shi)再進行更深入(ru)的分析和教學(xue),一(yi)篇作(zuo)(zuo)文(wen)(wen)至少需要(yao)30分鐘以上,如(ru)果按(an)照40人的班級計算,則僅作(zuo)(zuo)文(wen)(wen)一(yi)項任(ren)務就(jiu)需要(yao)20個(ge)小時(shi)以上。
在(zai)現(xian)場的(de)演示中,利用星(xing)火大模型的(de)語言能(neng)力,整體批改(gai)(gai)作文(wen)的(de)時間幾乎可以忽略。不僅如此,批改(gai)(gai)的(de)作文(wen)會(hui)(hui)通過分數呈(cheng)現(xian),當(dang)然分數不會(hui)(hui)是隨意評估(gu)的(de),訊飛學習機會(hui)(hui)像(xiang)老師一樣仔(zi)細(xi)的(de)批改(gai)(gai)文(wen)章,并提供評分依據,包(bao)括(kuo)第一步(bu)發現(xian)錯別(bie)字,第二步(bu)修改(gai)(gai)病句,發現(xian)斷(duan)句錯誤(wu)、標(biao)點錯誤(wu)、冗余或用詞不當(dang)等問(wen)題(ti),每一個細(xi)節(jie)上的(de)小錯誤(wu)都能(neng)夠呈(cheng)現(xian)出(chu)來,第三步(bu)則是內容(rong)評價,除了指(zhi)出(chu)問(wen)題(ti)所在(zai),還能(neng)夠提供啟發式(shi)的(de)建議,幫助(zhu)學生提升寫(xie)作水平。
當(dang)然,除了(le)中(zhong)文作文外,英文作文也(ye)不在話下。比如它可以發現單詞拼(pin)寫錯誤(wu)、詞匯用法(fa)不當(dang)、句型結(jie)構問題等,最后(hou)提出優化的(de)建議。劉慶(qing)峰(feng)介紹,經(jing)過測試,現在星火大模(mo)型這個功(gong)能(neng)(neng)絕對是業界(jie)從(cong)0到1的(de)突破(po),在批改的(de)準確(que)率(lv)以及(ji)修訂(ding)的(de)書(shu)面(mian)優美度來說已經(jing)超過了(le)一(yi)般老師的(de)平均水平。在今天上午中(zhong)國人(ren)工智能(neng)(neng)學會的(de)頒獎典禮上,其OCR識別技術還獲得了(le)吳(wu)文俊(jun)科(ke)學創新一(yi)等獎。
另(ling)外(wai)在(zai)口語(yu)(yu)方面,針對口語(yu)(yu)環境、固定(ding)主題(ti)等口語(yu)(yu)訓(xun)練(lian)中的(de)局限(xian)性,星火大模(mo)型帶來(lai)了一(yi)(yi)種(zhong)類人的(de)自由(you)對話體驗,不(bu)僅可以(yi)自動評測使(shi)用者(zhe)的(de)發音,甚至可以(yi)根據(ju)主題(ti)主動拓展對話,讓使(shi)用者(zhe)可以(yi)在(zai)對話的(de)過(guo)程中自由(you)發揮,甚至遇到不(bu)會的(de)語(yu)(yu)句還可以(yi)用熟(shu)悉的(de)母語(yu)(yu)進行(xing)對話,完全像人類間的(de)聊天(tian)方式一(yi)(yi)樣訓(xun)練(lian)口語(yu)(yu)。當(dang)然這(zhe)些(xie)也不(bu)再(zai)是(shi)演(yan)示,今天(tian)起將在(zai)科大訊飛學(xue)習機(ji)上支(zhi)持上述功能。
在辦公領域
劉慶峰介紹,辦公領域一直以來面(mian)臨著三大問(wen)題,第一是記不(bu)全(quan),傳(chuan)統開會即便是專心(xin)聽(ting)講也(ye)(ye)很(hen)難把所有(you)的(de)信(xin)息(xi)掌(zhang)握住(zhu),如果邊(bian)聽(ting)邊(bian)記,可能(neng)會出現(xian)跟不(bu)上演(yan)講者的(de)速度,無(wu)法進行(xing)更深的(de)思考;第二(er)個問(wen)題是找(zhao)不(bu)到關鍵內容,通常大段的(de)演(yan)講或(huo)錄音之后(hou),很(hen)難去重(zhong)新尋(xun)找(zhao)到關鍵的(de)信(xin)息(xi),有(you)時候(hou)即便重(zhong)新從(cong)頭到尾的(de)聽(ting)也(ye)(ye)很(hen)難查找(zhao);第三個問(wen)題是安全(quan)性,比(bi)如使用(yong)者擔(dan)心(xin)電子記錄是否會將數據傳(chuan)到后(hou)臺等(deng)等(deng)。
面對這些,科(ke)大(da)訊飛升級(ji)了(le)會議(yi)紀(ji)要、語(yu)(yu)篇規(gui)整能力兩(liang)大(da)能力,會議(yi)紀(ji)要功(gong)能可(ke)(ke)以將語(yu)(yu)音(yin)實時形成一份精簡的(de)會議(yi)紀(ji)要,幫(bang)助使用者快(kuai)(kuai)速(su)回溯(su)會議(yi)內(nei)容;語(yu)(yu)篇規(gui)整能力則可(ke)(ke)以去除語(yu)(yu)音(yin)中的(de)口(kou)語(yu)(yu)化詞匯,過濾冗余信(xin)息(xi),快(kuai)(kuai)速(su)抓住要點(dian)信(xin)息(xi)并整理成書面化的(de)文稿(gao)。
除此之外,訊(xun)飛聽(ting)見在星火大模(mo)型的(de)加(jia)持之下,不僅可以(yi)錄音(yin)(yin),還升(sheng)級了(le)“一鍵成(cheng)稿能力”,包括(kuo)全文(wen)摘(zhai)要、工作(zuo)代(dai)辦(ban)、工作(zuo)計劃、新聞(wen)稿件、宣(xuan)傳(chuan)文(wen)案、多語(yu)種(zhong)翻(fan)譯等(deng)等(deng),還可以(yi)根據(ju)自己的(de)記錄找到對應語(yu)音(yin)(yin),實現字(zi)音(yin)(yin)同步。除此之外,一鍵成(cheng)稿還能根據(ju)需(xu)求輸出(chu)不同的(de)文(wen)章,比如(ru)將錄音(yin)(yin)轉為一篇新聞(wen)通稿,也(ye)可以(yi)根據(ju)宣(xuan)傳(chuan)口(kou)徑、關注(zhu)方向、中英文(wen)需(xu)要等(deng),在通稿上得到不同風格、不同語(yu)音(yin)(yin)、不同側(ce)重的(de)新的(de)稿件。
在汽車領域
汽(qi)車(che)領(ling)域是(shi)人(ren)機交互(hu)技術應用的(de)(de)一個重要領(ling)域之(zhi)一,尤其是(shi)汽(qi)車(che)智(zhi)能化的(de)(de)趨勢愈演愈烈(lie)。科大訊(xun)飛在汽(qi)車(che)座(zuo)艙內提(ti)(ti)供了更(geng)加(jia)自由、更(geng)加(jia)擬人(ren)化的(de)(de)溝(gou)通方式,比(bi)如隨時提(ti)(ti)供行程信息(xi),隨時應答(da)各(ge)種問題,創造性對話、訂餐購物、風景講解等等。比(bi)如五一長(chang)假路(lu)途(tu)上,可以詢問它(ta)新的(de)(de)網紅路(lu)線(xian),詢問風景區(qu)人(ren)流量(liang)如何,有沒有避(bi)開的(de)(de)新路(lu)線(xian)等等。
目前科大(da)訊飛已(yi)為數千個車(che)型提供(gong)業界領(ling)先的智能(neng)語(yu)音(yin)交(jiao)互(hu)服務,提供(gong)多輪(lun)、多人、多區域、多模態的語(yu)音(yin)交(jiao)互(hu),累計(ji)服務用戶已(yi)經(jing)超過4610萬,在(zai)國內(nei)汽車(che)智能(neng)語(yu)音(yin)應(ying)用市(shi)場保持占有率第一。
在數字員工領域
科大(da)訊飛已(yi)經(jing)推出過(guo)一款(kuan)叫做虛擬人(ren)的(de)(de)(de)(de)智(zhi)能交互(hu)(hu)(hu)機,這個交互(hu)(hu)(hu)機通過(guo)虛擬的(de)(de)(de)(de)形象可(ke)以(yi)以(yi)對話的(de)(de)(de)(de)方式實現(xian)導(dao)游、虛擬客(ke)服、導(dao)購(gou)、導(dao)診以(yi)及社區的(de)(de)(de)(de)服務等工作,現(xian)在科大(da)訊飛已(yi)經(jing)有(you)(you) 1000 多個虛擬形象的(de)(de)(de)(de)資產,任何形象基本上都能找到,有(you)(you)300多個專(zhuan)業(ye)不同(tong)的(de)(de)(de)(de)聲(sheng)音(yin),并且還有(you)(you)30多萬用戶(hu)自(zi)(zi)定義的(de)(de)(de)(de)音(yin)庫。通過(guo)星火大(da)模型,它變得(de)更(geng)加的(de)(de)(de)(de)智(zhi)能化,更(geng)加的(de)(de)(de)(de)人(ren)性化,而且自(zi)(zi)動可(ke)以(yi)調(diao)用各種工具,從(cong)而實現(xian)一個營業(ye)廳24小時不打烊的(de)(de)(de)(de)服務。目前科大(da)訊飛已(yi)經(jing)率先在10家(jia)直營的(de)(de)(de)(de)旗(qi)艦店上線(xian)虛擬導(dao)購(gou)的(de)(de)(de)(de)智(zhi)能交互(hu)(hu)(hu)機。
另外(wai)現場(chang)還以公司招聘事(shi)項為例,演示了數(shu)字員工在人力(li)(li)資源(yuan)方(fang)面(mian)的價值。在輸入(ru)指令后,系統即可自(zi)動按照(zhao)事(shi)先設計的RPA腳本,操作(zuo)(zuo)計算機中的相(xiang)應軟(ruan)件,實現業務(wu)流程(cheng)的自(zi)動化操作(zuo)(zuo)并(bing)輸出結果,還能進行(xing)數(shu)據分析,比如(ru)幫(bang)助人力(li)(li)部門度(du)過簡歷投遞高(gao)峰期,尋找更加符(fu)合意向的員工等等,大幅減輕(qing)一線工作(zuo)(zuo)人員的壓(ya)力(li)(li)。
與此(ci)同(tong)時(shi),劉慶峰在會上宣布,訊飛(fei)開(kai)放平臺(tai)將從今日開(kai)放星火認知大模(mo)型(xing)能力接口(kou)以及插件市場,面(mian)相全行業(ye)招募生態合作伙伴。同(tong)時(shi),訊飛(fei)開(kai)放平臺(tai)宣布將聯合首批介入的36各行業(ye)、3000余家企業(ye)開(kai)發者,攻堅大模(mo)型(xing)行業(ye)通用(yong)解決(jue)方案。
另(ling)外,即日起,訊飛星火認知大模型(xing)也正式對行業(ye)合作伙伴和(he)開(kai)放(fang)平臺開(kai)發者開(kai)放(fang)預約(yue)。
“國家隊”將繼續推動大模型進步
劉慶峰在(zai)會上介紹,科(ke)(ke)大訊飛素有中國的(de)國家隊之(zhi)稱,2011年科(ke)(ke)大訊飛便承建了語音(yin)及語言信息處理(li)國家工程(cheng)實驗(yan)室,“我們提出讓機器像人一樣(yang)能聽會說,這一次(ci)認知大模型本質上是(shi)一次(ci)對(dui)話式的(de)通用智慧的(de)涌現,語音(yin)和(he)語言的(de)核心(xin)能力是(shi)一個基礎條(tiao)件。”
2014年科大(da)訊(xun)(xun)(xun)飛推(tui)出“訊(xun)(xun)(xun)飛超腦計劃”,明確(que)提出:讓機(ji)器像人(ren)一(yi)樣能理解會(hui)(hui)思考。2022年1月,科大(da)訊(xun)(xun)(xun)飛又在(zai)其年度大(da)會(hui)(hui)上(shang)將該計劃升(sheng)級為“訊(xun)(xun)(xun)飛超腦2030計劃”,提出讓懂(dong)知識、善學習、能進(jin)化的(de)通用人(ren)工智能技術成為每(mei)個人(ren)未來(lai)發展的(de)重(zhong)要機(ji)會(hui)(hui),讓機(ji)器人(ren)走進(jin)家庭。
“在(zai)國(guo)家平臺和訊飛(fei)超腦計劃的(de)支撐下,過去(qu)幾年(nian)我(wo)們在(zai)認(ren)知(zhi)智能領(ling)域取得了一系列全(quan)球領(ling)先的(de)成果。”2017年(nian),科(ke)(ke)大(da)訊飛(fei)承建認(ren)知(zhi)智能國(guo)家重(zhong)點實驗(yan)室,也(ye)(ye)就是從這一年(nian)起,科(ke)(ke)大(da)訊飛(fei)不(bu)僅讓機器(qi)在(zai)全(quan)球首次通過了國(guo)家職業醫(yi)師資格(ge)考(kao)試、超過了96.3%參加考(kao)試的(de)醫(yi)生,并且(qie)在(zai)SQuAD機器(qi)閱讀理(li)(li)解(jie)中全(quan)球首次超過人類平均水(shui)平,剛(gang)剛(gang)過去(qu)的(de)2022年(nian)在(zai)OpenBookQA 科(ke)(ke)學知(zhi)識推(tui)理(li)(li)中,單(dan)模型(xing)也(ye)(ye)超過人類平均水(shui)平。“
正是因為有這樣的(de)(de)系列(lie)的(de)(de)成果,所(suo)以(yi)當去年(nian)11月30日ChatGPT帶給大(da)家驚喜之(zhi)后,科大(da)訊飛(fei)能(neng)夠通過關(guan)鍵的(de)(de)技術和研發體(ti)系,以(yi)及(ji)成建制的(de)(de)團隊,重現OpenAI的(de)(de)智慧。在2022年(nian)12月15日啟動認知大(da)模型專項(xiang)攻關(guan)后,科大(da)訊飛(fei)到(dao)今年(nian)5月6日便正式將星火大(da)模型推到(dao)了外界(jie)的(de)(de)面前。
劉慶峰表(biao)示,今天的(de)(de)大模型(xing)才剛(gang)剛(gang)開始,還在快速(su)的(de)(de)成長和迭代的(de)(de)過程中,我們不是要(yao)在單個例子(zi)上證明誰(shui)更強(qiang),這(zhe)沒有意義(yi)。因此我們向OpenAI致敬和學習,同時也要(yao)快速(su)追(zhui)趕并超越。而這(zhe)就需要(yao)一套(tao)科學的(de)(de)評測(ce)體系。
科(ke)大訊飛通(tong)過(guo)認知智能(neng)全國重(zhong)點(dian)實驗室(shi)牽頭設計了通(tong)用認知大模型評測體系(xi)(xi),并與中科(ke)院人工智能(neng)產學研創新聯盟和長(chang)三(san)角人工智能(neng)產業鏈聯盟共同探討形成了覆蓋7大類(lei)481個細分任(ren)務(wu)類(lei)型。在科(ke)學的(de)評測體系(xi)(xi)中,推(tui)動大模型的(de)發展。
最(zui)后,借用劉慶峰的話作為結尾,“我相信(xin)人工(gong)智能(neng)一(yi)定(ding)會以解(jie)決(jue)人類剛需而更深刻地載入史冊。我們期待(dai)著跟所有的合作伙(huo)伴(ban)一(yi)道,攜手(shou)努(nu)力,讓這樣一(yi)個人工(gong)智能(neng)建設美好世界的夢想成為燎原(yuan)之勢。”
參考資料(liao):
1.//xinghuo.xfyun.cn/?ch=bdtg-xh-cy01&bd_vid=10620476027592690612
2.《攜手生態,星火燎(liao)原!》,訊飛開放平臺