今(jin)日,原美(mei)團聯合創始(shi)人王慧(hui)文(wen)發(fa)文(wen)稱,將打造中國的OpenAI。并且,王慧(hui)文(wen)透露(lu)還將成立北京(jing)光(guang)年(nian)之(zhi)外科(ke)技有限公司(si),其個人出資(zi) 5000 萬美(mei)元,估值 2 億(yi)美(mei)元,并表示,“個人不占股(gu)份,資(zi)金占股(gu) 25%,75% 的股(gu)份用于邀請(qing)頂級研(yan)發(fa)人才,下輪(lun)融資(zi)已有頂級 VC 認(ren)購 2.3 億(yi)美(mei)元。”
據天眼查上的信息顯示,北(bei)京(jing)光年之外科技有限公司(si)成立于2018年7月(yue),是一家以(yi)從事科技推廣和(he)應(ying)用服務業為主的企(qi)業,注(zhu)冊(ce)資本100萬人民幣,法定代表(biao)人為王慧文,其持股(gu)比(bi)例為100%。
王慧文曾經在當年(nian)(nian)的(de)退休郵件(jian)中表示(shi),“感謝偉大的(de)時代,我生于(yu)1978年(nian)(nian),是改革(ge)開(kai)放的(de)同(tong)齡人;在我開(kai)始厭學(xue)(xue)的(de)時候(hou),大學(xue)(xue)宿(su)舍通網,因(yin)此(ci)趕上(shang)了(le)互聯網最(zui)精彩的(de)20年(nian)(nian);中國作為全球最(zui)大的(de)單一市場,對創業者來說更是得天獨厚。 我運氣實在太好,不(bu)宜繼續貪天之功,知(zhi)止不(bu)殆。”
作為早期中國互聯(lian)網(wang)行業的(de)代表人物(wu),王慧文先后創(chuang)立(li)(li)了校內網(wang)、來電網(wang)、淘房網(wang),而與(yu)王興聯(lian)手(shou)創(chuang)立(li)(li)的(de)美(mei)團,應該是(shi)其創(chuang)業史上(shang)最成功的(de)一次(ci)。對于王慧文來說,美(mei)團聯(lian)合創(chuang)始人的(de)身份讓他早已財富自由,并于2020年宣布退休,減(jian)持美(mei)團股票200萬股,成功套(tao)現(xian)2.74億港元,而ChatGPT的(de)爆火讓再次(ci)點燃了他的(de)創(chuang)業激(ji)情。
三天前,就曾有一張王慧文的朋友圈截圖在網上流傳,稱要組隊入局人工智能,有相關人士進(jin)一(yi)步確認該截圖(tu)屬(shu)實。當時,王慧文在(zai)朋友圈(quan)表(biao)示:“5000萬美(mei)元(yuan),帶(dai)資入組(zu),不(bu)在(zai)意崗位(wei)、薪資和(he)title,求組(zu)隊。”同時,他還在(zai)即刻APP上表(biao)示,目前不(bu)懂(dong)AI技(ji)術(shu),正(zheng)在(zai)努(nu)力學習。
由此可見,當前因ChatGPT而掀起(qi)的(de)新一(yi)輪人工智能熱(re)潮,已(yi)經傳(chuan)到了互聯(lian)網的(de)創(chuang)始人圈(quan)。
比爾·蓋茨(ci)在接(jie)受媒體采訪時表(biao)示,ChatGPT可以對用戶查詢(xun)做出驚人(ren)的(de)類似人(ren)類的(de)反應,其重要性(xing)不(bu)亞(ya)于互聯網(wang)的(de)發明(ming)。
最近,英偉達(da)CEO黃仁勛也在參(can)加談話時(shi)表(biao)示,ChatGPT的出現對于AI行(xing)業來(lai)說,相當(dang)于(當(dang)年在)手機(ji)領域(出現)的iPhone,是計(ji)算(suan)機(ji)行(xing)業最偉大的事(shi)情之一,具有(you)里程碑意(yi)義。現在大家能(neng)把所有(you)關于移動計(ji)算(suan)的構(gou)想(xiang),匯集到一個產(chan)品(pin)中(zhong)。比如,通過API接(jie)口(kou),可(ke)以把ChatGPT連接(jie)到數(shu)據表(biao)、Powerpoint、繪圖程序,照片(pian)編(bian)輯程序等。
上周,搜(sou)狐創始人(ren)(ren)張(zhang)朝陽開啟了《星(xing)空下的對(dui)話》節目,邀(yao)請(qing)到360創始人(ren)(ren)周鴻祎進(jin)行了深度對(dui)話,其(qi)中就(jiu)談及了對(dui)于ChatGPT“出圈(quan)”的看法。
在周鴻祎看來(lai),“ChatGPT可能代表(biao)著人(ren)(ren)工智(zhi)能歷史上(shang)一場真(zhen)正革命的(de)(de)(de)開始(shi),雖然現在還不完美有很(hen)多缺(que)點(dian),但(dan)未來(lai)有無限潛(qian)力,有無限的(de)(de)(de)應用(yong)(yong)場景”,而(er)張朝陽則表(biao)示,“ChatGPT的(de)(de)(de)產(chan)生(sheng)是從量變(bian)到(dao)質變(bian)的(de)(de)(de)長(chang)期積(ji)累過程,20年(nian)來(lai),人(ren)(ren)們(men)在網上(shang)積(ji)累了大量的(de)(de)(de)信(xin)息,關于知識圖譜(pu)的(de)(de)(de)發(fa)展以及(ji)擬合(he)的(de)(de)(de)方(fang)式,以及(ji)算(suan)力和神經網絡(luo)的(de)(de)(de)擬合(he)方(fang)式和計算(suan)、夾角(jiao)計算(suan),導(dao)致人(ren)(ren)類對網上(shang)信(xin)息充分的(de)(de)(de)使用(yong)(yong)和擬合(he)已經變(bian)得(de)可以達到(dao)智(zhi)能的(de)(de)(de)狀態,這是最(zui)原始(shi)的(de)(de)(de)AI使用(yong)(yong)。”
不過,面對(dui)當(dang)前ChatGPT的(de)(de)(de)風口是否要(yao)入(ru)(ru)局(ju),張朝陽表示仍(reng)需要(yao)謹(jin)慎,“ChatGPT積(ji)累了許(xu)多(duo)年(nian),涉(she)及算(suan)力(li)(li)要(yao)有多(duo)少服(fu)務器,知識庫、標注等(deng)等(deng)很(hen)多(duo)問題,若沒(mei)有這些(xie)能力(li)(li)的(de)(de)(de)公(gong)(gong)司(si)跟風入(ru)(ru)局(ju),會消(xiao)耗掉許(xu)多(duo)資(zi)源。但人工智能AI以及有搜索(suo)能力(li)(li)的(de)(de)(de)公(gong)(gong)司(si),還是需要(yao)有這樣一個(ge)準備。”周鴻祎分(fen)析,要(yao)看其(qi)過去十年(nian)有沒(mei)有在(zai)服(fu)務器算(suan)力(li)(li)上投入(ru)(ru),有沒(mei)有做人工智能的(de)(de)(de)團(tuan)隊,有沒(mei)有大數據(ju)的(de)(de)(de)存(cun)儲,但“有泡沫總(zong)不是壞事,會有更多(duo)優秀的(de)(de)(de)人才,會有更多(duo)的(de)(de)(de)資(zi)金涌入(ru)(ru)。”
對于人工智(zhi)能(neng)(neng)在自(zi)(zi)(zi)然(ran)語言(yan)處理領(ling)域的發展來說,雖然(ran)近10年來技術(shu)上有了突飛猛(meng)進(jin)的發展,但對于技術(shu)圈之外的普通(tong)人來說,可(ke)能(neng)(neng)印(yin)象(xiang)最深(shen)的還(huan)是(shi)各種語音(yin)助手產品,但是(shi),相信每(mei)個體驗過的人都或(huo)多或(huo)少經歷過它們的“智(zhi)障”時刻。而ChatGPT的橫空出(chu)世,可(ke)以說是(shi)首次打開(kai)了自(zi)(zi)(zi)然(ran)語言(yan)處理技術(shu)大(da)(da)規模商業化落地的大(da)(da)門,標(biao)志著(zhu)自(zi)(zi)(zi)然(ran)語言(yan)理解(jie)技術(shu)邁(mai)上了新臺階,其理解(jie)能(neng)(neng)力、語言(yan)組織能(neng)(neng)力、持續(xu)學習能(neng)(neng)力更強,也標(biao)志著(zhu)AIGC在語言(yan)領(ling)域取得(de)了新進(jin)展,使(shi)得(de)生成內容的范圍、有效性、準確度大(da)(da)幅(fu)提升。
近期,百度(du)、京(jing)東、科大(da)訊飛等國內互聯(lian)網公司紛紛表(biao)示自(zi)家(jia)在ChatGPT上已(yi)有布局(ju)和相關產品將要推(tui)出,搶占“中國版ChatGPT”名號(hao)的戰爭已(yi)經徹底打響,但(dan)花落誰(shui)家(jia)還(huan)尚(shang)未可知。不(bu)過,拋(pao)開炒作的因(yin)素不(bu)談,對于人工智能發展的三大(da)要素(數據(ju)、算法(fa)、算力)來說,國內企業的確都有良好的基(ji)礎。
在算法方面,ChatGPT的(de)(de)(de)(de)(de)技(ji)術底座是(shi)(shi)大規模(mo)語言模(mo)型(LLM),本質(zhi)上(shang)仍是(shi)(shi)以深(shen)度學習為代表的(de)(de)(de)(de)(de)技(ji)術長期(qi)發(fa)展和積累的(de)(de)(de)(de)(de)結果,并未出現算法的(de)(de)(de)(de)(de)革命性突破(po)。發(fa)布于2020年的(de)(de)(de)(de)(de)GPT-3是(shi)(shi)具(ju)有(you)1750億個參數的(de)(de)(de)(de)(de)大模(mo)型,ChatGPT正是(shi)(shi)再此基礎上(shang)進行(xing)改進的(de)(de)(de)(de)(de)。對于大型語言模(mo)型來(lai)說,國(guo)內(nei)的(de)(de)(de)(de)(de)幾大互聯網公司也都有(you)各自的(de)(de)(de)(de)(de)大模(mo)型問世,相比國(guo)外的(de)(de)(de)(de)(de)一流模(mo)型來(lai)說,業界(jie)的(de)(de)(de)(de)(de)共識是(shi)(shi)有(you)兩年左右的(de)(de)(de)(de)(de)差距,但(dan)完全(quan)有(you)趕超(chao)的(de)(de)(de)(de)(de)可能。
在算(suan)力(li)方面,人工智能模型的(de)訓練和(he)使用需要(yao)強大的(de)算(suan)力(li),這就需要(yao)大量(liang)高性能的(de)GPU來支撐。據《2021—2022全(quan)球計算(suan)力(li)指(zhi)數(shu)評估報(bao)告》顯示(shi),美國(guo)計算(suan)力(li)指(zhi)數(shu)得分為77分,中國(guo)為70分,分列世界前兩位(wei),中國(guo)算(suan)力(li)水平與美國(guo)處于同(tong)一(yi)等級,差(cha)距(ju)并不大。
在(zai)(zai)數(shu)(shu)據(ju)(ju)(ju)方面(mian),據(ju)(ju)(ju)了(le)解(jie),ChatGPT的(de)(de)訓練(lian)(lian)使用了(le)大(da)(da)約(yue)45TB數(shu)(shu)據(ju)(ju)(ju),其(qi)中(zhong)包含多達(da)近1萬億個(ge)單詞的(de)(de)文(wen)(wen)本內(nei)容。在(zai)(zai)當前(qian)人工智能的(de)(de)發(fa)(fa)(fa)展階(jie)段來說,大(da)(da)模(mo)型依舊(jiu)是發(fa)(fa)(fa)展的(de)(de)主流,對(dui)于數(shu)(shu)據(ju)(ju)(ju)量(liang)的(de)(de)要求始終居(ju)高不下。而(er)從(cong)大(da)(da)數(shu)(shu)據(ju)(ju)(ju)資源看,中(zhong)國擁(yong)有(you)全世界最大(da)(da)規模(mo)的(de)(de)網(wang)民(min)數(shu)(shu)量(liang),有(you)豐富(fu)的(de)(de)應用場(chang)景,在(zai)(zai)數(shu)(shu)據(ju)(ju)(ju)積(ji)累方面(mian)優勢明(ming)顯。不過,一(yi)(yi)位北大(da)(da)教授曾分(fen)享過一(yi)(yi)組(zu)數(shu)(shu)據(ju)(ju)(ju),表(biao)明(ming)了(le)中(zhong)文(wen)(wen)數(shu)(shu)據(ju)(ju)(ju)的(de)(de)質量(liang)現狀:截至2021年,雖(sui)然(ran)(ran)簡體中(zhong)文(wen)(wen)互聯網(wang)用戶和英(ying)文(wen)(wen)互聯網(wang)用戶規模(mo)相當,但在(zai)(zai)全球排名(ming)前(qian)1000萬個(ge)網(wang)站中(zhong),英(ying)文(wen)(wen)內(nei)容占比60.4%,中(zhong)文(wen)(wen)內(nei)容占比僅為(wei)1.4%。這是ChatGPT的(de)(de)英(ying)文(wen)(wen)水平明(ming)顯高于中(zhong)文(wen)(wen)的(de)(de)原因,也(ye)是在(zai)(zai)模(mo)型的(de)(de)訓練(lian)(lian)階(jie)段被“喂(wei)”了(le)更多英(ying)文(wen)(wen)語料的(de)(de)必然(ran)(ran)結果,不過這同樣也(ye)可(ke)以(yi)成為(wei)中(zhong)國企業發(fa)(fa)(fa)展ChatGPT應用的(de)(de)競(jing)爭切(qie)入點。
2月8日,為了(le)對(dui)抗(kang)OpenAI和(he)微軟的新(xin)版(ban)Bing,谷(gu)(gu)歌(ge)在(zai)發布(bu)會上正式發布(bu)了(le)對(dui)標(biao)的Bard,此(ci)前,在(zai)谷(gu)(gu)歌(ge)搜索(suo)引擎(qing)大規模語言模型的加持下,用戶對(dui)Bard充滿了(le)期待(dai)。然而,由于Bard在(zai)回(hui)答時出現了(le)事實性錯(cuo)誤,導(dao)致(zhi)當天谷(gu)(gu)歌(ge)市值暴跌近(jin)1000億美(mei)元。
然而(er),根據機(ji)器之心今日發布(bu)的(de)(de)測(ce)評,微軟的(de)(de)新版Bing也在回答(da)中出(chu)(chu)(chu)現了各種錯誤,包括名人(ren)身份信息、財(cai)報(bao)(bao)數(shu)(shu)(shu)字、營業(ye)時間(jian)(jian)等。例(li)如,新版Bing給(gei)出(chu)(chu)(chu)Gap公司全年(nian)的(de)(de)銷(xiao)售指引為“預計銷(xiao)售凈(jing)增長率為低雙(shuang)位(wei)數(shu)(shu)(shu)”,而(er)實際是四季度“可能呈(cheng)中間(jian)(jian)個位(wei)數(shu)(shu)(shu)下降”,一詞之差,對(dui)用(yong)戶的(de)(de)投資行為將產生嚴重的(de)(de)誤導。此外(wai),Bing甚至還無(wu)中生有(you),給(gei)出(chu)(chu)(chu)了更多的(de)(de)全年(nian)財(cai)務指引“營業(ye)毛利為7%,攤薄(bo)每股收益(yi)為1.6美元到1.75美元之間(jian)(jian)”,而(er)這些(xie)數(shu)(shu)(shu)據在Gap的(de)(de)三(san)季度財(cai)報(bao)(bao)中統統沒有(you)提(ti)到。
由此(ci)(ci)可(ke)見(jian),雖然(ran)當(dang)前全世界都在驚訝于ChatGPT等大(da)(da)型語言模型展(zhan)現出來的(de)能(neng)力,但還有諸(zhu)多的(de)問(wen)題亟(ji)待解決。如(ru)果僅(jin)僅(jin)將其用(yong)于閑(xian)聊(liao),產生的(de)變革和顛覆性價值(zhi)會(hui)降低很(hen)多,只有當(dang)此(ci)(ci)類模型把回答中的(de)事實性錯誤降到一個(ge)非(fei)常(chang)低的(de)水平(ping),才會(hui)真正顯(xian)現出更大(da)(da)的(de)價值(zhi)。如(ru)果放(fang)任這些虛(xu)假信息的(de)存在,那么史上最(zui)快達到1億用(yong)戶(hu)所帶來的(de)這把火也會(hui)很(hen)快熄滅。
這(zhe)對于國內企業來說(shuo)當然也很難,需要人力、資本、經(jing)驗、耐(nai)心等各個維度的大(da)量投入(ru)。OpenAl花了(le)9個月才建(jian)立起大(da)模(mo)型訓練的pipeline,并用幾年(nian)時間和天量資金積攢下來的大(da)模(mo)型訓練經(jing)驗,絕非(fei)是一朝(chao)一夕就能(neng)復(fu)刻(ke)的。
寫在最后
可能(neng)(neng)(neng)很多(duo)人(ren)(ren)不(bu)知(zhi)道的(de)(de)是(shi),“人(ren)(ren)工(gong)(gong)智能(neng)(neng)(neng)”一詞早在1956年的(de)(de)達特(te)茅斯(si)會(hui)(hui)議上就已經被提(ti)出,而在最(zui)近十年才(cai)真正有(you)了幾次(ci)里程(cheng)碑式的(de)(de)突破。ChatGPT的(de)(de)出現只是(shi)在通(tong)往(wang)強(qiang)人(ren)(ren)工(gong)(gong)智能(neng)(neng)(neng)和(he)通(tong)用人(ren)(ren)工(gong)(gong)智能(neng)(neng)(neng)的(de)(de)路上撕(si)開了一個小口子,未來可能(neng)(neng)(neng)還會(hui)(hui)出現能(neng)(neng)(neng)力(li)更(geng)強(qiang)的(de)(de)工(gong)(gong)具。面對此次(ci)ChatGPT帶來的(de)(de)這波(bo)浪潮,與(yu)其擔心會(hui)(hui)被取(qu)代,不(bu)如一起讓AI變(bian)得更(geng)好。
參考資料:1.《別只罵谷歌Bard了(le),ChatGPT加持(chi)的微軟New Bing也錯誤頻出》,機器(qi)之心