“如果(guo)人類(lei)的水(shui)平(ping)達不到80分,就(jiu)會被AI淘汰。”
在中國AIGC產業峰會現場,昆(kun)侖萬維CEO方漢拋出這樣一個大膽預測。
在他(ta)看來,目(mu)前AIGC對存量知識的理(li)解與表(biao)達(da)(da)已經達(da)(da)到80分的水平(ping),行(xing)業(ye)從業(ye)者將隨(sui)之形成兩極(ji)分(fen)化的局面:
一(yi)部(bu)分(fen)人成(cheng)為(wei)上游(you)管理員(yuan),一(yi)部(bu)分(fen)成(cheng)為(wei)底(di)層AIGC操作(zuo)員(yuan),兩者的(de)工作(zuo)產量都會極大(da)提升。
剩下的(de)達不到(dao)80分(fen)的(de)腰部從業者,大(da)概率(lv)被淘汰(tai)。
方(fang)漢畢業(ye)于(yu)中國(guo)科(ke)學技(ji)術(shu)大學近代物理系,擁有(you)29年(nian)互聯(lian)網(wang)從業(ye)經驗,從1994年(nian)開始參與和倡導(dao)開源(yuan)運動,是國(guo)內(nei)最(zui)早的(de)網(wang)絡安全專(zhuan)家,負責研發了國(guo)內(nei)市場占有(you)率最(zui)高的(de)網(wang)頁(ye)游戲(xi)《三國(guo)風(feng)云》。
2008年3月,他(ta)協(xie)助周(zhou)亞輝先生創(chuang)立昆侖萬維,后者于2015年A股上市(shi)。
在本次大(da)會上,他對(dui)(dui)昆侖萬維介(jie)入到類ChatGPT大(da)模型開發(fa)的契機、AIGC對(dui)(dui)內(nei)容從業(ye)者的影(ying)響(xiang)、三種AIGC商(shang)業(ye)路徑、以(yi)及開源和預訓(xun)練大(da)模型在其中的重要性(xing)進行了一一分(fen)享。
為了完整體現他(ta)的(de)思考,在不改變原意的(de)基(ji)礎上(shang),量子位對(dui)其演講內容進行了編輯(ji)整理。
AIGC原本含義比較狹窄,主要指文本、圖像以(yi)及(ji)視頻還(huan)有音樂等人類可以(yi)消費的(de)娛樂內容的(de)生成(cheng)。ChatGPT的(de)出(chu)現把AIGC的(de)范疇給(gei)泛化(hua)了。
對(dui)存量知識的(de)理(li)解(jie)與(yu)表達,AIGC將以(yi)低廉的(de)成本做到(dao)80分的(de)水準。
由于兩極分化,AIGC領域的(de)腰部(bu)工作者要么(me)力(li)爭上游(you)做頭(tou)部(bu)管理員,要不(bu)就老老實實成為AIGC操作員。
在AIGC領域,文生圖在同一個賽道出現了三種(zhong)完全不同的商業模(mo)式,互為(wei)補充:
(1)Stability.AI打(da)造的開源生態;
(2)Midjourney打造的SaaS或者Model Service生態(tai);
(3)Adobe Firefly打造的傳統(tong)生態(tai)工具(ju),將所有AIGC功能集成(cheng)到工具(ju)里(li)。
只有開源(yuan)模式可(ke)以(yi)滿(man)足用戶(hu)的長(chang)尾需(xu)求;只有開源(yuan)模式才(cai)可(ke)以(yi)滿(man)足中小企業的增長(chang)需(xu)求。
需(xu)要注意的是,我們不能只盯著目前AIGC進展,認為(wei)預訓練大模型(xing)(xing)已經突破傳統(tong)AIGC范疇進入AGI領域。實(shi)際上,各種AIGC工具能力仍然受(shou)到預訓練大模型(xing)(xing)限制,尤其(qi)GPT-4大模型(xing)(xing)出現(xian)(xian)后(hou)這個現(xian)(xian)象更加突出。
以下為方漢演講全文:
AIGC這(zhe)個名字剛(gang)提出來的時(shi)候(hou),在(zai)美國叫生(sheng)成式AI。
國內UGC、PGC的概念深入人心,所以造了一個詞叫(jiao)“AIGC”。
AIGC原本含義比較(jiao)狹(xia)窄,主(zhu)要指文本、圖像以及視頻還有音樂(le)等人類可(ke)以消(xiao)費的(de)娛樂(le)內容(rong)的(de)生成(cheng)。
ChatGPT的(de)(de)出現把AIGC的(de)(de)范疇給泛化了,ChatGPT屬于AGI(通用人工智能)范疇。
今天我(wo)的分享更多偏向原有含義,即人類娛樂內容的生成。
首先(xian),我(wo)簡(jian)單介紹一下昆侖萬維介入到(dao)類ChatGPT大模型(xing)開發的契機。
昆侖萬維2015年A股上(shang)市(shi),當時是以(yi)網(wang)游題材上(shang)市(shi)的(de),上(shang)市(shi)后在海外進行(xing)多元化發(fa)展(zhan),有瀏覽器、社交產品、游戲業(ye)務。
昆(kun)侖萬維是(shi)內容廠商,對于所有(you)內容生(sheng)成方面的(de)科技進步(bu)都非常敏感。
早在2020年6月份GPT-3剛剛出現的時候(hou),管理層和技術領(ling)導者都去進行嘗試。
當時我們判斷這是內容(rong)生成領域一個里程碑(bei),沒(mei)想到兩年后變成通用人工智能(neng)突破(po)口。
也是(shi)從那時我們就已經決定要跟進(jin)這件事情,因為我們在內容(rong)生成領(ling)域絕對(dui)不允許(xu)落后。
具體而(er)言,昆侖(lun)萬維(wei)開始布局AIGC和大模(mo)型領域,與奇點(dian)智源合作開始進(jin)行大模(mo)型訓練工作。
目前(qian)(qian)為止除(chu)了(le)通用大模(mo)型訓(xun)練之外,昆(kun)侖萬維在音樂(le)生成(cheng)領(ling)域也處于國(guo)內和(he)國(guo)際前(qian)(qian)沿地(di)位。
我們的愿(yuan)景是推進開源AIGC算(suan)法(fa)和模型社區的發展壯大。
昆侖萬維作為中國領(ling)先互聯網出海企業、技(ji)術(shu)驅動全(quan)球互聯網公(gong)司,致(zhi)力于前沿技(ji)術(shu)追蹤和(he)研發,有(you)相(xiang)當的技(ji)術(shu)積(ji)累(lei)和(he)人(ren)才儲備。
我們的技術團隊(dui)持(chi)續進行(xing)算法(fa)技術創新,積極推進模型算法(fa)開源以(yi)及(ji)社區(qu)發展壯大(da),基于全球(qiu)每月平均4億活躍(yue)用(yong)戶以(yi)及(ji)豐富行(xing)業(ye)經驗,助力(li)AIGC應用(yong)和生態的快速落地(di)以(yi)及(ji)成(cheng)長。
以下分享AIGC在具體商業模式落地(di)方(fang)面的思考。
我們觀察到一個有趣(qu)的現象,對于UGC(用戶生成內容)的平臺如小紅書、知乎、抖音、快手等,用戶創造(zao)內容的門檻每降低一倍(bei),用戶創造(zao)內容的數量就會(hui)增加(jia)十倍(bei)。
舉(ju)個例子,在手機攝(she)(she)像頭出現(xian)之前,人類拍(pai)攝(she)(she)視頻一定是(shi)靠(kao)專業的攝(she)(she)像機和數碼相(xiang)機。
手機出現(xian)之后,攝(she)像的門檻(jian)變低,視(shi)頻內(nei)容數量出現(xian)了大爆發(fa)。
這促成(cheng)了快手(shou)和抖(dou)音的發展,進而中國UGC領(ling)域產(chan)生了巨大突破。
C端(duan)工具的(de)商業邏輯其實是(shi)社區,B端工具的商業邏輯是功能完備性。
C端工具用快(kuai)手、抖(dou)音拍視頻,目的絕(jue)不是(shi)為了做(zuo)工具,而是(shi)讓用戶(hu)做(zuo)出(chu)來內(nei)容(rong)通過社區分發,這是(shi)C端工具邏(luo)輯。
B端工(gong)具的(de)商業(ye)邏輯就像Adobe的(de)PhotoShop全(quan)家桶(tong)、微軟Office全(quan)家桶(tong),以功能(neng)完備(bei)性來(lai)獲(huo)得用戶的(de)青睞(lai)。
可見(jian),隨著AIGC技術的進展(zhan),它們(men)將對內容(rong)生(sheng)(sheng)產者產生(sheng)(sheng)巨(ju)大(da)影響。
不(bu)得(de)不(bu)承認,現在AIGC對存量(liang)知識的理解與(yu)表達(da)還遠遠沒(mei)有到(dao)100分水準,但以低(di)廉的成本做到(dao)80分沒(mei)有任何問(wen)題。
如果人類自己的(de)(de)(de)水(shui)平(ping)也只是80分,我們的(de)(de)(de)工(gong)作一定(ding)會被AIGC替代,而80分以上的(de)(de)(de)人將去管理AIGC操作員(yuan),完成曾經需要腰部作者完成的(de)(de)(de)工(gong)作。
因此未(wei)來(lai),頭(tou)部(bu)工(gong)作(zuo)(zuo)者(zhe)(zhe)產量極(ji)大提升(sheng),作(zuo)(zuo)為AIGC操作(zuo)(zuo)員的底部(bu)工(gong)作(zuo)(zuo)者(zhe)(zhe)的生產能力也會得(de)到極(ji)大提升(sheng)。
很不幸,腰部(bu)工作者大概(gai)率會被淘汰。
那(nei)么(me),我們要(yao)么(me)力爭(zheng)上游做(zuo)頭(tou)部工作(zuo)者,要(yao)么(me)就老老實(shi)實(shi)當AIGC操作(zuo)員(yuan)。
在AIGC領(ling)域,文生圖(tu)在同一(yi)個賽道(dao)出現了(le)三種完全不同的(de)商(shang)業模式(shi)。
第(di)一種:Stability.AI打造的開源生態;
第二種(zhong):Midjourney打造(zao)的(de)SaaS或者Model Service生態;
第三種:Adobe Firefly打造的傳統生(sheng)態工具(ju),將所有AIGC功能集(ji)成到工具(ju)里。
這三種商(shang)業路徑,不止(zhi)是在(zai)文(wen)生(sheng)圖,在(zai)文(wen)生(sheng)圖像、文(wen)生(sheng)音(yin)樂還是小說創作領域都會長期存(cun)在(zai),且三種模(mo)式互(hu)為補充。
最終的C端用戶會傾向于使用Midjourney完(wan)成工作,如現在的電商(shang)從業者,大(da)量使用Midjourney來進行電商(shang)廣告素材創作。
Adobe Firefly則契合(he)一些傳統的大B企業(ye)的需求,B端用(yong)(yong)戶會使用(yong)(yong)Adobe Firefly來作(zuo)為(wei)自己的創作(zuo)工(gong)具。
Stability.AI是(shi)一(yi)種開(kai)源模式,特別適(shi)合在這個領域進行(xing)創(chuang)業的(de)廣(guang)大中(zhong)小企業。
通過開源模式(shi)來(lai)進行自己的改(gai)裝與改(gai)進,來(lai)滿足長尾需求,這(zhe)是另外(wai)兩(liang)個模式(shi)無法提(ti)供的功能(neng)。
開源大模(mo)型是(shi)商業閉源大模(mo)型的有(you)力補(bu)充和替(ti)代。
大(da)(da)家(jia)可以把ChatGPT想成早期Windows,Windows的存在是(shi)整個電腦(nao)商業軟(ruan)件的一個基石,也是(shi)絕大(da)(da)多數人的生產工具。
Linux通過(guo)30年的(de)努力變(bian)成Windows的(de)替代,開源(yuan)大(da)模(mo)型(xing)也一定會(hui)出現。
因為只有開源模式可以滿足用戶的長尾(wei)需(xu)求。
還(huan)是以(yi)Linux為(wei)例,全世(shi)界所(suo)有的云廠商、大型(xing)互聯網企業都以(yi)Linux為(wei)自己(ji)的服務底座。
要滿足自(zi)己的長尾需求(qiu),只有(you)一(yi)個選擇,就(jiu)是用Linux進行改裝。
所以(yi),我(wo)們也(ye)說(shuo),只有開源模式(shi)才可以(yi)滿(man)足中小企業(ye)的(de)增長需求。
做一(yi)個具(ju)體的(de)分析(xi),Stable Diffusion的(de)出(chu)現比OpenAI DALL·E 2晚了整(zheng)(zheng)整(zheng)(zheng)6個月,在性能、質量(liang)上都低于DALL·E 2和Midjourney,但依然有(you)眾多(duo)用戶(hu)。
因(yin)為它是(shi)開(kai)源的,進步(bu)速度(du)是(shi)難以(yi)想象的快。
Stable Diffusion催生ControlNet、T2I-Adapter、Composer,以及LoRA訓練技(ji)巧(qiao)。
在它上面進行二次開發的人數(shu)眾多,新(xin)特(te)性也在不斷地涌現。
ControlNet是目前為止在文生圖領(ling)域唯一解決一致性問題(ti)的途徑(jing),極大地(di)降低了(le)用戶(hu)的創作成本,提高了(le)創作的可玩性。
ControlNet開源僅2周(zhou),它的Star數就超過了1萬。
與此同(tong)時,開源社(she)區也(ye)極大地(di)降(jiang)低了用戶的(de)使(shi)用門檻。
例如HuggingFace提供了大量(liang)的(de)模型(xing)(xing)托管以及(ji)通用的(de)模型(xing)(xing)訓(xun)練來框架(jia)diffusers,stablediffusion-webui開發了完善(shan)的(de)一套Demo平(ping)臺,Civitai貢(gong)獻了海量(liang)風格化LoRA權重,整個社區(qu)也蓬勃(bo)發展起來了。
需要注意的是,我(wo)們(men)不能(neng)只盯著目前(qian)AIGC進展(zhan),認(ren)為(wei)預訓練大(da)模(mo)型(xing)已經(jing)突破傳統AIGC范疇進入AGI領域。
實際上,各種(zhong)AIGC工具能力仍(reng)然受(shou)到預訓練(lian)大模(mo)型(xing)限(xian)制,尤(you)其(qi)GPT-4大模(mo)型(xing)出現(xian)后(hou)這個(ge)現(xian)象(xiang)更加突出。
AIGC領域(yu)的(de)企業對于大模(mo)型本(ben)身(shen)的(de)需求仍然非(fei)常大,也是持(chi)續(xu)的(de)。
目前,還存在這樣(yang)幾(ji)個(ge)大問題。
首先,AIGC發(fa)展起來之后是(shi)否會導致(zhi)優質內容的稀缺?
因為AI生成的內容會大量污染原創的內容。
其次,如何解決(jue)大模型底座導致的(de)偏(pian)見(jian)?
比如OpenAI、ChatGPT生成的內容就存在偏見,這個(ge)問題值(zhi)得(de)關注。
最后,版(ban)權、信息偽造問題。
Adobe Firefly提(ti)出了一個新的模式,它訓練的所(suo)有內容與作(zuo)者(zhe)達成(cheng)(cheng)協議,通(tong)過對model收費給內容作(zuo)者(zhe)分(fen)成(cheng)(cheng)。
從監管到(dao)行業自(zi)律,我們可(ke)做(zuo)的事情非(fei)常多,而且迫在(zai)眉睫。
關于未來(lai)AIGC的(de)展望(僅指娛樂內容AIGC)——
第一(yi),AIGC對整(zheng)個社(she)會最大(da)的意義是低成(cheng)本(ben)終(zhong)極解決方(fang)案,這(zhe)一(yi)點(dian)毋庸置疑(yi),所有人類都有消費內(nei)容(rong)產生多巴胺的權(quan)力;
第二,AIGC將(jiang)涌現新的范式(shi)(shi),徹底改變藝術創作生產方式(shi)(shi);
最后,AIGC導致內容生成的極大發展,會使得VR和元宇宙變得更加可行。