文本-圖像人工智能系統(tong)目前(qian)在(zai)能力和受(shou)歡迎程度(du)上都在(zai)蓬勃發展(zhan),還有什么比它們出現(xian)在(zai)世界最(zui)熱門的(de)應用(yong)程序(xu)中更好的(de)證(zheng)明?那就是TikTok。這個(ge)視(shi)(shi)頻(pin)平(ping)臺最(zui)近增加了(le)一種(zhong)新的(de)效果,它稱之為(wei)"人(ren)工(gong)智(zhi)能綠屏",允許用(yong)戶輸入文字提示,然(ran)后(hou)軟件會生成一個(ge)圖(tu)像(xiang)。這張圖(tu)片(pian)隨(sui)后(hou)可(ke)以作為(wei)視(shi)(shi)頻(pin)的(de)背景--對創作者來說可(ke)能是一個(ge)非常有用(yong)的(de)工(gong)具。

與Google的(de)(de)Imagen、OpenAI的(de)(de)DALL-E 2或(huo)(huo)Midjourney的(de)(de)同名軟件等最先進(jin)的(de)(de)文本到圖(tu)像模型相(xiang)比,TikTok系統(tong)的(de)(de)輸出相(xiang)當(dang)基本。它只創建了相(xiang)當(dang)抽象(xiang)的(de)(de)圖(tu)像;TikTok建議的(de)(de)提示如"海洋中的(de)(de)宇航(hang)員"和(he)"鮮花星系"的(de)(de)案例就反映了這(zhe)一做法(fa)。相(xiang)比之下,其他(ta)模型既能產(chan)生逼真的(de)(de)圖(tu)像,也能產(chan)生復雜而連貫的(de)(de)插圖(tu),看起(qi)來像是人(ren)類繪制或(huo)(huo)畫的(de)(de)。

不過(guo),TikTok模型(xing)的(de)(de)(de)(de)局限性很可能(neng)是故意的(de)(de)(de)(de)。首先,更先進的(de)(de)(de)(de)模型(xing)需要更強的(de)(de)(de)(de)計(ji)算能(neng)力(li),對該(gai)公司來說,這將是昂貴和資源密集型(xing)的(de)(de)(de)(de)實施。其次,TikTok有超過(guo)10億(yi)的(de)(de)(de)(de)用(yong)戶(hu),讓所有這些人有能(neng)力(li)創造(zao)他們能(neng)想(xiang)象的(de)(de)(de)(de)任(ren)何東(dong)西(xi)的(de)(de)(de)(de)逼真圖像(xiang),幾乎能(neng)夠肯定又會讓一(yi)些人產生(sheng)一(yi)些不安的(de)(de)(de)(de)想(xiang)法。
在媒(mei)體測(ce)試其(qi)模(mo)(mo)型(xing)創造(zao)裸體和血腥的(de)能力時,文本到圖像(xiang)生成器往往會對(dui)這兩種來(lai)自用戶的(de)意(yi)圖施加限制。該模(mo)(mo)型(xing)輸出的(de)抽象性(xing)質(zhi)意(yi)味(wei)著帶有挑釁性(xing)語言(yan)的(de)提示(shi)只(zhi)能產(chan)生一些(xie)無(wu)意(yi)義的(de)漩渦(wo)。
同樣,涉及(ji)裸(luo)體(ti)的要求只產生了一(yi)些合適的顏(yan)色(se),但不會有什么讓(rang)人臉紅(hong)的內容出現。
TikTok的"人(ren)工智能(neng)綠屏(ping)"的出現值得(de)注意的是(shi),它(ta)顯(xian)示了(le)這項(xiang)(xiang)技術(shu)進入(ru)主流的速度正不斷提(ti)升。文本到圖像(xiang)的人(ren)工智能(neng)的最新發(fa)展(zhan)周期可以說始于2021年,OpenAI最初(chu)發(fa)布了(le)DALL-E。不到兩年后,這項(xiang)(xiang)技術(shu)已經通過TikTok這樣的應用程序進入(ru)了(le)數百萬人(ren)的手中。

