AI詐騙現在有多兇猛?
這兩天(tian),一條#AI詐騙成功率(lv)接(jie)近100%#的詞條直沖微博熱搜。

點進(jin)去一看,原來是福建一家科技(ji)公(gong)司的法(fa)人代表在10分鐘內就被騙(pian)走了430萬(wan)元……
怎么騙的?
“好(hao)友”通過(guo)微(wei)信視頻聯系到他,說自(zi)己的朋友在外(wai)地競標(biao),需(xu)要(yao)430萬保證金,且需(xu)要(yao)公對公賬(zhang)戶過(guo)賬(zhang),就想要(yao)借(jie)他公司的賬(zhang)戶走一下。
基于視頻聊天信(xin)任的前提下,他在收到轉賬截圖后(hou)沒有核實錢款到賬就立馬“轉回去”430萬元。
轉(zhuan)完之后(hou),他主(zhu)動給好友發微信告(gao)知卻收到了一個問(wen)號,這(zhe)才恍然大(da)悟:
中(zhong)了AI的高(gao)端大(da)計,一點都沒看出來(lai)“朋友”的臉和聲音(yin)都是假的。
無獨有偶,就在不久之前,國外也發生了一起和AI相關的詐騙:
有團(tuan)伙以“YouTube團(tuan)隊(dui)”之名向一些YouTube博主們發(fa)送了一封(feng)電子郵(you)件(jian),文中給了一個谷(gu)歌(ge)云盤鏈接(jie),要大(da)家下載PDF獲悉平(ping)臺一項新政策(ce)的細則(跟大(da)伙兒都比較(jiao)相關)。
一般看到這兒(er),警惕心強的人(ren)可能(neng)還不(bu)為(wei)所動。
但郵(you)件中卻附有堂堂谷(gu)歌CEO皮查伊“親(qin)自(zi)現身”說明的視頻,這立馬就打消了不少(shao)人最后(hou)的提防之心。

他們迅速點擊(ji)鼠標下(xia)好(hao)了文(wen)件,卻(que)全然不(bu)知,這(zhe)個(ge)文(wen)件表面看起來是(shi)一個(ge)PDF,打開之后確(que)實也(ye)是(shi)講(jiang)的(de)新規(gui)則細節,實際卻(que)是(shi)一個(ge)高度偽(wei)裝的(de)病毒,可以直接(jie)獲取瀏(liu)覽器的(de)cookie信息、保(bao)存的(de)密碼等,非常(chang)危險。
可以看到,在這兩起事件之中,深度偽造技(ji)術deepfake都(dou)在其中起到了非常關鍵(jian)的作(zuo)用。
提起(qi)這項(xiang)已誕生(sheng)了6年(nian)之(zhi)久的換臉大(da)法,不少人可能(neng)都(dou)對它有些“見怪不怪”了。
但如上所見(jian),相關詐騙案件或大或小,并沒有削弱(ruo)之勢。
相反,如今隨著AIGC技術(shu)的大爆發,普通人接觸到各種(zhong)先(xian)進生成工(gong)具變(bian)得不(bu)費(fei)吹灰(hui)之力,制作出(chu)越發難(nan)以識別的高質量deepfake視頻(pin)也越來越容(rong)易,我(wo)們想要一眼(yan)識破(po)出(chu)來這些造假內容(rong)就更(geng)加困(kun)難(nan)。

人臉識別(bie)在金融(rong)行業應(ying)用(yong)非常普遍,金融(rong)行業也因此最為重視防深偽攻擊(ji)。
而且隨(sui)著大(da)模型驅動的(de)AI新技術躍遷,這種(zhong)潛在的(de)威脅和危害越(yue)來(lai)越(yue)顯著。
但實際上(shang),應對deepfake其實早已有比較(jiao)成(cheng)熟(shu)的技(ji)術方(fang)法和方(fang)案。
源自百度(du)的金融科技(ji)公司度(du)小(xiao)滿在(zai)deepfake應對方法已經積累了豐富的經驗。
今天,我(wo)們(men)(men)或許可以再次重溫與盤(pan)點它們(men)(men)的(de)破(po)解之道,來給未來的(de)防深偽工作指明方向(xiang)。
金融領域防深偽,人臉是第一步
如度(du)小(xiao)滿(man)(man)數(shu)據(ju)智能部總經理、度(du)小(xiao)滿(man)(man)技術委員會(hui)執行主(zhu)席楊青所說:
金(jin)融領域的AI防(fang)深偽,應該(gai)針對整個閉環、每個節(jie)點的安全性進行鞏(gong)固和創新。
但第一(yi)步就是從(cong)deepfake這種技術的單(dan)點突破開始。
在金融行業,由deepfake產(chan)生的(de)主要(yao)欺(qi)詐行為就是(shi)身(shen)份欺(qi)詐,也就是(shi)通過深度偽造的(de)虛假圖(tu)像和視頻(pin),來冒充他人身(shen)份,騙過金融信貸(dai)流程(cheng)中的(de)身(shen)份核驗(yan)系(xi)統(包括活體檢測(ce))。

不法分子的欺(qi)詐(zha)方法其實也很簡單,就(jiu)是先通過(guo)劫(jie)持(chi)root或者緩存文(wen)件注入等形式劫(jie)持(chi)你手機(ji)的攝像頭(tou),不讓它進行真實采集。
然后上傳(chuan)提(ti)前(qian)準備好的(de)虛(xu)假證(zheng)件信息(或經過(guo)篡(cuan)改處(chu)理(li),或直接從(cong)黑產(chan)處(chu)購買(mai))和通過(guo)深偽技術(shu)/AIGC技術(shu)生成的(de)人臉樣(yang)本了(le)。
如果系統恰好沒有檢測出來,盜刷和惡意注冊就可能隨(sui)之而來,給金融機構和(he)用戶造成不(bu)易挽(wan)回的(de)經濟損失(shi)。

度(du)小滿介紹,近些年(nian),隨(sui)著deepfake技術(shu)(shu)的(de)(de)不斷成(cheng)熟(shu),以及圖像視頻(pin)生成(cheng)技術(shu)(shu)的(de)(de)流(liu)行,這種利用(yong)深(shen)偽技術(shu)(shu)繞過人臉識別流(liu)程的(de)(de)趨勢有所(suo)增長,對金融機(ji)構一(yi)直(zhi)以來使(shi)用(yong)的(de)(de)實名(ming)認證系統造(zao)成(cheng)了一(yi)定(ding)的(de)(de)威脅。
數據顯示,國內主要金融機構及互聯網公司應用的人臉驗證流程,70%以上存在被繞過的風險。
在全球(qiu)范圍內,也有快接近一半(46%)的企業遭受過合(he)成身份的欺詐(zha),有高達(da)90%的受訪企業認為這種行為已日(ri)益嚴重(zhong)。

在應對方式(shi)上,除了直接(jie)切斷不(bu)法分子對手(shou)機系統(tong)權限(xian)進行篡(cuan)改(gai)的能力,就是去(qu)識別認證(zheng)內(nei)容是否(fou)造(zao)假。
對(dui)于后(hou)者來說,傳統(tong)的人工(gong)審核靠一(yi)些辨(bian)認技巧(qiao)可以識(shi)別出部(bu)分deepfake內容,比如(ru)看面部(bu)輪(lun)廓(kuo)流暢度、唇形一(yi)致性等。
但隨(sui)著deepfake技術替換本領越來越高超,再怎么訓練有素(su)的眼睛(jing)也(ye)難以識別(bie)出(chu)其中破綻。
就比如下面這組,你能一眼看出來哪個是真嗎?

再者(zhe),人(ren)工(gong)審核方(fang)式的(de)效率也很低,人(ren)工(gong)費更是高昂。
所(suo)謂“解鈴還須系鈴人”,最好的(de)辦(ban)法還是交給AI去辦(ban)。
事實上,在deepfake技術出(chu)來(lai)不久(jiu)之(zhi)后,各(ge)種“反deepfake”檢(jian)測(ce)算法就(jiu)陸續被技術大佬們研發出(chu)來(lai)了,貫徹的(de)就(jiu)是“你(ni)在前面飛,我在后面追”的(de)思想。
大(da)家能夠感(gan)(gan)受(shou)到(dao),在各種金融App中實際的(de)身份驗證環節中,我們只用幾(ji)秒鐘的(de)時間就(jiu)能完成刷(shua)臉(lian)、活(huo)體檢測(ce)、登錄等(deng)一系列操(cao)作,檢測(ce)過程完全(quan)無感(gan)(gan)。
這是因為防深偽模型經過了海量的樣本比對學習,“閱盡千帆”,哪怕只是細微到一個像素級的破綻也能迅速被它抓到。
除了實時識別(bie)和超高準(zhun)確度,這種(zhong)方法的價值相比人工審核,還體(ti)現在能夠非常方便地進(jin)行持續優化上。
那么,下面就以度小滿為例,來看看防深(shen)偽檢測模型具體是如何識別的。
三大細節入手,破解造假視頻
度(du)小滿防深偽攻擊的算法策略主要從三個方(fang)面的破(po)綻入手。
首先是生成瑕疵。
具(ju)體(ti)而言,由于(yu)相關訓練數據的缺失,deepfake模(mo)型可能缺乏(fa)一些生理常識,導致無法正(zheng)確(que)渲染部分人類面部特(te)征(zheng)。
問題(ti)小到(dao)(dao)眨眼頻率不(bu)(bu)正常、瞳孔(kong)形狀(zhuang)不(bu)(bu)規(gui)則(ze)、牙齒有缺(que)陷,大到(dao)(dao)口型與聲音不(bu)(bu)吻合,肢體動作與演講內(nei)容(rong)不(bu)(bu)協調……


在檢測模型中,我們將這(zhe)些“基(ji)本肉眼可(ke)見”的(de)特征都(dou)提(ti)取出來,設計(ji)特定的(de)分(fen)析(xi)算子,就可(ke)以進行分(fen)析(xi)研判(pan)。
其次是固有屬性。這(zhe)指的是生成工具、攝(she)像頭光感元件(jian)固有的噪聲(sheng)指紋。
不(bu)同攝像機擁有不(bu)同的設備指(zhi)紋(wen)就(jiu)不(bu)多(duo)說了,像GAN這種模型在生成(cheng)人臉時也會(hui)留(liu)下獨特的用(yong)于識(shi)別生成(cheng)器(qi)的指(zhi)紋(wen),所以我們經過對比就(jiu)能(neng)發現端倪。

不(bu)過需要注(zhu)意(yi),實際情況中,一些deepfake視頻可能被壓縮導致圖像被強降噪(zao),所以(yi)像該網絡(luo)對固(gu)有屬性的微觀紋理分析就不(bu)管用(yong)了。
沒關系,我們還可(ke)以追究第三個細節:高層(ceng)語(yu)義。
它指的(de)是檢測(ce)面部動(dong)作單元(肌肉群)協(xie)調性、面部各區域朝向一致性、視頻微(wei)觀連(lian)續性(如下圖右產(chan)生(sheng)的(de)細(xi)微(wei)抖(dou)動(dong))等方面的(de)問(wen)題,由于這些細(xi)節建模困(kun)難(nan)、難(nan)以復制,很容易(yi)抓(zhua)到把柄。

毫無(wu)疑問,由于單一特征(zheng)難(nan)以適應復雜的deepfake內容,因此(ci)(ci)檢測模型的整體框架采用(yong)的是多(duo)特征(zheng)融合,以此(ci)(ci)來保證決(jue)策的魯棒性。
一般來說,行業各家公(gong)司在(zai)破解deepfake視(shi)頻上采取的思路(lu)和以上所講差別不大,但度小滿還是(shi)在(zai)數(shu)據(ju)樣本(ben)優勢之外(wai),融(rong)入了(le)自己的獨創點(dian),包(bao)括:
神經網絡搜索(suo)調(diao)優算法(fa)、微表情分(fen)析和圖卷積(ji)(GCN)技術(shu)以及基于重(zhong)建的(de)自監督預訓練方法(fa),讓(rang)模型(xing)實現(xian)了從“鑒偽”到“鑒真”的(de)轉變。

也正因(yin)此,去年(nian)9月,度小滿(man)防深偽(wei)檢(jian)測(ce)模型順利通過了信通院人(ren)臉識別安(an)全(quan)專(zhuan)項(xiang)評測(ce),獲得(de)活體檢(jian)測(ce)安(an)全(quan)防護(hu)能(neng)力優秀級認證。
具體效果上,它(ta)可以(yi)做到覆蓋各種深偽形式(shi),包(bao)含靜態人像(xiang)圖片活化、AI換臉(lian)、人臉(lian)虛假合成等,達到千分之一誤(wu)報率(lv)下召(zhao)回90%以(yi)上,也就是99%+的準確率(lv)。

像咱們開頭所(suo)提(ti)的(de)谷歌CEO皮查伊偽(wei)造視(shi)頻,之(zhi)前(qian)微博(bo)上紅極一時的(de)“馬一龍”,度小滿(man)都能輕松識破:


值得(de)注意(yi)(yi)的是,楊青表示,在(zai)模型的實際測試中(zhong),其實還是遇(yu)到一些出其不意(yi)(yi)的攻擊(ji)手段,比(bi)如經過對抗攻擊(ji)干(gan)擾(rao)的高糊視頻、3D頭模等。
對此,度小滿(man)的(de)總體(ti)解決策(ce)略是具體(ti)問題具體(ti)分析(xi),即:
每遇(yu)到一個新的(de)(de)case,就專門構去建一個單獨(du)的(de)(de)網絡結(jie)構算法(fa)來解(jie)決,如果發現對應(ying)情況增多后,就合并到通(tong)用的(de)(de)主體網絡結(jie)構中。
由此恰(qia)到好處地解決了各(ge)種(zhong)問題。
AIGC技術爆發帶來的新挑戰
我們觀察到,就在(zai)最近幾個月,網上又(you)涌現(xian)出了一大(da)批號稱免(mian)費、甚至能在(zai)一秒、三(san)次點擊(ji)以內就實現(xian)任(ren)意換臉的(de)新(xin)deepfake工具(ju),不限(xian)于圖片、視頻甚至是直播場景,效果也實在(zai)令人稱贊(zan)。
這(zhe)也意味著,普(pu)通(tong)人乃(nai)至不法分子接觸到這(zhe)種技術(shu)的方(fang)式越來越簡(jian)單了(le)。

隨著諸如此類“亦(yi)正(zheng)亦(yi)邪”的更多(duo)(duo)工具上線,可以想象,金融乃至其他行業以后(hou)要應(ying)對的偽造攻擊,將(jiang)會有多(duo)(duo)么多(duo)(duo)種多(duo)(duo)樣(yang)。
值得注意的(de)是,這類新造假(jia)內(nei)容其(qi)實給防(fang)深偽(wei)技術也帶來(lai)了全(quan)新的(de)挑戰。
因為它們持有的是一些完(wan)(wan)全不(bu)同的新特(te)征,目(mu)前(qian)已(yi)完(wan)(wan)備的“打假”方法其實是有些力不(bu)從(cong)心。
那么,我們應該怎么辦?
對(dui)此,度小滿從細(xi)處(chu)著手,給(gei)出了一些自己(ji)的觀(guan)點:
未來更多的鑒偽技術應該集中去挖掘語義特征、跨模態特征等,讓模型利用可解釋性強的高層語義去鑒偽。