AI詐騙現在有多兇猛?
這兩天,一條(tiao)#AI詐騙成功率(lv)接近100%#的詞條(tiao)直沖微博熱搜(sou)。
點進(jin)去一(yi)看,原來是福建一(yi)家(jia)科技公司的法人代(dai)表在10分(fen)鐘(zhong)內就被(bei)騙走了430萬元……
怎么騙的?
“好(hao)友”通過微信(xin)視頻(pin)聯(lian)系到他,說自己的(de)朋(peng)友在(zai)外地競標,需要(yao)430萬保證金,且需要(yao)公對公賬戶(hu)過賬,就想要(yao)借(jie)他公司的(de)賬戶(hu)走(zou)一下。
基于(yu)視(shi)頻(pin)聊天信任的前提下,他(ta)在收到轉賬截圖后沒(mei)有(you)核(he)實錢款到賬就立馬“轉回去”430萬元。
轉完之后,他(ta)主動給好友發(fa)微(wei)信告(gao)知卻收(shou)到了一個問號,這才(cai)恍然大悟:
中(zhong)了AI的(de)高端大計,一(yi)點都沒看出來“朋友”的(de)臉(lian)和聲音都是假的(de)。
無獨有偶,就在不久之前,國外也發生了一起和AI相關的詐騙:
有團伙(huo)以“YouTube團隊”之名向(xiang)一些(xie)YouTube博主們發送了一封電(dian)子郵件,文中給了一個谷歌云盤鏈(lian)接,要大家下載PDF獲悉平臺一項新政(zheng)策(ce)的細則(ze)(跟大伙(huo)兒都比較相關)。
一般看到這兒,警惕心強(qiang)的人可能還不為所動(dong)。
但郵件中卻附有堂(tang)堂(tang)谷(gu)歌CEO皮查(cha)伊“親(qin)自現身”說明(ming)的視頻,這立馬就打(da)消了不(bu)少人(ren)最后的提防之心。
他們迅速(su)點(dian)擊(ji)鼠標下好了文(wen)件,卻全然(ran)不知(zhi),這個(ge)文(wen)件表面看起來(lai)是(shi)一(yi)個(ge)PDF,打(da)開(kai)之(zhi)后確實也是(shi)講的新規則(ze)細節(jie),實際卻是(shi)一(yi)個(ge)高度(du)偽裝(zhuang)的病毒,可以直接獲取瀏覽(lan)器的cookie信息、保存的密(mi)碼等,非常危險。
可以(yi)看到,在(zai)這(zhe)兩(liang)起事件之中(zhong)(zhong),深度(du)偽造技術deepfake都(dou)在(zai)其中(zhong)(zhong)起到了非常關鍵的作用。
提起這項已誕生了(le)6年之(zhi)久(jiu)的換臉大(da)法,不少人可(ke)能都對(dui)它有些“見怪不怪”了(le)。
但如上所見,相關詐騙(pian)案件或大或小,并沒有削弱之勢。
相反,如今隨(sui)著(zhu)AIGC技(ji)術的大(da)爆發,普通人接觸到各種先進生成工具變(bian)得不(bu)費(fei)吹灰之力,制作出越(yue)發難以識(shi)別的高質量deepfake視頻(pin)也(ye)越(yue)來越(yue)容易,我(wo)們(men)想要一眼識(shi)破出來這些造假內容就(jiu)更加困難。
人(ren)臉識別在金(jin)融行(xing)業應用非常普遍,金(jin)融行(xing)業也(ye)因此(ci)最(zui)為重視防(fang)深偽攻擊(ji)。
而(er)且隨著大模型(xing)驅(qu)動的(de)AI新技術躍遷,這(zhe)種潛在的(de)威脅和危(wei)害(hai)越來越顯著。
但(dan)實(shi)際上,應對deepfake其實(shi)早(zao)已(yi)有比較成熟的(de)技(ji)術方(fang)法和方(fang)案(an)。
源自百度(du)的(de)金融科技(ji)公司(si)度(du)小滿在(zai)deepfake應對方法已經積累了豐富的(de)經驗。
今天,我們或許(xu)可以再次重溫與(yu)盤點它(ta)們的(de)破(po)解(jie)之道,來給未來的(de)防深偽工作指明方向。
金融領域防深偽,人臉是第一步
如度小(xiao)滿(man)數據智能部總經理、度小(xiao)滿(man)技術委員會執行主席楊青(qing)所說:
金(jin)融領(ling)域的AI防深(shen)偽,應該針對整個閉環、每個節(jie)點(dian)的安全性進行鞏固和創新。
但(dan)第一步就是從deepfake這種(zhong)技術的(de)單點(dian)突破開始(shi)。
在金(jin)融行業,由deepfake產生的(de)主要(yao)欺詐行為就是身(shen)份欺詐,也就是通過深(shen)度偽(wei)造的(de)虛(xu)假圖像(xiang)和視(shi)頻,來冒充他人身(shen)份,騙過金(jin)融信貸(dai)流(liu)程中(zhong)的(de)身(shen)份核驗(yan)系統(包括活體(ti)檢(jian)測)。
不法(fa)分子的(de)欺詐方法(fa)其實(shi)也很簡單,就是先通過劫持(chi)root或者(zhe)緩存文件注入等(deng)形式劫持(chi)你手(shou)機的(de)攝像頭,不讓它進行(xing)真實(shi)采集。
然(ran)后上傳提(ti)前準備(bei)好的虛假證件信息(或(huo)經過(guo)篡改(gai)處理,或(huo)直接從黑產處購買)和通過(guo)深偽技術/AIGC技術生(sheng)成的人臉樣本了。
如果系統恰好沒有檢測出來,盜刷和惡意注冊就可能(neng)隨(sui)之而(er)來(lai),給金融(rong)機構和(he)用戶造成不易(yi)挽回的經(jing)濟(ji)損失。
度小滿介紹,近些年,隨著deepfake技(ji)(ji)術(shu)的不斷成(cheng)熟,以及圖(tu)像(xiang)視頻生成(cheng)技(ji)(ji)術(shu)的流行,這種利用深偽技(ji)(ji)術(shu)繞過人臉識別(bie)流程的趨(qu)勢有所(suo)增長,對金融(rong)機構(gou)一直以來使用的實名認(ren)證系統造成(cheng)了(le)一定的威脅。
數據顯示,國內主要金融機構及互聯網公司應用的人臉驗證流程,70%以上存在被繞過的風險。
在全球范圍內,也有快接近(jin)一(yi)半(46%)的(de)(de)企業遭受過合成(cheng)身份的(de)(de)欺詐,有高達90%的(de)(de)受訪企業認為(wei)這種行為(wei)已日益嚴重。
在應對方式上,除了(le)直接切斷不法分子對手(shou)機系統權限進(jin)行(xing)篡改的能力,就是去識別(bie)認證內容是否造假(jia)。
對于后(hou)者來說,傳統的人工審核(he)靠(kao)一些辨認技巧可以識別出部分(fen)deepfake內容,比如看面部輪(lun)廓流暢(chang)度、唇形一致(zhi)性等(deng)。
但隨(sui)著deepfake技術替換本領越來越高(gao)超,再怎么訓練(lian)有素的眼(yan)睛也(ye)難以識別出其中破綻。
就比如下面這組,你能一眼看出來哪個是真嗎?
再者,人(ren)工審核方式的效(xiao)率也很低,人(ren)工費更是高昂。
所謂“解鈴還須系鈴人”,最好的辦法(fa)還是(shi)交給AI去(qu)辦。
事實上,在deepfake技(ji)術(shu)出(chu)來(lai)不久之后,各種“反(fan)deepfake”檢測算法(fa)就陸續(xu)被技(ji)術(shu)大佬們研發出(chu)來(lai)了,貫徹的就是(shi)“你在前面(mian)飛(fei),我在后面(mian)追”的思(si)想。
大家(jia)能夠感(gan)受到,在各種金(jin)融(rong)App中實際的身份驗證環節中,我們只用幾秒(miao)鐘的時間就能完(wan)(wan)成(cheng)刷(shua)臉、活體(ti)檢(jian)測、登錄等一系列操作,檢(jian)測過程(cheng)完(wan)(wan)全無感(gan)。
這是因為防深偽模型經過了海量的樣本比對學習,“閱盡千帆”,哪怕只是細微到一個像素級的破綻也能迅速被它抓到。
除了(le)實時(shi)識別和超高準確度,這種方(fang)法的價(jia)值相比人(ren)工審(shen)核,還體現在能夠非常(chang)方(fang)便地進行(xing)持(chi)續優化上。
那么,下面(mian)就以度小滿為例,來(lai)看看防深偽檢測模型具體是如何識別的。
三大細節入手,破解造假視頻
度小滿防深偽攻擊的(de)(de)算法策略主要(yao)從三個方面的(de)(de)破綻入手。
首先是生成瑕疵。
具(ju)體而言,由于相關訓(xun)練數據的缺失,deepfake模型(xing)可(ke)能缺乏一些(xie)生理常識,導致無(wu)法正確(que)渲染部分人類面部特(te)征。
問題小到眨眼(yan)頻率不(bu)正常、瞳孔形狀不(bu)規(gui)則(ze)、牙(ya)齒有缺陷(xian),大到口型與聲音(yin)不(bu)吻(wen)合(he),肢體動作與演(yan)講內容不(bu)協調……
在檢(jian)測(ce)模型中,我們(men)將(jiang)這些(xie)“基本肉眼可見”的(de)(de)特(te)征都提取出來,設計特(te)定的(de)(de)分(fen)析(xi)算子,就可以(yi)進行分(fen)析(xi)研(yan)判。
其次是固有屬性。這指的(de)是生成工具(ju)、攝像頭光感(gan)元件固有的(de)噪聲指紋。
不同(tong)攝像機擁有(you)不同(tong)的(de)設備指紋(wen)就(jiu)不多說了,像GAN這種模型在生成人臉時也會留下獨(du)特的(de)用于識別生成器的(de)指紋(wen),所以我(wo)們經過對(dui)比就(jiu)能發現端倪(ni)。
不過需要注意(yi),實(shi)際情況中,一些deepfake視頻可(ke)能被(bei)壓縮導致圖像被(bei)強降噪,所以像該網絡對固有屬性(xing)的微觀紋理(li)分析就不管用了。
沒關系,我(wo)們還可以追究第三個(ge)細節(jie):高層語義。
它指的(de)是檢測面部動作單元(yuan)(肌肉群)協調性(xing)、面部各區(qu)域朝(chao)向一(yi)致性(xing)、視頻微觀連續性(xing)(如(ru)下圖右(you)產生(sheng)的(de)細(xi)微抖(dou)動)等(deng)方面的(de)問(wen)題,由于這些細(xi)節(jie)建模(mo)困難(nan)、難(nan)以(yi)復制,很容易抓(zhua)到把柄。
毫無(wu)疑問,由于(yu)單一特征(zheng)(zheng)難以適應(ying)復雜的(de)(de)deepfake內容,因此(ci)檢測模型的(de)(de)整體框架(jia)采用的(de)(de)是多特征(zheng)(zheng)融合,以此(ci)來保證決策的(de)(de)魯棒性(xing)。
一(yi)般來說,行業各家公司在(zai)破(po)解deepfake視頻上(shang)采取的思路(lu)和以(yi)上(shang)所講差別不大(da),但度小滿還是在(zai)數據樣本優勢之外,融入(ru)了(le)自己的獨創點,包括:
神(shen)經網絡搜索(suo)調優算法(fa)、微表(biao)情分(fen)析和圖卷(juan)積(GCN)技術以及基于重建的自(zi)監(jian)督預訓(xun)練方法(fa),讓(rang)模型實現了從“鑒偽”到“鑒真”的轉變。
也正因此,去(qu)年(nian)9月,度小滿(man)防(fang)深偽檢測模型順利通(tong)過了(le)信通(tong)院人臉(lian)識(shi)別安(an)全專(zhuan)項評測,獲得活體(ti)檢測安(an)全防(fang)護能力優秀級認(ren)證。
具(ju)體效果(guo)上,它可以做到覆蓋各(ge)種深(shen)偽形式,包(bao)含靜態人(ren)像圖片(pian)活化(hua)、AI換(huan)臉(lian)、人(ren)臉(lian)虛假合成等,達到千分之(zhi)一誤報率下召回(hui)90%以上,也就是99%+的準確(que)率。
像咱(zan)們開頭所提的谷(gu)歌CEO皮查伊偽造視頻,之前微博上紅極一時的“馬(ma)一龍”,度(du)小滿都能輕松識(shi)破:
值得注意的(de)(de)(de)是,楊青表(biao)示(shi),在模型的(de)(de)(de)實際測試中,其(qi)實還(huan)是遇到一些出(chu)其(qi)不意的(de)(de)(de)攻(gong)(gong)擊手段,比如經過對抗攻(gong)(gong)擊干擾(rao)的(de)(de)(de)高糊視頻、3D頭模等(deng)。
對(dui)此,度小(xiao)滿的總體解決策(ce)略是(shi)具體問題具體分析,即:
每(mei)遇到一個新(xin)的case,就專門構去建一個單獨(du)的網(wang)絡結構算法來解決,如果(guo)發(fa)現對應情況增多后,就合并(bing)到通用的主體網(wang)絡結構中。
由(you)此恰到好處地解決了(le)各種(zhong)問題。
AIGC技術爆發帶來的新挑戰
我們觀察到,就在(zai)最近幾個月,網上又涌現(xian)(xian)出了一(yi)(yi)大批號稱免費、甚(shen)至(zhi)(zhi)能在(zai)一(yi)(yi)秒、三(san)次(ci)點擊以內就實(shi)現(xian)(xian)任意(yi)換臉的新deepfake工具,不限于圖片、視頻甚(shen)至(zhi)(zhi)是直播場景,效果也實(shi)在(zai)令人稱贊。
這也意味著,普通(tong)人乃至不法(fa)分子(zi)接(jie)觸到這種技術的(de)方式越來越簡單了。
隨著諸如此(ci)類“亦正亦邪”的更多(duo)(duo)工具(ju)上(shang)線,可(ke)以想象(xiang),金融乃至其他行(xing)業以后(hou)要應對(dui)的偽造攻擊,將會有多(duo)(duo)么多(duo)(duo)種多(duo)(duo)樣。
值得(de)注意的是,這類新造假內容其實(shi)給防深偽技(ji)術也帶來了(le)全(quan)新的挑(tiao)戰(zhan)。
因為它們持有的(de)是(shi)一些完全(quan)不同的(de)新特征(zheng),目前已完備的(de)“打假”方(fang)法(fa)其(qi)實是(shi)有些力不從心。
那么,我們應該(gai)怎么辦?
對此(ci),度小滿從細處著(zhu)手,給出了一些自己的觀點:
未來更多的鑒偽技術應該集中去挖掘語義特征、跨模態特征等,讓模型利用可解釋性強的高層語義去鑒偽。