進入2022年,智能制造成為(wei)政(zheng)府“兩(liang)會(hui)”中的(de)熱(re)詞。
一方(fang)面(mian),國(guo)家發(fa)改委、工業部、科技部等(deng)八部門發(fa)布了關(guan)于印發(fa)《“十四五”智(zhi)能制造(zao)發(fa)展規(gui)劃(hua)》的(de)通知,提出國(guo)家級的(de)頂層設計;另一方(fang)面(mian),各地(di)方(fang)政(zheng)府,如(ru)北(bei)上廣深(shen)等(deng)一線(xian)城市,都已經出臺相應政(zheng)策細則,為推進(jin)智(zhi)能制造(zao)提供制度保障。
而在(zai)實(shi)現智(zhi)能制造、推動產業升級過程中,機器視覺作為不可或缺(que)的技術,承擔(dan)起讓機械“看得(de)(de)懂、看得(de)(de)細、抓得(de)(de)牢、送得(de)(de)快(kuai)”的橋梁作用。
換句話(hua)說,要讓機器代替人力,首先要給機器裝上“雙(shuang)眼”,使之能(neng)夠(gou)“看得(de)見(jian)”,然(ran)后(hou)才能(neng)像人一樣工作(zuo),這就是(shi)機器視覺。
作為人工智能的(de)一個分支,機(ji)器視覺具備人所不能擁有的(de)優勢:精(jing)度高、可(ke)適(shi)用于危(wei)險工作環(huan)境,并且識別效(xiao)率高,可(ke)無間(jian)斷工作等(deng)等(deng)。實(shi)際上,機(ji)器視覺并非新事物(wu),已經被廣(guang)泛應用在外觀(guan)檢測與識別、貨物(wu)分揀等(deng)工業流程之中。
目前的機器視覺仍(reng)以2D為主,即通過攝(she)像(xiang)頭拍(pai)到物(wu)體(ti)(ti)平面的照(zhao)片,然(ran)后通過圖像(xiang)分析或比對來識別(bie)物(wu)體(ti)(ti),其局限在于只能觀(guan)測到物(wu)體(ti)(ti)平面的特征,成(cheng)像(xiang)精度容易受照(zhao)明條件影(ying)響,因而適(shi)合一些對技術要求不高的中低端制造業(ye)。
在(zai)一些高(gao)端(duan)制(zhi)造領域(yu),例如生物科技、精密半導(dao)體等對測量精度要求(qiu)極高(gao)的產業(ye),傳統的2D解決(jue)方(fang)案已經不能滿足需(xu)求(qiu),3D視覺正逐漸(jian)崛起(qi),成為市場新寵。
3D視覺,即通過3D攝像頭采(cai)集物體的三(san)維坐標信息,通過算法實(shi)現(xian)三(san)維立體成像。
與(yu)2D視覺(jue)系(xi)統(tong)(tong)相(xiang)比,3D視覺(jue)的優勢在于,多一維度的信息(xi)數據(主要是空間坐標),能滿足對(dui)體(ti)積、形(xing)狀、距離等信息(xi)測量(liang)的需要。并且(qie),3D視覺(jue)不(bu)容易(yi)受照明條件的影(ying)響,其成像精度遠高(gao)于2D視覺(jue),同時,其快(kuai)速處(chu)理(li)信息(xi)的能力也非2D視覺(jue)系(xi)統(tong)(tong)可(ke)比。
舉個簡單的(de)例子:在涉及曲(qu)面、有弧(hu)度的(de)物體(ti)測(ce)量時,2D視(shi)(shi)覺(jue)只能拍出(chu)平面圖,很難反映出(chu)物體(ti)的(de)真實(shi)情況;3D視(shi)(shi)覺(jue)拍出(chu)的(de)是立體(ti)圖,能呈(cheng)現出(chu)物體(ti)的(de)曲(qu)面、弧(hu)度、深(shen)度等(deng)真實(shi)信息,對機(ji)器或者(zhe)人而言更具參考價(jia)值(zhi)。
隨著制(zhi)造業的(de)智(zhi)能化升級(ji),市(shi)場(chang)對(dui)于(yu)3D視(shi)覺的(de)需求(qiu)也在不斷(duan)提(ti)升。根據美(mei)國市(shi)場(chang)研究機構Grand View Research的(de)報(bao)告(gao),到2027年,全球3D機器視(shi)覺市(shi)場(chang)規(gui)模預(yu)計將(jiang)達到34.6億美(mei)元(yuan),預(yu)測期(qi)內,市(shi)場(chang)的(de)復合年增長率預(yu)計為(wei)14.7%,是一(yi)個(ge)潛在的(de)藍海(hai)市(shi)場(chang)。
掘金志(zhi)了解(jie)到(dao),當(dang)前3D視覺(jue)在智能制造中的應用已從(cong)單個(ge)場景(jing)發展到(dao)整個(ge)生產線(xian)的賦能,涉及定位、引導、生產、分揀(jian)、裝(zhuang)配等(deng)多個(ge)環節。
以智(zhi)能手機(ji)生(sheng)產(chan)(chan)流程為例:在2D視覺時代,應用(yong)場景最為廣泛的是質檢(jian)(jian),即尺(chi)寸與缺陷檢(jian)(jian)測(ce),涉及(ji)主板(ban)、零部(bu)件及(ji)包(bao)裝(zhuang)三大部(bu)分。3D視覺可以直接覆蓋(gai)這些流程,在檢(jian)(jian)測(ce)精度、速率上(shang)更勝一籌(chou),并(bing)且將應用(yong)拓展到上(shang)料(liao)、生(sheng)產(chan)(chan)、檢(jian)(jian)測(ce)、封裝(zhuang)等(deng)場景,實(shi)現對原(yuan)有產(chan)(chan)線(xian)的智(zhi)能化改造(zao),在上(shang)下(xia)料(liao)、分揀、搬運等(deng)環節需根據產(chan)(chan)品種類的不同實(shi)時規劃并(bing)完成作業(ye)任務(wu)。
這實(shi)際上為廠商的(de)柔性生產提供(gong)了(le)便利。在C2M商業模式的(de)帶(dai)動(dong)下,企(qi)業需要根據用(yong)戶實(shi)時訂單來決定生產規模,以往的(de)機械化生產屬于批量(liang)生產,柔性很(hen)弱(ruo),3D視覺提高了(le)工業機器人及自(zi)動(dong)化設(she)備的(de)智能化水平,使其具備按照實(shi)際生產需求(qiu)來靈(ling)活(huo)變化生產各種產品。
例如,冬奧期間大火特火的(de)冰(bing)墩(dun)墩(dun),出現了一“墩(dun)”難(nan)求的(de)情況。那么廠商需要(yao)實時調(diao)整(zheng)生(sheng)產(chan)策略,靈活配置生(sheng)產(chan)原料、生(sheng)產(chan)數量及質檢部(bu)署,多(duo)生(sheng)產(chan)“冰(bing)墩(dun)墩(dun)”,少生(sheng)產(chan)“雪容融(rong)”,整(zheng)個生(sheng)產(chan)環節,都可以利(li)用3D視覺(jue)來減(jian)少人力成(cheng)本(ben)、提高生(sheng)產(chan)效率。
因此,3D視覺與2D視覺并不簡單的是1個維度的信息差異,多一維度信息帶來的對生產模式及效率、商業模式的改變,才是其核心要義。
不(bu)過,上述(shu)例子都是理想狀態下的預設。現實(shi)情況是,3D視覺雖然(ran)具(ju)備諸多優勢,但要(yao)實(shi)現廣(guang)泛應用,還(huan)有許多難題要(yao)解決。
和消(xiao)費類(lei)電(dian)子不同,3D視覺在智(zhi)能制造領域的應用,由于場景碎片化(hua),顯得更(geng)為復(fu)雜。
熵智科技(ji)創始人趙青在接(jie)受雷峰網采訪時曾(ceng)表示(shi),3D視覺技(ji)術的應用落地面臨兩大難點:
3D視覺技(ji)術對于應(ying)(ying)用(yong)場景要有強適(shi)應(ying)(ying)能力;
3D視(shi)覺技(ji)術和運動規(gui)劃技(ji)術的銜接。
首先,制造業的生產場(chang)景(jing)非(fei)常復(fu)雜,3D視(shi)覺(jue)在(zai)(zai)實(shi)驗室中的效(xiao)果,可能(neng)在(zai)(zai)實(shi)際場(chang)景(jing)中無法(fa)體現,這就要求3D視(shi)覺(jue)對于應用場(chang)景(jing)具備強適應能(neng)力。例如,在(zai)(zai)反(fan)光、暗黑(hei)、覆(fu)膜和遠距離(li)等條件(jian)下是否依然可以準確感(gan)知、識別出(chu)物體。
其次,3D視覺(jue)在(zai)感知到物體(ti)的三維信息后,需要(yao)與運(yun)動規劃技術(shu)進行銜(xian)接來完(wan)成任務。這又涉及避碰檢測、手眼坐標轉(zhuan)換(huan)、節拍優化和力控等技術(shu)。
但機器(qi)本身很(hen)難(nan)像人一樣(yang),大腦發出指(zhi)令就能完(wan)成動作;機器(qi)需要對輸入的信(xin)息進行解讀,并且將(jiang)指(zhi)令傳送(song)到(dao)各(ge)個部分,進而執(zhi)行命令。其(qi)中一個環節出錯,就會導致任務失敗。
最后,技術本身很(hen)難通過標(biao)準化(hua)來實(shi)現對各(ge)場(chang)景的適配,甚至在同一場(chang)景上,對技術的要求都各(ge)不相(xiang)(xiang)同。比(bi)如,在產品的缺(que)(que)陷(xian)檢測(ce)上,廠商的標(biao)準是不一樣(yang)的,對于缺(que)(que)陷(xian)的定義也各(ge)不相(xiang)(xiang)同,很(hen)難做一個(ge)標(biao)準化(hua)的缺(que)(que)陷(xian)檢測(ce)工藝。
除(chu)了場(chang)景化難題之外,3D視覺所依賴的傳感器(qi)(主要為攝像頭)也還無法實現在保(bao)證(zheng)抗環(huan)境光(guang)干擾能力強、測距(ju)精度高(gao)、分辨高(gao)的同時,降低成本(ben),提高(gao)性(xing)價比。
因(yin)此,目(mu)前 3D 視覺(jue)的應用(yong)主要依據使用(yong)場(chang)景和預算來選(xuan)擇相(xiang)機(ji),然(ran)后根據相(xiang)機(ji)成像結(jie)果(guo)來進行定(ding)制(zhi)化的算法開發。這種成本(ben)高(gao)、周期(qi)久的開發模(mo)式嚴重(zhong)限(xian)制(zhi)了 3D 視覺(jue)在實際場(chang)景中的應用(yong)。
根據中國機器視覺產業(ye)聯盟(meng)的(de)統計(ji),國內機器視覺行業(ye)以中小(xiao)企(qi)為主,銷售額在(zai)1億元(yuan)以下的(de)企(qi)業(ye)占據83.5%,而基(ji)恩士的(de)銷售額早已突(tu)破百億(2020年為321.61億元(yuan)),相比較而言,國內過億營收(shou)的(de)企(qi)業(ye)為奧普特(2020年為6.42億元(yuan),僅(jin)為基(ji)恩士的(de)2%)。
可以(yi)(yi)說,在(zai)以(yi)(yi)2D視覺為主的(de)機器(qi)視覺領(ling)域,全(quan)球(qiu)市場已經形成基恩士和康耐視壟斷的(de)局面,而3D視覺技術的(de)出(chu)現,被視為改變當前格(ge)局的(de)技術推(tui)力(li)。
作為新技術,3D視(shi)覺(jue)(jue)所面(mian)臨的(de)場景(jing)化(hua)難點,是所有企業(ye)都必須解決的(de)問題。目前無(wu)論(lun)是國(guo)外的(de)基恩士、康(kang)耐(nai)視(shi),還是國(guo)內(nei)的(de)安防巨(ju)頭,如海康(kang)威視(shi);亦(yi)或(huo)者諸多AI視(shi)覺(jue)(jue)公司、機(ji)器視(shi)覺(jue)(jue)公司,在3D視(shi)覺(jue)(jue)技術領域(yu),都處于同(tong)一起(qi)跑線上(shang)。
不過,相較于國外巨(ju)頭(tou),國內企業(ye)先(xian)天性存(cun)在三個不足。
對場景的理解。
不論是(shi)基(ji)(ji)恩士,還是(shi)康耐視,都(dou)(dou)已經成立(li)數十年,且占據(ju)著機(ji)器視覺的(de)絕(jue)大部分市(shi)場(chang);多(duo)年的(de)積(ji)累使其在探(tan)索3D視覺的(de)應用時更(geng)具(ju)優勢(shi),許多(duo)場(chang)景(jing)難(nan)點都(dou)(dou)可(ke)以基(ji)(ji)于以往經驗做試(shi)探(tan),減少(shao)不必(bi)要開支。
國內企業成(cheng)立(li)時間較短,對場景的理解需要(yao)一步步探索,甚至多走彎路,為此付(fu)出高昂的時間、資(zi)金(jin)成(cheng)本。
缺乏硬件能力。
機器視覺的主要邏輯是,對收集到的圖(tu)像信息進行分析(xi)處理,智能設備根(gen)據處理的信息做出相應(ying)判(pan)斷(duan)。這一過程中,鏡片以及鏡頭的質量對獲取(qu)圖(tu)像信息的準確性(xing)起到非常關(guan)鍵的作用。
國(guo)(guo)(guo)內(nei)多數公司(si)以軟件算法切入(ru),集中在應用層,缺少相應的硬(ying)件能(neng)力。國(guo)(guo)(guo)內(nei)3D視覺的核(he)心相機大(da)部(bu)分為外購,包括IDS、康耐(nai)視、基恩士、佳能(neng)等,而(er)在鏡(jing)頭方(fang)面(mian),高端市場(chang)仍為徠(lai)卡、施耐(nai)德、尼康、富士等國(guo)(guo)(guo)外品牌所壟斷。
穩定的客戶群體。
對于客(ke)戶(hu)而言,隨意(yi)(yi)更換合(he)作伙伴,很容易增加試錯(cuo)成本。即便是新技(ji)術(shu),客(ke)戶(hu)也(ye)往(wang)往(wang)愿(yuan)意(yi)(yi)選擇(ze)已(yi)經有過合(he)作的(de)(de)技(ji)術(shu)供應商。顯然,國外巨(ju)頭具備絕對優勢,而國內企業要發(fa)展,只能(neng)一(yi)步(bu)一(yi)步(bu)“升級(ji)打怪”,以技(ji)術(shu)和產品獲取(qu)用戶(hu)信任,逐漸建立(li)起屬(shu)于自己的(de)(de)客(ke)戶(hu)群。
這反映出一個深刻的現實(shi)(shi):在新(xin)技術面(mian)前(qian),企(qi)業都是平等的,但老牌企(qi)業仍然可以依據自身(shen)的業務生(sheng)態,對新(xin)(小(xiao))企(qi)業實(shi)(shi)施降維打擊。
因此,國(guo)內(nei)企(qi)業要追趕國(guo)外巨頭,除(chu)了技術突破(po)以外,還需要建立起穩定的生態(tai)圈,這是一(yi)個漫長而艱難的過程。
結語
當前,3D視覺在消費電子上的(de)廣(guang)泛應(ying)用,對(dui)機器視覺公司產生了極強的(de)刺(ci)激效應(ying)。智能(neng)制造作(zuo)為下一個藍海市場,越來越多的(de)企業(ye)開始探索以3D視覺來賦能(neng)企業(ye)生產的(de)路徑。
但(dan)與消費電子不同(tong),智能制(zhi)造很(hen)難(nan)出現(xian)現(xian)象級應(ying)用(yong),整個市場(chang)需求都是(shi)碎片(pian)化的(de),因而不可能復制(zhi)前者的(de)發展模(mo)式,企業必須在實(shi)際場(chang)景中去尋找最佳落地解決(jue)方案。
對于國內企業而(er)言,先天性(xing)的(de)不足并非(fei)不可逾越的(de)障礙,需要(yao)付出(chu)比國外巨(ju)頭更多的(de)時間和精力,去理(li)解場景、鉆研技術,一步一個(ge)腳印夯(hang)實(shi)基礎(chu),然后追(zhui)趕。這不僅需要(yao)視覺公司的(de)努力,也需要(yao)光(guang)學、制造業等多個(ge)產業的(de)共同(tong)進步。