進入2022年,智能制(zhi)造(zao)成為政府“兩會”中(zhong)的熱詞。
一(yi)(yi)方面,國(guo)家發(fa)改委、工業(ye)部、科技部等八部門發(fa)布(bu)了關于(yu)印(yin)發(fa)《“十四五”智(zhi)能(neng)(neng)制(zhi)造發(fa)展規劃》的(de)(de)通知,提(ti)出國(guo)家級(ji)的(de)(de)頂層設計(ji);另(ling)一(yi)(yi)方面,各地方政府,如(ru)北上廣深等一(yi)(yi)線城市,都已經出臺相應政策細則,為推進(jin)智(zhi)能(neng)(neng)制(zhi)造提(ti)供(gong)制(zhi)度保障。
而(er)在(zai)實現智能制造、推動(dong)產業升級過程中(zhong),機(ji)器(qi)視覺作(zuo)為不可或缺的技術(shu),承擔起讓機(ji)械“看得(de)懂(dong)、看得(de)細、抓得(de)牢、送得(de)快”的橋(qiao)梁作(zuo)用。
換句話說,要讓機器代替人力(li),首先要給機器裝上“雙(shuang)眼”,使之能夠“看得見(jian)”,然后才能像(xiang)人一樣工作,這(zhe)就是機器視覺。
作為人工智能的一個分支,機器視覺具備人所不(bu)能擁(yong)有的優勢:精(jing)度高(gao)、可適(shi)用于危險工(gong)作環境,并且識(shi)別效率高(gao),可無間斷(duan)工(gong)作等等。實際上,機器視覺并非新事物,已經被(bei)廣泛應用在外觀檢測與識(shi)別、貨物分揀(jian)等工(gong)業流(liu)程之中。
目前的(de)機器視(shi)覺仍以2D為主(zhu),即(ji)通過攝像(xiang)(xiang)(xiang)頭拍到(dao)(dao)物體平面的(de)照(zhao)片(pian),然后通過圖像(xiang)(xiang)(xiang)分析或比對來識別物體,其局限在于只能觀測到(dao)(dao)物體平面的(de)特征,成(cheng)像(xiang)(xiang)(xiang)精度容易受照(zhao)明(ming)條件影響,因而適合一些對技術要(yao)求(qiu)不(bu)高(gao)的(de)中(zhong)低(di)端制造業。
在一些高端制(zhi)造領域(yu),例如生物(wu)科技、精密(mi)半導體等對測量精度要(yao)求(qiu)極高的(de)產業,傳統(tong)的(de)2D解決方(fang)案已經不能滿足需求(qiu),3D視覺正(zheng)逐漸(jian)崛起,成為市場新寵。

3D視覺(jue),即通過3D攝像(xiang)頭采集(ji)物體的三(san)維坐(zuo)標信息(xi),通過算法(fa)實現(xian)三(san)維立體成像(xiang)。
與2D視(shi)(shi)覺系(xi)統相比,3D視(shi)(shi)覺的優(you)勢在于,多一維度(du)的信(xin)(xin)息(xi)(xi)(xi)數據(主要(yao)是空間(jian)坐標),能(neng)滿足(zu)對體積、形狀、距離等(deng)信(xin)(xin)息(xi)(xi)(xi)測(ce)量的需要(yao)。并(bing)且,3D視(shi)(shi)覺不(bu)容易(yi)受照明條件的影響(xiang),其(qi)成像精度(du)遠(yuan)高于2D視(shi)(shi)覺,同時,其(qi)快速處理信(xin)(xin)息(xi)(xi)(xi)的能(neng)力也非(fei)2D視(shi)(shi)覺系(xi)統可比。
舉個簡單的(de)(de)(de)例子:在涉及曲面、有弧度(du)的(de)(de)(de)物體(ti)(ti)測量時,2D視(shi)覺只能拍出(chu)平(ping)面圖,很難(nan)反映出(chu)物體(ti)(ti)的(de)(de)(de)真(zhen)實情(qing)況;3D視(shi)覺拍出(chu)的(de)(de)(de)是立體(ti)(ti)圖,能呈(cheng)現出(chu)物體(ti)(ti)的(de)(de)(de)曲面、弧度(du)、深度(du)等真(zhen)實信息,對機(ji)器或者人(ren)而言(yan)更具參考(kao)價值。
隨著制(zhi)造業的(de)智能(neng)化升級,市(shi)場對于3D視覺(jue)的(de)需求(qiu)也在不斷(duan)提升。根據美國市(shi)場研究機(ji)構Grand View Research的(de)報告,到(dao)2027年,全球(qiu)3D機(ji)器(qi)視覺(jue)市(shi)場規(gui)模預計(ji)將達到(dao)34.6億美元,預測期內,市(shi)場的(de)復合年增長率預計(ji)為(wei)14.7%,是一個(ge)潛(qian)在的(de)藍海市(shi)場。
掘金志(zhi)了解到,當(dang)前3D視(shi)覺在智(zhi)能(neng)(neng)制造中的應用已從單個(ge)場景發展到整個(ge)生產(chan)(chan)線的賦能(neng)(neng),涉及(ji)定位、引導、生產(chan)(chan)、分揀、裝配(pei)等多個(ge)環節。
以(yi)智能手機生產流程為例:在(zai)2D視(shi)覺時代(dai),應用場景最為廣泛的是(shi)質檢(jian),即尺寸(cun)與(yu)缺陷檢(jian)測,涉及主板、零部(bu)件及包裝三大部(bu)分。3D視(shi)覺可以(yi)直接(jie)覆蓋這(zhe)些流程,在(zai)檢(jian)測精度、速率上(shang)更勝一籌,并且將應用拓展到(dao)上(shang)料、生產、檢(jian)測、封裝等(deng)場景,實現對原有(you)產線(xian)的智能化改造,在(zai)上(shang)下(xia)料、分揀(jian)、搬運等(deng)環節需(xu)根據產品(pin)種類的不同實時規劃并完(wan)成作業任務。
這(zhe)實際(ji)上為廠商的(de)柔性(xing)生(sheng)(sheng)產(chan)(chan)提(ti)供了(le)(le)便利。在(zai)C2M商業模式的(de)帶動下,企(qi)業需要根據用戶實時(shi)訂單來決定生(sheng)(sheng)產(chan)(chan)規(gui)模,以往(wang)的(de)機(ji)械(xie)化(hua)(hua)(hua)生(sheng)(sheng)產(chan)(chan)屬于批量生(sheng)(sheng)產(chan)(chan),柔性(xing)很弱,3D視覺提(ti)高了(le)(le)工(gong)業機(ji)器人及自動化(hua)(hua)(hua)設(she)備的(de)智能化(hua)(hua)(hua)水平,使其具備按照實際(ji)生(sheng)(sheng)產(chan)(chan)需求(qiu)來靈活(huo)變(bian)化(hua)(hua)(hua)生(sheng)(sheng)產(chan)(chan)各種產(chan)(chan)品。
例(li)如,冬奧期(qi)間大(da)火(huo)特火(huo)的冰墩(dun)墩(dun),出現了一“墩(dun)”難求的情況。那么廠商需要實時調整生(sheng)產策略(lve),靈活配置(zhi)生(sheng)產原料、生(sheng)產數(shu)量及質檢(jian)部署,多生(sheng)產“冰墩(dun)墩(dun)”,少生(sheng)產“雪(xue)容融(rong)”,整個生(sheng)產環(huan)節,都可以利用3D視覺(jue)來減少人力成本、提高(gao)生(sheng)產效(xiao)率。
因此,3D視覺與2D視覺并不簡單的是1個維度的信息差異,多一維度信息帶來的對生產模式及效率、商業模式的改變,才是其核心要義。
不(bu)過,上述例子都是理想狀態下(xia)的預設。現(xian)實情(qing)況是,3D視覺(jue)雖然具(ju)備諸多優勢(shi),但(dan)要實現(xian)廣泛應用,還有許多難題要解決。
和消費(fei)類電子(zi)不(bu)同,3D視覺(jue)在智能制造領域的應用,由于場景碎(sui)片化,顯得更為復雜(za)。
熵智科技創始人趙青在(zai)接受雷峰網(wang)采訪時曾表示,3D視覺技術的應用落地面(mian)臨兩大(da)難點:
3D視覺(jue)技術對(dui)于應用場景要有(you)強適應能力;
3D視覺技術(shu)和(he)運動規(gui)劃(hua)技術(shu)的銜接。
首先,制造業的生產場景(jing)(jing)非常(chang)復雜(za),3D視覺(jue)(jue)在實驗室中(zhong)的效果,可能在實際場景(jing)(jing)中(zhong)無法體(ti)現,這(zhe)就要求3D視覺(jue)(jue)對于應(ying)用場景(jing)(jing)具(ju)備強適應(ying)能力(li)。例如,在反光、暗黑、覆膜和遠距(ju)離等條件下是否依然可以準確(que)感知(zhi)、識別出物體(ti)。
其(qi)次,3D視(shi)覺在感知(zhi)到物(wu)體(ti)的三維信息后,需要與運動規(gui)劃技術進行銜接來完成(cheng)任務。這(zhe)又涉(she)及(ji)避碰(peng)檢測、手眼坐標轉換、節拍優化和力(li)控等技術。
但機(ji)器本身(shen)很(hen)難(nan)像(xiang)人一樣,大腦(nao)發出指令(ling)就能完成動(dong)作;機(ji)器需(xu)要對(dui)輸入的信息進(jin)行解讀,并且將指令(ling)傳送到各個部分,進(jin)而執行命令(ling)。其(qi)中一個環節出錯(cuo),就會導致任務失敗(bai)。
最后,技術本身很(hen)難(nan)通過標準化來實現(xian)對(dui)各場景的(de)(de)適配(pei),甚至在(zai)同一(yi)場景上,對(dui)技術的(de)(de)要求(qiu)都(dou)各不相(xiang)同。比如,在(zai)產(chan)品的(de)(de)缺陷(xian)(xian)檢(jian)測上,廠商的(de)(de)標準是不一(yi)樣的(de)(de),對(dui)于缺陷(xian)(xian)的(de)(de)定義也各不相(xiang)同,很(hen)難(nan)做一(yi)個標準化的(de)(de)缺陷(xian)(xian)檢(jian)測工藝。
除了場景化難題之外,3D視覺所依賴的傳(chuan)感器(主要為攝(she)像(xiang)頭(tou))也還無法實(shi)現(xian)在保(bao)證抗(kang)環(huan)境光干擾能力(li)強、測(ce)距精度高、分辨(bian)高的同時(shi),降(jiang)低(di)成本,提(ti)高性價比。
因(yin)此,目前(qian) 3D 視覺(jue)的應(ying)用主要(yao)依(yi)據(ju)使用場(chang)景和預算來(lai)選擇相(xiang)機(ji),然后根(gen)據(ju)相(xiang)機(ji)成像結(jie)果來(lai)進(jin)行定制化的算法(fa)開(kai)發。這(zhe)種成本高(gao)、周(zhou)期久的開(kai)發模(mo)式嚴重限制了 3D 視覺(jue)在實際場(chang)景中的應(ying)用。
根據(ju)中國(guo)機(ji)器視覺產業聯盟的統計,國(guo)內(nei)機(ji)器視覺行業以中小企為(wei)主(zhu),銷(xiao)售(shou)額在(zai)1億元以下的企業占據(ju)83.5%,而(er)基(ji)恩(en)士(shi)的銷(xiao)售(shou)額早已(yi)突破百億(2020年為(wei)321.61億元),相比較而(er)言,國(guo)內(nei)過億營收的企業為(wei)奧普特(2020年為(wei)6.42億元,僅為(wei)基(ji)恩(en)士(shi)的2%)。
可以說(shuo),在(zai)以2D視(shi)覺(jue)為主的機器視(shi)覺(jue)領域,全(quan)球市場已經形(xing)成基恩士和康耐視(shi)壟斷的局面,而(er)3D視(shi)覺(jue)技術(shu)的出現,被視(shi)為改變當前格局的技術(shu)推力(li)。
作為(wei)新技術,3D視覺(jue)(jue)(jue)所(suo)面(mian)臨的(de)場景化(hua)難點,是(shi)所(suo)有企業都必須解決的(de)問題。目(mu)前無論是(shi)國(guo)(guo)外的(de)基恩(en)士、康耐視,還是(shi)國(guo)(guo)內的(de)安防巨頭,如(ru)海康威視;亦或者諸(zhu)多AI視覺(jue)(jue)(jue)公司、機器視覺(jue)(jue)(jue)公司,在3D視覺(jue)(jue)(jue)技術領域,都處于同一起跑線上。
不(bu)過,相較于國外巨頭,國內企業先天性(xing)存在三個不(bu)足。
對場景的理解。
不論(lun)是(shi)基恩士,還是(shi)康耐視,都(dou)已經成(cheng)立數(shu)十年,且占(zhan)據著機(ji)器視覺(jue)的絕(jue)大部(bu)分市場(chang)(chang);多年的積累(lei)使其在探索3D視覺(jue)的應用時更具優勢(shi),許(xu)多場(chang)(chang)景難點(dian)都(dou)可以(yi)(yi)基于以(yi)(yi)往經驗做(zuo)試(shi)探,減(jian)少不必要開支。
國(guo)內企業(ye)成立時(shi)間(jian)較短(duan),對場(chang)景的理解需要(yao)一步步探索,甚至多走(zou)彎路,為(wei)此付出高(gao)昂的時(shi)間(jian)、資金(jin)成本。
缺乏硬件能力。
機器視覺的(de)主要邏(luo)輯是(shi),對(dui)收集到的(de)圖像(xiang)信息(xi)進行(xing)分析處理,智能設備根據處理的(de)信息(xi)做出(chu)相應(ying)判斷。這一過程中,鏡片以及鏡頭的(de)質量對(dui)獲取圖像(xiang)信息(xi)的(de)準確性起到非常(chang)關鍵的(de)作用。
國內(nei)多數公司以(yi)軟件(jian)算(suan)法(fa)切(qie)入,集中在應用層,缺少相(xiang)應的(de)硬件(jian)能(neng)力。國內(nei)3D視覺的(de)核(he)心相(xiang)機大部分(fen)為(wei)外購(gou),包括IDS、康耐(nai)視、基恩士、佳能(neng)等,而(er)在鏡頭方面(mian),高端市場仍為(wei)徠卡、施耐(nai)德(de)、尼康、富士等國外品牌所(suo)壟斷。
穩定的客戶群體。
對于客(ke)戶(hu)而言(yan),隨意更換合作(zuo)伙(huo)伴(ban),很容易(yi)增加試(shi)錯成本。即便是(shi)新技(ji)術,客(ke)戶(hu)也往往愿意選(xuan)擇已經有過合作(zuo)的技(ji)術供應商。顯然,國(guo)外巨頭具備絕對優勢(shi),而國(guo)內企業要發展(zhan),只(zhi)能一步(bu)一步(bu)“升(sheng)級打怪”,以技(ji)術和產品獲取用戶(hu)信任,逐漸建立起屬(shu)于自己的客(ke)戶(hu)群。
這反映出一個深(shen)刻(ke)的現實(shi):在新技術(shu)面前(qian),企業(ye)都是(shi)平等的,但(dan)老牌企業(ye)仍然可以依據自(zi)身的業(ye)務(wu)生態,對新(小(xiao))企業(ye)實(shi)施降維打擊。
因此,國內企業要追趕國外巨頭,除了技術突破以外,還需要建立起(qi)穩定(ding)的生(sheng)態圈,這(zhe)是一個漫長(chang)而艱難的過程。
結語
當前,3D視(shi)覺(jue)在消費(fei)電(dian)子上(shang)的(de)廣泛應用,對機器視(shi)覺(jue)公司產生(sheng)了(le)極強的(de)刺激(ji)效(xiao)應。智(zhi)能(neng)制造作為下一個藍海(hai)市場,越(yue)來越(yue)多的(de)企業(ye)開始探索以3D視(shi)覺(jue)來賦能(neng)企業(ye)生(sheng)產的(de)路徑。
但與消費電子不同,智能制造很難出現現象級應(ying)用,整個市(shi)場(chang)需求都是碎片化的(de),因而不可能復制前者(zhe)的(de)發展模式,企業必須在實際場(chang)景中去尋找(zhao)最佳落地解決(jue)方案。
對于國內(nei)企業(ye)(ye)而言,先天性的不足并非不可逾越的障礙(ai),需要付出比國外巨頭更多的時(shi)間和精力(li),去理解(jie)場景(jing)、鉆研技術(shu),一(yi)步一(yi)個腳印夯實基礎,然后追(zhui)趕。這不僅需要視(shi)覺(jue)公司的努力(li),也(ye)需要光學、制造(zao)業(ye)(ye)等多個產業(ye)(ye)的共(gong)同(tong)進步。