機(ji)器人(ren)(ren)作為典(dian)型的智能(neng)(neng)硬件產品(pin),在(zai)(zai)過去很長(chang)(chang)一(yi)段時間里,其(qi)商業落地(di)表現并(bing)不是那么智能(neng)(neng)。從(cong)以往傳統(tong)機(ji)器人(ren)(ren)的局限性來看,可(ke)以將其(qi)歸類為:環境感知薄弱,單模(mo)態(tai)傳感器孤立運作,缺(que)乏(fa)多模(mo)態(tai)融合算法與抗干擾硬件;交互(hu)淺層化(hua),依賴(lai)預設交互(hu)規則(ze)且只(zhi)能(neng)(neng)捕捉有限的狀態(tai),缺(que)乏(fa)語義理解與上(shang)下文(wen)記憶能(neng)(neng)力(li);本地(di)處理能(neng)(neng)力(li)有限,機(ji)器人(ren)(ren)端側算力(li)匱(kui)乏(fa)導致(zhi)部(bu)分決策(ce)延遲,無(wu)法精細處理多模(mo)態(tai)數(shu)據;決策(ce)邏輯剛性,缺(que)乏(fa)動(dong)態(tai)優化(hua)策(ce)略與實時決策(ce)能(neng)(neng)力(li)。這也(ye)就(jiu)導致(zhi)了傳統(tong)機(ji)器人(ren)(ren)在(zai)(zai)非結構化(hua)的場景(jing)中感知交互(hu)無(wu)法做得更有深度,在(zai)(zai)實踐中幾(ji)乎很難在(zai)(zai)“長(chang)(chang)尾場景(jing)”泛化(hua)應(ying)用。
隨著感(gan)知技(ji)(ji)術(shu)(shu)、運控(kong)技(ji)(ji)術(shu)(shu)、計算能(neng)(neng)力的(de)逐(zhu)步提升(sheng),以及AI模(mo)型(xing)快(kuai)速迭代并在端側加(jia)速落地,機器人行業迎來了重大變革。特別是(shi)具(ju)身智能(neng)(neng)概(gai)念(nian)興(xing)起后,眾多(duo)企業紛(fen)紛(fen)入局具(ju)身智能(neng)(neng)賽道,同時今(jin)年(nian)政策層面對(dui)具(ju)身智能(neng)(neng)概(gai)念(nian)的(de)高度關注,更(geng)標志著這一技(ji)(ji)術(shu)(shu)已成為科(ke)技(ji)(ji)競爭的(de)“關鍵領域”。
在頂層政策的助推和企業們的積極布局下,國內具身智能產業正呈現蓬勃發展之勢。具身智能機器人作為智能硬件與人工智能的(de)(de)集大成者,開始帶領機(ji)器(qi)人行業走向智(zhi)能(neng)(neng)化的(de)(de)拐(guai)點。具(ju)身(shen)智(zhi)能(neng)(neng)通過(guo)硬件(jian)智(zhi)能(neng)(neng)體與環(huan)(huan)境的(de)(de)交(jiao)(jiao)互(hu)(hu)來獲(huo)取信息、理(li)解問(wen)題、做出(chu)決策(ce)并執行行動,從而(er)展現出(chu)智(zhi)能(neng)(neng)行為(wei)和適應性。傳(chuan)統的(de)(de)人工智(zhi)能(neng)(neng)通常(chang)依(yi)賴于(yu)抽(chou)象的(de)(de)符(fu)號(hao)計算,而(er)具(ju)身(shen)智(zhi)能(neng)(neng)更強調通過(guo)物理(li)身(shen)體的(de)(de)感知、運動以及與外部(bu)環(huan)(huan)境的(de)(de)交(jiao)(jiao)互(hu)(hu)來實(shi)(shi)現認(ren)(ren)知,并基于(yu)這些(xie)認(ren)(ren)知實(shi)(shi)現高(gao)階(jie)自(zi)主智(zhi)能(neng)(neng)。
作為(wei)集(ji)前(qian)沿科學技術于(yu)一(yi)身(shen)(shen)(shen)(shen)的(de)(de)(de)(de)(de)產品,具(ju)身(shen)(shen)(shen)(shen)機器(qi)(qi)人(ren)(ren)的(de)(de)(de)(de)(de)感(gan)(gan)(gan)知(zhi)層、決策層、執行層等每一(yi)類技術框(kuang)架里都(dou)有(you)著(zhu)大量可(ke)智(zhi)(zhi)(zhi)能(neng)化的(de)(de)(de)(de)(de)空(kong)間。多模態具(ju)身(shen)(shen)(shen)(shen)感(gan)(gan)(gan)知(zhi)是傳統機器(qi)(qi)人(ren)(ren)向具(ju)身(shen)(shen)(shen)(shen)機器(qi)(qi)人(ren)(ren)升級的(de)(de)(de)(de)(de)重(zhong)要一(yi)環(huan),是具(ju)身(shen)(shen)(shen)(shen)智(zhi)(zhi)(zhi)能(neng)機器(qi)(qi)人(ren)(ren)的(de)(de)(de)(de)(de)基礎(chu)能(neng)力。具(ju)身(shen)(shen)(shen)(shen)智(zhi)(zhi)(zhi)能(neng)機器(qi)(qi)人(ren)(ren)需要一(yi)整套(tao)完整的(de)(de)(de)(de)(de)多模態具(ju)身(shen)(shen)(shen)(shen)感(gan)(gan)(gan)知(zhi)系統,通過多維度的(de)(de)(de)(de)(de)感(gan)(gan)(gan)知(zhi)數據收集(ji),帶動運動控(kong)制的(de)(de)(de)(de)(de)范式變(bian)化。
在不久前的(de)2025 MWC上海期間,移遠(yuan)通(tong)信與(yu)逐(zhu)際動力聯合(he)發(fa)布了突破性的(de)Robrain AI機(ji)(ji)器人(ren)(ren)解決方案,該(gai)方案采用創新(xin)的(de)端云(yun)協同架構及麥克風(feng)陣列拾音技術,深度融合(he)端側智能與(yu)云(yun)端大(da)模(mo)型優勢,賦予機(ji)(ji)器人(ren)(ren)接(jie)近人(ren)(ren)類的(de)“思考”與(yu)“傾聽(ting)”能力,將機(ji)(ji)器人(ren)(ren)感知能力升維成具身感知。
該方案已在逐際動力LimX Dynamics的(de)明星產品——多形態雙足機器人TRON 1上成(cheng)功落地(di),有(you)效(xiao)攻克了AI模(mo)型(xing)定(ding)制(zhi)、輕量(liang)化(hua)部署及低延遲(chi)交(jiao)互(hu)響應等關鍵挑(tiao)戰,推動機器人從“機械(xie)執行(xing)”躍升為“主動感(gan)知(zhi)、智(zhi)能思考、自(zi)然交(jiao)流”的(de)AI智(zhi)能體(ti)。
機(ji)器(qi)人(ren)的語音感知交互(hu)一(yi)直(zhi)都有(you)幾大難(nan)(nan)點,一(yi)是(shi)全(quan)向(xiang)的遠(yuan)場(chang)拾音難(nan)(nan),二是(shi)動態場(chang)景噪(zao)(zao)聲(sheng)源多,此外機(ji)器(qi)人(ren)自(zi)身運動時零部件也會產生噪(zao)(zao)聲(sheng)干擾語音抓取。Robrain AI采(cai)用先進的4/6麥克風陣列算(suan)法,通(tong)過空(kong)域濾(lv)波(bo)技術形(xing)成定向(xiang)拾音波(bo)束,能有(you)效(xiao)抑制環境噪(zao)(zao)聲(sheng),增強聲(sheng)源方位人(ren)聲(sheng),在(zai)(zai)嘈雜環境中依然能夠精準(zhun)捕(bu)捉聲(sheng)源。移遠(yuan)通(tong)信在(zai)(zai)感知層應用的ASR模型,通(tong)過大量(liang)自(zi)研(yan)的端(duan)側全(quan)鏈路(lu)語音處理算(suan)法,保證前端(duan)聲(sheng)學(xue)處理的高質量(liang),為模型的精準(zhun)識別提供了保障,賦予(yu)了機(ji)器(qi)人(ren)敏銳的“聽覺”。

在敏(min)銳感知的基礎上,如何(he)讓(rang)決策交互更有溫度,也是衡量機(ji)(ji)(ji)器(qi)(qi)人智(zhi)能(neng)(neng)化與(yu)商業價(jia)值的核心標尺(chi)。這就(jiu)需(xu)要給機(ji)(ji)(ji)器(qi)(qi)人配置具備(bei)思考推理、深度理解(jie)(jie)語義的大小腦(nao),幫助機(ji)(ji)(ji)器(qi)(qi)人真(zhen)正理解(jie)(jie)這個世界,對人類發(fa)出的指令(ling)進行(xing)拆解(jie)(jie)、邏輯推理和規劃決策。對于具身智(zhi)能(neng)(neng)機(ji)(ji)(ji)器(qi)(qi)人這一(yi)類前沿智(zhi)能(neng)(neng)硬(ying)件來說,模(mo)型(xing)技術是其(qi)愿景實現的基石,要想充分(fen)發(fa)揮出模(mo)型(xing)大腦(nao)的優(you)勢并不是那么容易。
移遠通信的Robrain AI機(ji)器人解(jie)決(jue)方案,基(ji)于對AI工程(cheng)化(hua)技術的深度適配與持續優(you)化(hua),圍繞移遠AI模(mo)(mo)組及其強大(da)算力,構(gou)建起了(le)端(duan)側(ce)與云端(duan)大(da)模(mo)(mo)型的深度協同體系。云端(duan)大(da)模(mo)(mo)型充分(fen)發(fa)揮其豐富數據(ju)儲備的優(you)勢(shi),機(ji)器人可(ke)無縫(feng)接入豆包(bao)、DeepSeek 等主流云端(duan)大(da)模(mo)(mo)型及專業搜索工具,增強深度語義理(li)(li)解(jie)與推理(li)(li)能力,解(jie)決(jue)交(jiao)互淺層化(hua)局限(xian)。
端(duan)側模型主(zhu)打本(ben)地(di)實時推(tui)理,賦予(yu)機(ji)器(qi)人毫秒(miao)級的(de)(de)響應能力和可(ke)靠的(de)(de)離線(xian)功能。無論是(shi)前進、轉向、原地(di)踏步、站起、蹲下等(deng)動作指令,還是(shi)企(qi)業(ye)專屬(shu)領(ling)域(yu)的(de)(de)專業(ye)問答(da)需求,機(ji)器(qi)人都能瞬間(jian)給出(chu)反饋(kui)。同時,該方案還支持(chi)企(qi)業(ye)定制化知識(shi)庫(ku)的(de)(de)本(ben)地(di)部署,即便處于離線(xian)狀態,機(ji)器(qi)人依然(ran)可(ke)以(yi)提(ti)供(gong)專業(ye)、準確的(de)(de)問答(da)服務。在模型效(xiao)率(lv)和精度上,針(zhen)對端(duan)側模型AI智能的(de)(de)損失,移遠通信還運用向量數據庫(ku)、RAG、模型微調(diao)等(deng)一系列技術加以(yi)補(bu)償,以(yi)提(ti)升端(duan)側的(de)(de)智能化程度。
在端側(ce)與(yu)云端大模型(xing)的(de)(de)深度協同下,Robrain AI機(ji)器(qi)人解(jie)決方案(an)在情景理解(jie)、知識融(rong)合、智能(neng)交互(hu)(hu)、快速響應(ying)上實(shi)現了明(ming)顯的(de)(de)智能(neng)化提升,這是(shi)以(yi)往弱(ruo)交互(hu)(hu)、弱(ruo)推(tui)理的(de)(de)機(ji)器(qi)人所欠缺的(de)(de),使得機(ji)器(qi)人得以(yi)在非結構化的(de)(de)場景中實(shi)現深度擬人的(de)(de)感知與(yu)交互(hu)(hu),在實(shi)踐中快速在“長(chang)尾場景”中泛化應(ying)用。

正如逐際(ji)動(dong)力(li)聯(lian)合創(chuang)始人龐博所言,“通(tong)過(guo)接(jie)入(ru)移遠通(tong)信的Robrain AI機(ji)器(qi)(qi)人解決(jue)方案,我們的雙足(zu)機(ji)器(qi)(qi)人具備(bei)出色的端側(ce)性能(neng),在(zai)復雜(za)環境中也能(neng)快速響應、精準交互,顯著提升了(le)產(chan)品(pin)的泛(fan)化(hua)能(neng)力(li)與(yu)市場落地潛力(li)。”

據悉,目前Robrain AI能(neng)(neng)提(ti)供(gong)兩(liang)種(zhong)具體解決(jue)方(fang)(fang)案,第一(yi)種(zhong)是快速(su)融(rong)合的(de)方(fang)(fang)案,在機器(qi)(qi)人(ren)本(ben)體之外,提(ti)供(gong)單(dan)獨的(de)機器(qi)(qi)人(ren)大(da)腦,方(fang)(fang)案各個模(mo)塊(kuai)相對獨立,方(fang)(fang)便(bian)快速(su)整(zheng)合,讓傳統機器(qi)(qi)人(ren)具備大(da)腦決(jue)策以及語音交互能(neng)(neng)力。另一(yi)種(zhong)是深度(du)融(rong)合方(fang)(fang)案,整(zheng)合度(du)會更(geng)(geng)高,一(yi)體化的(de)軟硬件設計可靠性(xing)也(ye)更(geng)(geng)高,適合需要(yao)深度(du)整(zheng)合具身智能(neng)(neng)場景應(ying)用的(de)機器(qi)(qi)人(ren)。
從感(gan)知、到(dao)決策(ce)到(dao)交互執行,Robrain AI構筑(zhu)起了一套完整的(de)(de)閉(bi)環智能(neng)(neng)方案,通過(guo)技(ji)術的(de)(de)深(shen)度協(xie)同與端云(yun)數(shu)據的(de)(de)高效(xiao)流(liu)轉,讓(rang)機(ji)器人真正擁(yong)有“觀察(cha)世界(jie)、思考問題(ti)、解決問題(ti)”的(de)(de)能(neng)(neng)力。基于準確全(quan)面(mian)的(de)(de)感(gan)知與個性化的(de)(de)決策(ce),Robrain AI 將(jiang)機(ji)器人的(de)(de)AI能(neng)(neng)力真正落地到(dao)可實踐的(de)(de)路徑(jing)下。這(zhe)種(zhong)全(quan)鏈路的(de)(de)智能(neng)(neng)化,讓(rang)機(ji)器人不再是機(ji)械的(de)(de)程序執行者(zhe),而是能(neng)(neng)夠理(li)解意圖、主動行動的(de)(de)具身(shen)智能(neng)(neng)體。
在(zai)具(ju)身(shen)智能(neng)行(xing)業升級的(de)(de)拐點,Robrain AI為機(ji)器人產業帶來的(de)(de)價值遠不止單純的(de)(de)技術升級這一(yi)維(wei)度。對機(ji)器人行(xing)業來說,在(zai)長(chang)尾場景(jing)泛化應用成為了其商業化落地難題(ti),已經困擾了行(xing)業多年。如何將(jiang)Robrain AI推(tui)廣到(dao)工業、商用、服務類等細(xi)分場景(jing),成為了加速機(ji)器人產業變(bian)革的(de)(de)關鍵。
Robrain AI帶來(lai)(lai)的(de)語(yu)音深度交互體驗,解(jie)決了(le)(le)(le)(le)情感化(hua)響應(ying)(ying)(ying)長期以(yi)來(lai)(lai)的(de)缺失,提升(sheng)了(le)(le)(le)(le)人(ren)(ren)機(ji)交互親和力;其在(zai)(zai)復雜(za)場景(jing)(jing)表現出的(de)適應(ying)(ying)(ying)性(xing),在(zai)(zai)解(jie)決機(ji)器(qi)(qi)(qi)人(ren)(ren)場景(jing)(jing)應(ying)(ying)(ying)用(yong)泛化(hua)性(xing)上(shang)向(xiang)前踏出了(le)(le)(le)(le)一大(da)步;加上(shang)方案中端云協同的(de)優(you)化(hua)算力分配,既(ji)降低了(le)(le)(le)(le)云端依賴,讓機(ji)器(qi)(qi)(qi)人(ren)(ren)走入更多(duo)應(ying)(ying)(ying)用(yong)場景(jing)(jing)成為可能,還提升(sheng)響應(ying)(ying)(ying)速(su)度與(yu)經濟(ji)性(xing),平衡了(le)(le)(le)(le)成本與(yu)效率,加速(su)了(le)(le)(le)(le)機(ji)器(qi)(qi)(qi)人(ren)(ren)向(xiang)更多(duo)應(ying)(ying)(ying)用(yong)場景(jing)(jing)滲透(tou)。這些以(yi)場景(jing)(jing)落(luo)地為出發的(de)技術賦能,既(ji)推動(dong)了(le)(le)(le)(le)機(ji)器(qi)(qi)(qi)人(ren)(ren)從“機(ji)械執行”到“靈魂(hun)覺醒”的(de)躍遷,更加速(su)了(le)(le)(le)(le)機(ji)器(qi)(qi)(qi)人(ren)(ren)向(xiang)具身智能終局發展。
值得一提的(de)是,移(yi)遠通信(xin)在設計這一機(ji)(ji)器人(ren)方案(an)時,已經考(kao)慮到機(ji)(ji)器人(ren)不(bu)斷進(jin)化(hua)的(de)可能(neng)性。搭載移(yi)遠通信(xin)AI算力模(mo)組的(de)Robrain AI機(ji)(ji)器人(ren)解決方案(an),能(neng)夠為各種形態以(yi)及不(bu)同場景的(de)機(ji)(ji)器人(ren)去做定制,并不(bu)斷通過(guo)端(duan)到端(duan)的(de)AI技術(shu)為其提供(gong)功(gong)能(neng)進(jin)化(hua),以(yi)場景需求(qiu)為錨點,推動機(ji)(ji)器人(ren)的(de)應用走進(jin)千行百業。圍繞(rao)具體(ti)場景的(de)具身智能(neng)需求(qiu)來構建(jian)AI技術(shu)棧,無疑是推動具身智能(neng)時代到來最核心(xin)的(de)命題,對移(yi)遠通信(xin)來說(shuo)如(ru)此,對整個產業鏈來說(shuo)亦是如(ru)此。
在近(jin)期的(de)直播中(zhong),移遠(yuan)通信(xin)分享了此前落地案(an)例(li),如基于移遠(yuan)通信(xin)端側 AI 整(zheng)體(ti)解決方(fang)案(an),采用(yong)(yong)AI高算(suan)力模(mo)組SG885G-WF打造(zao)的(de)德(de)壹全能王 AI 具身機器人(ren),能夠(gou)在無需(xu)理(li)療師介入(ru)、無網絡連接的(de)環境下,快速且準(zhun)確(que)地理(li)解用(yong)(yong)戶通過自然語言提(ti)出的(de)指令和意圖,高效完成通用(yong)(yong)聊(liao)天、醫療領域 RAG 問(wen)答(da)、指令控(kong)制(zhi)等任務。
在清掃類(lei)機(ji)器人(ren)、陪(pei)伴類(lei)機(ji)器人(ren)、教(jiao)育類(lei)機(ji)器人(ren)、運(yun)輸(shu)類(lei)機(ji)器人(ren)等多元領域,移遠(yuan)通信也在加速(su)布局(ju),依托端云深度(du)協同的靈魂大腦與(yu)感知、AI、通信全技術棧布局(ju),推動(dong)不(bu)同應用方向的機(ji)器人(ren)實現智(zhi)能化躍遷。

對于帶有執行功能(neng)(neng)的(de)具(ju)身機器(qi)人終(zhong)端(duan)設備來(lai)說,未來(lai)進一步構建多(duo)模(mo)態(tai)具(ju)身大模(mo)型是(shi)通(tong)往高階智能(neng)(neng)的(de)必經(jing)之路。與(yu)此同時,多(duo)模(mo)態(tai)模(mo)型和硬件算(suan)力(li)的(de)適配,則是(shi)能(neng)(neng)否真正應(ying)用起具(ju)身大模(mo)型能(neng)(neng)力(li)的(de)重點,也是(shi)推進具(ju)身機器(qi)人落地的(de)關鍵。
移遠(yuan)通信在近(jin)期的直播中也透露(lu),其方(fang)案(an)(an)規劃也是(shi)按照(zhao)從多模態(tai)感知(zhi)到(dao)規劃、決(jue)(jue)策能力的增強方(fang)向(xiang)推進,通過不斷擴展端到(dao)端AI的工(gong)程化能力,提高方(fang)案(an)(an)的適用(yong)性和覆蓋(gai)面,為客戶提供一站(zhan)式的具身機(ji)器人解決(jue)(jue)方(fang)案(an)(an),加(jia)速機(ji)器人具身智能終局到(dao)來。
Robrain AI機(ji)器(qi)人(ren)解決(jue)方(fang)案給產業鏈上下游帶來(lai)了一個(ge)協同合(he)作的契(qi)機(ji),各方(fang)可憑(ping)借各自(zi)技(ji)(ji)(ji)術(shu)(shu)專(zhuan)長,攜手持(chi)續探索機(ji)器(qi)人(ren)的應用場景。在模型技(ji)(ji)(ji)術(shu)(shu)、多模態交互(hu)感(gan)知技(ji)(ji)(ji)術(shu)(shu)、運控技(ji)(ji)(ji)術(shu)(shu)等一系列前沿科技(ji)(ji)(ji)的加(jia)持(chi)下,具(ju)身智能機(ji)器(qi)人(ren)的發展正(zheng)在推動(dong)AI向(xiang)能夠理(li)解、推理(li)并與物理(li)世界互(hu)動(dong)的方(fang)向(xiang)演進。正(zheng)如(ru)英偉達(da)黃仁勛所(suo)說,AI技(ji)(ji)(ji)術(shu)(shu)終局(ju)在物理(li)AI,AI時代下一個(ge)浪潮是“具(ju)身智能”時代。