在上一篇文章中,筆者提出:物理 AI/具身智能正在掀起下一波人工智能新浪(lang)潮,為 AI 賦(fu)予物理實體已(yi)然成為 AI 產(chan)業未來的(de)重點發(fa)展方向,也將成為未來大國之(zhi)間人(ren)工智能(neng)博弈的(de)焦點。
大國博弈,除了比拼產業生態建設和政策支持力度,更重要的是各國領先企業之間在技術研發和場景落地方面的競爭。最近一段時間內,國內無論是大廠還是初創企業都相繼發力,具身智能賽道持續“吸金”——繼大模型之后,新一輪 AI “軍備競賽”已然打響。
2024 年末(mo)以及 2025 年開年以來,熱(re)錢大批涌入(ru)具身智能(neng)賽道。
2024 年 12 月, 小米投(tou)資(zi)(zi)的(de)首家(jia)大(da)模型機器(qi)人(ren)公(gong)司——北京小雨(yu)智造(zao)科技有限(xian)公(gong)司宣(xuan)布完(wan)成億元 A 輪(lun)融資(zi)(zi)。本輪(lun)融資(zi)(zi)由北京信息產(chan)業發(fa)展投(tou)資(zi)(zi)基金獨家(jia)投(tou)資(zi)(zi),這(zhe)是(shi)繼天(tian)使輪(lun)獲得投(tou)資(zi)(zi)后,小雨(yu)智造(zao)再(zai)次獲得億元級(ji)別的(de)融資(zi)(zi)。該公(gong)司專注(zhu)于開發(fa)適用(yong)于工(gong)業領域的(de)大(da)模型機器(qi)人(ren)技術,旨在(zai)為機器(qi)人(ren)打造(zao)能(neng)夠(gou)適應各(ge)種任務的(de)“通用(yong)大(da)腦(nao)”。
2025 年 1 月 7 日,智平方宣布完成數億元 Pre-A 輪戰(zhan)略(lve)融(rong)資,由達晨財智(zhi)與敦鴻資產(chan)聯合(he)領投,基石資本跟(gen)投。智(zhi)平(ping)(ping)(ping)(ping)方(fang)由國家(jia)級創新領軍(jun)人(ren)(ren)才郭彥東(dong)博士創立,是國內最早探索端(duan)到(dao)端(duan) VLA 技術(shu)路線(xian)并始(shi)終保持行業(ye)領先水平(ping)(ping)(ping)(ping)的(de)企業(ye),并于(yu) 2024 年率先實現了搭載端(duan)到(dao)端(duan) VLA 具身大(da)模(mo)型的(de)智(zhi)能(neng)機(ji)器人(ren)(ren)商(shang)業(ye)化(hua)。3 月 6 日(ri),智(zhi)平(ping)(ping)(ping)(ping)方(fang)又宣布迅速(su)完成新一輪過億元 Pre A+ 輪融(rong)資,短短兩個月內迅速(su)完成兩輪數億融(rong)資,融(rong)資將(jiang)主要用于(yu)推動具身智(zhi)能(neng)機(ji)器人(ren)(ren)在規模(mo)化(hua)商(shang)業(ye)場景中的(de)落地應(ying)用。據(ju)悉,智(zhi)平(ping)(ping)(ping)(ping)方(fang)的(de)國產(chan)具身大(da)模(mo)型,在通用空間(jian)感知(zhi)、泛(fan)化(hua)操作成功(gong)率上大(da)幅超越硅谷頭部模(mo)型,其自主研發(fa)的(de) AI2R Brain 具身大(da)模(mo)型已成功(gong)部署于(yu) Alpha Bot 系列機(ji)器人(ren)(ren)。
同樣是(shi)(shi)在 1 月 7 日,傅利葉宣(xuan)布完成新一輪(lun)融(rong)資(zi)(zi),E 系列融(rong)資(zi)(zi)?額合計達到近 8 億(yi)元(yuan),本輪(lun)融(rong)資(zi)(zi)由(you)國鑫投(tou)資(zi)(zi)、浦東創投(tou)、張江(jiang)科投(tou)、張科垚(yao)坤基金、Prosperity7、鈞山資(zi)(zi)本等機(ji)(ji)構共(gong)同參與。該公司的目(mu)標(biao)是(shi)(shi)“為 AI 打造最(zui)佳具身本體”,在剛剛過去的 2024 年,傅利葉推出(chu)了 GRx 系列第(di)?代?形機(ji)(ji)器?產品(pin) GR-2。

圖(tu):傅里葉智(zhi)能 GRx 系列第?代(dai)?形機器?產品 GR-2
2 月 6 日,具身智能人形機器人研發商零次方機器人完(wan)成數(shu)千(qian)萬元天使(shi)輪融(rong)資,并拿下千(qian)萬級訂單。該(gai)公(gong)司(si)成立于 2025年 1 月(yue),由清華大(da)學和(he)江(jiang)淮前沿(yan)技術協同(tong)創新中心聯合孵化,今j計(ji)劃實現共計(ji) 500 余臺多(duo)型號人形(xing)機(ji)器(qi)人,在服(fu)務業(ye)、教育(yu)、文(wen)娛、展覽等多(duo)個行業(ye)的量產落地。
2 月中旬,具身智能創業公司自變量機器人(X Square Robot)完(wan)成數億(yi)(yi)元 Pre-A++ 輪融資。本輪融資由光(guang)速光(guang)合與君(jun)聯資本領(ling)投、北京機器(qi)人產(chan)業基金、神騏(qi)資本跟投,融資將用于下一代統一具身(shen)(shen)智能通用大(da)模型的(de)訓練與場景落地。自變量機器(qi)人成立于 2023 年(nian) 12 月,致力于通過(guo)研發具身(shen)(shen)智能通用大(da)模型,實現(xian)通用機器(qi)人,2024 年(nian) 11 月完(wan)成億(yi)(yi)元級(ji) Pre-A 與 Pre-A+ 輪融資。
初創企業融資潮的另一面,是大廠們的爭先布局,很多初創企業的背后都有大廠的影子。
往早了說,阿里參與了通用機器人初創公司逐際動力的戰略融資,美團曾投資銀河通用、宇樹科技,騰訊在多年前投資了樂聚機器人和優必選。往近了看,2 月 20 日,星海圖宣布完成新一輪 A 輪融資,總融資額近 3 億元,本輪融資由螞蟻集團獨家(jia)領投,高瓴創投、IDG 資本、北京機(ji)器人(ren)產業基金、百度(du)風投、同歌創投等一眾老股(gu)東持(chi)續加碼(ma)。
近日,螞(ma)(ma)蟻(yi)集(ji)團(tuan)還在招聘平臺開(kai)放了多(duo)個具身智能(neng)方(fang)(fang)向崗位,引(yin)起多(duo)方(fang)(fang)關(guan)注。有業(ye)內人士透露,螞(ma)(ma)蟻(yi)集(ji)團(tuan) 2024 年(nian)時便已在推進具身智能(neng)相關(guan)業(ye)務。螞(ma)(ma)蟻(yi)集(ji)團(tuan)官方(fang)(fang)對此回應稱,集(ji)團(tuan)持續布局和加大人工(gong)智能(neng)投入,去年(nian)注冊成(cheng)立(li)了螞(ma)(ma)蟻(yi)靈(ling)波科技有限(xian)公司,聚(ju)焦具身智能(neng)技術和產品研(yan)發。
無獨有偶,“稚暉君”創業的智元機器人近期已完成了新一輪融資,由騰訊領投。據知情人士消息,智元(yuan)機(ji)器人還在以 150 億元(yuan)估值(zhi)進(jin)行新一輪(lun)融資接洽。
除了投融資這種外部投資方式外,也有大廠直接內部切入。近日(ri),上證報放出消息稱,京東(dong)已(yi)切入具身智能領域(yu),側重家(jia)用場景,現已(yi)成(cheng)立相關業(ye)務(wu)部(bu)門。接近京東(dong)的人(ren)士(shi)稱,京東(dong)非常重視人(ren)工智能、自(zi)動化以及機器人(ren)等(deng)領域(yu)的創新和應(ying)用,內部(bu)也有多支團隊布(bu)局具身智能等(deng)前沿(yan)方(fang)向的研發。
當然,還有大廠希望搞生態并成為“賣鏟人”。比如 2024 年 11 月,華為(深圳)全球具身智能產業創新中心成立,并與樂聚機器人、大族機器人、拓斯達、中堅科技、兆威機電等 16 家企業簽署戰略合作備忘錄。據了解,該創新中心由華為與深圳市前海管理局、寶安區人民政府合作建立。相關負責人透露,華為后期將與產業鏈上下游的企業合作,建設具身智能基礎實驗室,打造具身智能產品技術交易平臺,并在相關應用場景中進行應用。國泰君安證券研究所認為,華為在人形機器人產業的定位可能更像英偉達,將以賣鏟人的定位存在。“對于華為來說,怎么賣好昇騰芯片,打造生態(tai)系(xi)統是目前(qian)最重要、最迫切的工作(zuo)。”
總體來看,在(zai)頂層政策(ce)的助推和企業(ye)們(men)的積極布局(ju)下,中(zhong)國(guo)具身(shen)(shen)智能(neng)產業(ye)正在(zai)呈(cheng)現(xian)蓬(peng)勃(bo)發展之勢。根據頭豹(bao)研(yan)究院的數據,2023 年(nian),中(zhong)國(guo)具身(shen)(shen)智能(neng)市(shi)場規模達 1572.7 億元。隨(sui)著大模型端的技術突破,具身(shen)(shen)智能(neng)市(shi)場規模預計將(jiang)以 16.5% 的復合年(nian)增(zeng)長(chang)(chang)率增(zeng)長(chang)(chang)至(zhi) 2027 年(nian)的 2259 億元。
不(bu)過,由于現在尚屬于具身智能產業發展的早期(qi),對入局的企業而言,需要克服(fu)技術(shu)棧(zhan)、數據積(ji)累、成(cheng)本控制、商業化落(luo)地等多個(ge)方(fang)面的挑戰:
具身智能的核心是讓 AI 能夠與物理世界交互(hu),這需要(yao)從感知、決(jue)策、執行三大環節進行突破。
首先在計算與算法層,GPT-4、Gemini 等大模型(xing)的(de)成(cheng)功(gong),推動了 AI 在自然(ran)語言(yan)理解和(he)推理能(neng)(neng)力(li)上的(de)進步,但(dan)在具身智(zhi)能(neng)(neng)領域,僅靠(kao)大模型(xing)并(bing)不足夠,必(bi)須結合強化(hua)學(xue)(xue)習(xi)(RL)、模仿學(xue)(xue)習(xi)(IL)等方法,使(shi)智(zhi)能(neng)(neng)體具備真(zhen)實環境中的(de)決(jue)策能(neng)(neng)力(li)。同時,由(you)于具身智(zhi)能(neng)(neng)涉及大量環境交互(hu),自監督(du)學(xue)(xue)習(xi)成(cheng)為關鍵。例如,Meta AI 采用(yong)(yong)自監督(du)視(shi)覺(jue)學(xue)(xue)習(xi)優化(hua)機(ji)器人(ren)視(shi)覺(jue)感(gan)知能(neng)(neng)力(li)。傳(chuan)統(tong)的(de)觸(chu)覺(jue)系統(tong)針對每項任(ren)務(wu)(wu)采用(yong)(yong)單(dan)獨(du)的(de)模型(xing),嚴重依賴標記數(shu)(shu)據(ju)和(he)特定傳(chuan)感(gan)器。Meta Sparsh 完(wan)全改變了這種方法。作為通(tong)用(yong)(yong)模型(xing),它可適應各(ge)種傳(chuan)感(gan)器和(he)任(ren)務(wu)(wu),使(shi)用(yong)(yong)自監督(du)學(xue)(xue)習(xi)在擁有超過(guo) 460000 個觸(chu)覺(jue)圖像的(de)龐(pang)大數(shu)(shu)據(ju)庫上,無需(xu)標記數(shu)(shu)據(ju)。
然后在感知層,具身智能需要像人類一樣“看、聽、觸、動”,因此,多傳感器融合是技術發展的重要方向。在各種感(gan)(gan)知(zhi)系(xi)(xi)統中,視(shi)(shi)覺系(xi)(xi)統無疑是人(ren)形機器人(ren)最為核(he)心的環境(jing)感(gan)(gan)知(zhi)通道——雙(shuang)目(mu)攝像頭(tou)提供(gong)色(se)彩和深(shen)度信(xin)息(xi),激光(guang)雷(lei)(lei)達提供(gong)精細的環境(jing)建模,毫米(mi)波雷(lei)(lei)達能夠全(quan)天候運(yun)行,紅外傳(chuan)感(gan)(gan)器可適應暗光(guang)環境(jing)。不同傳(chuan)感(gan)(gan)器分(fen)別補足了視(shi)(shi)覺感(gan)(gan)知(zhi)不同維(wei)度的能力,多傳(chuan)感(gan)(gan)器融(rong)合趨勢明晰。此(ci)外,聽覺、觸覺、編(bian)碼器、慣導 IMU 等傳(chuan)感(gan)(gan)器亦在具身(shen)智(zhi)能環境(jing)交互、靈活運(yun)動、姿態(tai)平衡等方面發揮(hui)著(zhu)重要作用。
最后,在運動與執行層,人(ren)(ren)形機(ji)器人(ren)(ren)、四足機(ji)器人(ren)(ren)、柔性(xing)機(ji)械臂等方向都有發展(zhan)空間(jian),如波士(shi)頓動力的(de)(de) Spot、Tesla Optimus 的(de)(de)仿生肌肉關節(jie)設計。目前(qian)具身(shen)智能面臨的(de)(de)瓶頸之一是(shi)能耗問題(ti),初創企業可以探(tan)索超低(di)功耗芯片(如 RISC-V 架構)、高效(xiao)電池管(guan)理系統(BMS),提升機(ji)器人(ren)(ren)續(xu)航能力。
盡管具(ju)(ju)身智能技術發展迅(xun)速,但(dan)對于(yu)入局(ju)企業尤(you)其是初創企業而言(yan),訓練數(shu)(shu)據(ju)不足(zu)是一個(ge)亟待(dai)解決的(de)挑戰。具(ju)(ju)身智能需要海量(liang)的(de)交互數(shu)(shu)據(ju),但(dan)數(shu)(shu)據(ju)獲取面(mian)臨瓶(ping)頸:一方(fang)(fang)面(mian)是真實(shi)世界交互數(shu)(shu)據(ju)難采集(ji),依賴物理環境測試,成本(ben)高昂;另一方(fang)(fang)面(mian)是國內數(shu)(shu)據(ju)閉環生態不成熟,缺(que)乏大規模可用的(de)具(ju)(ju)身智能數(shu)(shu)據(ju)集(ji)。
不過,企業也有相對(dui)的應對(dui)策略(lve),比如(ru)利用仿真環境(如(ru) Mujoco、Isaac Sim)進行大規模(mo)(mo)模(mo)(mo)擬(ni)訓(xun)練,并(bing)結合Sim2Real(模(mo)(mo)擬(ni)到真實)遷移技術(shu),減(jian)少(shao)對(dui)真實數(shu)據(ju)的依賴。另外也可采用聯邦(bang)學習(Federated Learning),共享不同企業的交(jiao)互數(shu)據(ju),降低數(shu)據(ju)訓(xun)練成本。
除(chu)了數據(ju)問題,具身智能(neng)涉及實時感知、計算(suan)與控制,需要強大的計算(suan)能(neng)力,但高(gao)性能(neng)算(suan)力芯片成本(ben)高(gao)昂,初創企(qi)業難以負(fu)擔。對此,最近(jin)興(xing)起的輕量化模型是一大破局利器,另外,發(fa)展國(guo)產(chan)算(suan)力生態(tai)刻不容緩(huan),成熟的國(guo)產(chan)供應鏈能(neng)夠(gou)降低核心硬件成本(ben)。
最后,具身智能的商業模式仍在探索之中。由于成本高昂,C 端市場難以快速推廣,B 端應用落地則有著周期長的問題。未來,或許會有企業探索“機器人即服務(RaaS)”模式(shi),讓客戶(hu)以租賃方式(shi)使用機器人(ren),降低客戶(hu)初(chu)始投入成本。
具(ju)身(shen)智能不(bu)僅是科技競賽的下一(yi)戰場,更可能重構生產力與生活方(fang)式,成為繼智能手機、電(dian)動汽車后的新(xin)一(yi)代通用技術平臺(tai)。在全(quan)球(qiu)科技競爭加劇的背(bei)景下,中國的具(ju)身(shen)智能初創企業(ye)若能在技術、數(shu)據、成本(ben)和落(luo)地(di)(di)方(fang)面找到突破口(kou),將有望(wang)在全(quan)球(qiu)市場占據一(yi)席之地(di)(di)。
參考資料:
智平方獲數億元Pre A+輪(lun)融(rong)資(zi),兩個月完成兩輪(lun)數億融(rong)資(zi),投資(zi)界
傅利(li)葉(xie)宣布(bu)已完成(cheng)新(xin)?輪(lun)融資(zi),E系列融資(zi)總(zong)額近8億,傅利(li)葉(xie)官網
清(qing)華00后團隊成(cheng)立的「零次方機器人」完成(cheng)數(shu)千萬元天使輪融資,投(tou)資界
自變量機器人公司一個月(yue)內完成數億(yi)元Pre-A++輪融資(zi)(zi),基石資(zi)(zi)本
京東(dong)確認入局(ju)(ju)具身智能,內(nei)部成立多支團(tuan)隊布局(ju)(ju)前沿研發,物(wu)聯傳媒(mei)
成立全(quan)球具身(shen)智能(neng)產業創新中心,華為再做“賣(mai)鏟人”,第一財(cai)經
推(tui)進具身人(ren)工(gong)智能(neng)(neng):Meta如何為人(ren)工(gong)智能(neng)(neng)帶來(lai)類(lei)似人(ren)類(lei)的觸覺和靈巧性,UNITE.AI
具身智能系(xi)列(二):傳感(gan)器(qi),賦予機器(qi)人感(gan)知(zhi)世界的能力,新浪財經(jing)