上周(zhou)DeepSeek發布了一篇(pian)關于NSA的技術論文報(bao)告,這是一種(zhong)硬(ying)件對(dui)齊且原生可訓(xun)練(lian)(lian)的稀疏(shu)注意(yi)力機制(zhi)(zhi),用于超快速(su)長上下文訓(xun)練(lian)(lian)與推(tui)理。DeepSeek表示該機制(zhi)(zhi)可優化(hua)現(xian)代硬(ying)件設計,加速(su)推(tui)理同時(shi)降(jiang)低預訓(xun)練(lian)(lian)成本,并且不犧牲性(xing)能。
DeepSeek與硬(ying)件(jian)協同發展帶動硬(ying)件(jian)設(she)備(bei)升級(ji)(ji)與市場增長是資本市場概念熱潮褪去之后,下一(yi)階段(duan)落地到(dao)實體產(chan)業的(de)(de)(de)發展關(guan)鍵。從不同終(zhong)(zhong)端硬(ying)件(jian)的(de)(de)(de)技(ji)術發展來看也的(de)(de)(de)確如此(ci),終(zhong)(zhong)端設(she)備(bei)正(zheng)在經歷新一(yi)輪的(de)(de)(de)升級(ji)(ji)迭代,終(zhong)(zhong)端硬(ying)件(jian)廠商(shang)與DeepSeek的(de)(de)(de)緊密合作正(zheng)推動硬(ying)件(jian)設(she)備(bei)向(xiang)更智能、更高效(xiao)的(de)(de)(de)水平邁進。
終端硬件設備最具科技想象空間的無疑是機器人,今年尖端AI推理模型DeepSeek帶來的高質量小模型和多模態推理模型方面的創新,正在為機器人的商用應用和終端側推理落地做好準備,強大的模型能力已演進到一定程度能在終端側賦能硬件。宇樹(shu)科技CEO王興興近(jin)日也(ye)表示(shi),在(zai)今年(nian)年(nian)底之前,整個(ge)AI人形機器人會達到(dao)一個(ge)新的量級。
從人形機器人的發展史上來看國內產業鏈很長時間都處于下風,但近年來這一態勢已發生逆轉,憑借深厚的技術積累和強大的供應鏈體系,國內企業在關節伺服、運動控制等傳統機器人技術領域取得顯著突破,而后趁著AI浪潮國內企業在硬件技術成熟度提升與模型賦能的雙重驅動下迅速崛起。
金融機構摩根士丹利最新發布的《The Humanoid 100: Mapping the Humanoid Robot Value Chain》(人形機器人 100:繪制人形機器人價值鏈圖譜)報告中羅列的全球人形機器人產業鏈上市公司百強名單中,亞洲公司占據73%其中中國公司占56%,還有77%的集成商來自亞洲其中45%來自中國。過去5年中人形機器人專利申請數中國以5688項遠超美國和日本,雄踞第一寶座。報告預計(ji),到(dao)2030年,中(zhong)國人(ren)形機器人(ren)市場(chang)(chang)規模將達(da)到(dao)120億元人(ren)民幣(bi),銷量達(da)150萬(wan)臺;到(dao)2050年,中(zhong)國的人(ren)形機器人(ren)市場(chang)(chang)規模將達(da)到(dao)6萬(wan)億元,人(ren)形機器人(ren)總量達(da)到(dao) 5900萬(wan)臺。
報(bao)告(gao)中將供(gong)應(ying)商分為三類,分別是負責半導體和(he)模(mo)型軟(ruan)件(jian)的(de)“大(da)腦(nao)”供(gong)應(ying)商、負責工業(ye)組件(jian)的(de)“身體”供(gong)應(ying)商以(yi)及(ji)負責整機制造(zao)的(de)“集成商”。
在“大(da)腦”供應商部(bu)(bu)分,上榜(bang)的中(zhong)國企業有百(bai)度、地平(ping)線機器人和臺(tai)積(ji)電;“身體”供應商部(bu)(bu)分,中(zhong)國企業有旭升(sheng)集(ji)(ji)(ji)團(tuan)(tuan)、億緯(wei)鋰(li)能、寧德時代、雙(shuang)林股份、拓普(pu)集(ji)(ji)(ji)團(tuan)(tuan)、三花智(zhi)控、匯川技(ji)術(shu)、綠的諧波、雙(shuang)環傳動、中(zhong)大(da)力(li)德、雷(lei)賽智(zhi)能、埃斯(si)頓(dun)、兆(zhao)威機電、鳴志電器、金力(li)永(yong)磁、北方稀土、北特科技(ji)、恒立液壓、韋爾股份、柯力(li)傳感、速騰聚創;集(ji)(ji)(ji)成商部(bu)(bu)分有廣汽集(ji)(ji)(ji)團(tuan)(tuan)、小(xiao)鵬汽車、比亞迪、小(xiao)米集(ji)(ji)(ji)團(tuan)(tuan)、阿里(li)巴巴、騰訊、埃斯(si)頓(dun)、優必選、美的集(ji)(ji)(ji)團(tuan)(tuan)。
作為在芯片類別唯一(yi)一(yi)家上(shang)榜的(de)(de)國內(nei)SoC廠(chang)商,地平(ping)線(xian)在邊緣側(ce)端側(ce)的(de)(de)AI SoC實力(li)有目共(gong)睹,“地平(ping)線(xian)機器(qi)人(ren)”其創立(li)設定的(de)(de)場(chang)景便是機器(qi)人(ren)、自動駕駛這樣需要實時完成(cheng)計(ji)算(suan)的(de)(de)端側(ce)場(chang)景,其SoC產品所有的(de)(de)軟硬件(jian)架構(gou)都為端側(ce)的(de)(de)特殊需求設計(ji)。在硬件(jian)上(shang),地平(ping)線(xian)打造的(de)(de)智能(neng)計(ji)算(suan)架構(gou)BPU,不(bu)僅是算(suan)力(li)和功(gong)耗的(de)(de)優化,還將感(gan)知、規(gui)控等各種(zhong)任務(wu)統一(yi)到(dao)Transformer框架下,更好支撐模型帶來的(de)(de)新能(neng)力(li)。DeepSeeK問世后地平(ping)線(xian)宣布(bu)支持DeepSeeK大模型,通過端側(ce)高效(xiao)(xiao)推理能(neng)力(li),幫助端側(ce)設備在訓(xun)練(lian)智能(neng)系統時,降低數據(ju)訓(xun)練(lian)成(cheng)本,提(ti)升訓(xun)練(lian)效(xiao)(xiao)率。
“身(shen)體”供(gong)應商部(bu)分國產供(gong)應鏈覆蓋(gai)了關鍵零部(bu)件全鏈條,從電(dian)機(ji)(ji)到傳感器,再到精密結構(gou)件。電(dian)機(ji)(ji)領域明確(que)的(de)發展趨勢是電(dian)機(ji)(ji)智能(neng)(neng)化和高(gao)效(xiao)節能(neng)(neng)化,在電(dian)機(ji)(ji)芯片領域,SoC級的(de)解(jie)決方案并且具備更(geng)強(qiang)的(de)邊(bian)緣側計算(suan)和智能(neng)(neng)決策能(neng)(neng)力(li)成為了下游市場(chang)的(de)期許。所以現(xian)(xian)在眾(zhong)多(duo)電(dian)機(ji)(ji)主控(kong)(kong)芯片都會配置DSP或者NPU來實現(xian)(xian)計算(suan)加(jia)速組(zu)件,讓(rang)主控(kong)(kong)能(neng)(neng)夠(gou)在端側運行(xing)AI算(suan)法智能(neng)(neng)優化能(neng)(neng)效(xiao)并增強(qiang)終(zhong)端設備的(de)響應速度。
傳感器是機器人核心部件,人形機器人具身智能時代,端側傳感器與AI的結合絕對已經成為必不可少的技術棧。幾(ji)家上榜的國內傳(chuan)感(gan)器廠(chang)商,圖像傳(chuan)感(gan)器龍頭韋爾股份(fen)、激(ji)光雷達賽(sai)道領軍企業速騰聚創等均(jun)在推動傳(chuan)感(gan)器成為不再只是用于感(gan)知(zhi)的硬件,而是在實時精準感(gan)知(zhi)的基礎上,拓展(zhan)更多(duo)和(he)AI相關的功能(neng)(neng)。傳(chuan)感(gan)側借力端側AI提供(gong)更多(duo)數據處理、分(fen)類、融合的價(jia)值,最終通過具(ju)身感(gan)知(zhi)來增(zeng)強智能(neng)(neng)體的理解和(he)決(jue)策(ce)。
集成商作為機器人本體核心供應商,強化端側智能能力亦是重中之重,依托模型賦能,實現多模態感知與高效決策已成為他們的首要任務。國內人(ren)(ren)形機器(qi)人(ren)(ren)第(di)一股優必選已經表示在(zai)人(ren)(ren)形機器(qi)人(ren)(ren)應(ying)用場景中驗(yan)證(zheng)DeepSeek技術的有效(xiao)性,如多模態(tai)人(ren)(ren)機交(jiao)互、復(fu)雜環(huan)境中的指令理解、工業場景中的任(ren)務分解與規劃等。
從這份世界百強榜單中,國內企業的崛起彰顯了本土產業鏈的成熟與創新能力。雖然在芯片領域仍面臨國際巨頭擠壓,但在整個產業鏈上是領先的。端側智能化的大趨勢也在引領著國內機器人產業鏈軟硬件協同發展。
雖然這份報告中并沒有提及DeepSeek,但顯然DeepSeek面世后機器人賽道變化不小。DeepSeek在模型能力不遜于其他主流模型基礎上,又做到了算力成本更低。除了上述百強榜單中的優必選已經開始驗證DeepSeek+機器人技術的有效性,小鵬汽車也在積極探索DeepSeek在自動駕駛領域的應用,后續用在自家的人形機器人Iron上也是大概率事件。這些百強之外,產業鏈上的公司也在積極布局,借助DeepSeek帶動的端側模型革新尋找端側具身智能的新范式。
已經有(you)消(xiao)息傳出(chu)宇樹科技與DeepSeek達成(cheng)深度(du)合作(zuo);前段(duan)時間Figure終止與OpenAI合作(zuo)也(ye)有(you)很多人(ren)認為 Figure 是在(zai)基于DeepSeek R1等開(kai)源模型(xing)進行開(kai)發機(ji)(ji)器人(ren)AI;獵(lie)戶星空的機(ji)(ji)器人(ren)AgentOS也(ye)接入DeepSeek……以DeepSeek為代(dai)表的優質模型(xing)已經成(cheng)為人(ren)形機(ji)(ji)器人(ren)推動端側(ce)智(zhi)能邁(mai)向新高度(du)的關鍵驅(qu)動力。
這些產業鏈上的舉動,從產業落地的角度來說,考量實現具身智能的成本是決定性因素之一。雖然人形機器人現階段相比于其他智能端側設備,對成本并沒有那么敏感,但硬件設備想普及成本是最實際的問題。機器人運控、感知、決策任意環節的任一細分方向的智能,都需要消耗大量算力來訓練數據。真機數據匱乏且貴是整個行業面臨的問題,模型仿真數據能緩解一部分數據匱乏的問題也還是需要模型篩選出高質量數據訓練解決泛化性和魯棒性問題。
DeepSeek通過高效推理能力降低數據訓練成本,提升訓練效率給機器人廠商開辟了一條更低成本的具身智能實現路線。從數據到性能的轉化性價比是機器人想要落地必須考量的,能夠以更低的數據成本訓練出性能更好的具身模型自然會吸引更多廠商投入研發,加速端側具身智能的實現。
在(zai)算(suan)力(li)上,從國(guo)外的(de)(de)英偉達(da)、高(gao)通、英特爾(er),到(dao)瑞芯微、晶(jing)晨(chen)股份、星宸科(ke)技(ji)(ji)、國(guo)科(ke)微、富瀚微、國(guo)芯科(ke)技(ji)(ji)、恒玄科(ke)技(ji)(ji)、樂鑫科(ke)技(ji)(ji)、中(zhong)科(ke)藍訊、炬芯科(ke)技(ji)(ji)、安凱微、寒武紀、黑芝(zhi)麻智能(neng)(neng)等(deng)端(duan)(duan)側SoC、端(duan)(duan)側處理芯片廠(chang)商,包括廣(guang)和通、美格智能(neng)(neng)、移遠通信(xin)等(deng)端(duan)(duan)側模(mo)組廠(chang)商在(zai)內,都在(zai)積(ji)極擁抱DeepSeek帶來的(de)(de)端(duan)(duan)側智能(neng)(neng)算(suan)力(li)熱潮,在(zai)機器人賽道(dao)上積(ji)極布局,進行軟硬(ying)協(xie)同優化,解放端(duan)(duan)側算(suan)力(li)效率推動具(ju)身智能(neng)(neng)愿景。
另一方(fang)面,在機器(qi)人(ren)(ren)端(duan)側模(mo)(mo)型的(de)適配上,DeepSeek的(de)“開(kai)源(yuan)+低(di)價+蒸餾”模(mo)(mo)式(如通過(guo)API低(di)成本調用、模(mo)(mo)型蒸餾技術(shu)生成垂直小模(mo)(mo)型),顯(xian)著降低(di)了AI技術(shu)的(de)應用門檻,使機器(qi)人(ren)(ren)能(neng)夠快速集成先進的(de)自然語言(yan)處理(li)(li)初(chu)步處理(li)(li)與(yu)分(fen)析,在交(jiao)互上迅速提升智(zhi)能(neng)化(hua)水平(ping),還(huan)能(neng)結(jie)合多元信(xin)息進行(xing)推理(li)(li)與(yu)決策,提供更高階智(zhi)能(neng)的(de)服務。
和手機、PC、可穿戴等其他小型終端設備略有不同的是,人形機器人的算力并不會那么欠缺,在算力與能效的平衡上會更自由,能更好地支撐復雜端側模型的運行。通過DeepSeek代表性的跨維度知識蒸餾體系,將大模型的邏輯解構為思考推理,更適配機器人端側垂直應用場景,更人性化的思考也符合大家對具身智能的期待。
其開源特性,也讓人形機器人公司能夠自主的構建閉環的智能模型,模型與機器人適配度會更高,技術棧上也避免受制于人。Figure終(zhong)止與OpenAI合(he)作(zuo)很大一部分考(kao)量也是在(zai)這方面。近(jin)日Figure宣布推出的(de)重大AI更新(xin)——自(zi)主研(yan)發的(de)通用(yong)具身智能VLA模型Helix,也的(de)確是走了(le)自(zi)研(yan)這條路。
人(ren)形機(ji)器(qi)人(ren)發展到高階智(zhi)能,多(duo)模態理(li)解能力是(shi)機(ji)器(qi)人(ren)VLA視覺(jue)(jue)語言行動模型(xing)的核心,亦是(shi)實現(xian)具身智(zhi)能的關鍵。在觸(chu)覺(jue)(jue)信息處理(li)能力成(cheng)(cheng)熟后,發展成(cheng)(cheng)全模態VTLA模型(xing)也是(shi)必要的。
DeepSeek已經提出過視覺語言模型——DeepSeek-VL,能進行多模態數據訓練。近期北京大學聯合香港科技大學在則DeepSeek-R1基礎上發布了多模態版DeepSeek-R1——Align-DS-V,完成了從文本到視覺理解的拓展。北大團隊表示“這種全模態的信息流對于大模型范式轉向通用人工智能也一樣重要”。
除了廠(chang)商自(zi)研,充分利(li)用DeepSeek構建機器人多模態(tai)模型也是(shi)一條(tiao)不錯的(de)(de)技術路徑,這一改變帶來的(de)(de)助(zhu)力(li)將會在后(hou)續(xu)的(de)(de)發展中逐(zhu)步(bu)顯(xian)現。
不論是在囊括一切信息流的VLA模型中,還是在具體任務落地中用到的 MoE小模型組合中,DeepSeek給了算法平臺商和終端本體廠商更多的技術路徑選擇。現在還很難說哪條技術路線能引領產業走向終局的物理AI,但不可否認的是DeepSeek出現帶動的端側模型的爆發與革新,解決了機器人在復雜決策場景中構建起感知-理解-推演的閉環認知體系的部分難題,推動了端側模型與人形機器人的結合落地,加速了端(duan)側實現具身智能(neng)。
中國(guo)具身智(zhi)能(neng)人(ren)形機(ji)器人(ren)產業(ye)鏈(lian)的(de)崛(jue)起,是技術突(tu)破、政策引導與(yu)(yu)場景落(luo)地的(de)綜合結果;而優(you)質多(duo)模(mo)態模(mo)型的(de)融合將加速機(ji)器人(ren)向(xiang)智(zhi)能(neng)化、多(duo)模(mo)態交互方(fang)向(xiang)演進。未來,兩者的(de)協同或成為全(quan)球(qiu)AI與(yu)(yu)機(ji)器人(ren)產業(ye)競(jing)爭的(de)核(he)心變量。