国产人妻精品区一区二区,国产农村妇女毛片精品久久,JAPANESE日本丰满少妇,日本公妇理伦a片,射精专区一区二区朝鲜

機器人與模型深度融合開啟智能升級下半場,智能終端的未來終局是物理AI
作者 | 物聯網智(zhi)庫2025-01-24

年(nian)初的(de)(de)CES 2025可以說給今年(nian)的(de)(de)智能(neng)硬件產(chan)品(pin)拉開(kai)(kai)了盛大的(de)(de)帷幕,不少創新的(de)(de)智能(neng)產(chan)品(pin)紛(fen)紛(fen)登(deng)場,在(zai)AI技術的(de)(de)加持下(xia)展(zhan)(zhan)現出豐(feng)富的(de)(de)應用(yong)方(fang)向(xiang)。雖(sui)然AI發(fa)展(zhan)(zhan)還有漫長的(de)(de)道路要走,但從云到端(duan)已經成(cheng)為一個明確的(de)(de)發(fa)展(zhan)(zhan)趨勢,AI世界(jie)在(zai)今年(nian)開(kai)(kai)啟了屬于智能(neng)硬件的(de)(de)下(xia)半場。

這些登場的(de)(de)智能硬件產(chan)品(pin)里,機(ji)器(qi)(qi)人(ren)(ren)(ren)產(chan)品(pin)是(shi)極具代表性的(de)(de)一類,尤其是(shi)人(ren)(ren)(ren)形(xing)機(ji)器(qi)(qi)人(ren)(ren)(ren)可以說是(shi)展(zhan)會(hui)上最能代表前(qian)沿科技(ji)成果的(de)(de)焦點。英偉達演講期間14款機(ji)器(qi)(qi)人(ren)(ren)(ren)登場組(zu)成的(de)(de)“人(ren)(ren)(ren)形(xing)機(ji)器(qi)(qi)人(ren)(ren)(ren)軍團(tuan)”加(jia)上黃仁勛那(nei)句“通用機(ji)器(qi)(qi)人(ren)(ren)(ren)的(de)(de)ChatGPT時刻即將到來(lai)”的(de)(de)感(gan)嘆,令人(ren)(ren)(ren)印象深刻。

從人形機器人前后的發布足跡來看,如果說之前機器人的性能革新,AI技術還隱于底層軟硬件背后,更強調場景任務精密地控制執行。那么最近圍繞人形機器人的性能革新,都已經不約而同地圍繞一個關鍵宣傳詞——AI。

當前AI發展已經(jing)用盡(jin)了(le)(le)所有人類知識進行訓(xun)練,現在開始使用合(he)(he)成(cheng)(cheng)數據,并將(jiang)(jiang)在未來(lai)(lai)(lai)(lai) 3-4 年(nian)內發展到可以完成(cheng)(cheng)任(ren)何(he)認知任(ren)務(wu)。現階段AI已經(jing)給人類生活帶來(lai)(lai)(lai)(lai)了(le)(le)改變(bian),未來(lai)(lai)(lai)(lai)將(jiang)(jiang)繼續帶來(lai)(lai)(lai)(lai)巨大變(bian)革,甚至可以完成(cheng)(cheng)任(ren)何(he)人想要的事(shi)情(qing)。作為智能硬件的代(dai)表,機器人與AI的結合(he)(he)自然(ran)也更緊密,同時二者(zhe)的結合(he)(he)也加速了(le)(le)機器人向落(luo)地更進一步。

作為引領人形機器人浪潮的Optimus,馬斯克不久前公開表態要把特斯拉的未來押注在Optimus機器人上,2025年特斯拉的目標是制造數千臺人形機器人,2026年特斯拉的人形機器人產量將增加10倍,目標為生產5萬到10萬個人形機器人,以后或每年翻10倍。

除(chu)了人(ren)(ren)(ren)(ren)形機(ji)器(qi)人(ren)(ren)(ren)(ren),消費級智能(neng)機(ji)器(qi)人(ren)(ren)(ren)(ren)產品(pin)也開始(shi)涌(yong)現(xian),如陪(pei)伴機(ji)器(qi)人(ren)(ren)(ren)(ren)、清潔機(ji)器(qi)人(ren)(ren)(ren)(ren)、商業服務機(ji)器(qi)人(ren)(ren)(ren)(ren)均開始(shi)在智能(neng)化(hua)上衍生多(duo)樣功能(neng)。特別是今年(nian)年(nian)初陸續(xu)登場的眾多(duo)創新(xin)AI陪(pei)伴機(ji)器(qi)人(ren)(ren)(ren)(ren),帶動了AI機(ji)器(qi)人(ren)(ren)(ren)(ren)玩具這一新(xin)賽道的發展。

在前文《CES智能終端崛起引領算力下沉,端側AI芯片性能再革新》中曾提到過,英偉達梳理的AI技術進化路徑是從 Perception 感知AI到 Generative生成式AI,再到Agentic代理型AI,最終實現具備傳感與執行功能的Physical 物理型AI。

在Physical 物理型AI終極形態,任何能感知并執行操作的設備都被視為是機器人,并由AI賦能釋放應用潛力。物理AI這一概念正在引領AI技術在機器人端側的革新,通過硬件與模型的深度融合將AI從數字世界帶入物理世界。

智能化下半場,機器人與模型融合創新

機器人借力智能模型通過多模態能力增強智能理解和決策是現今產業鏈正在推進的方向,從近(jin)期人形機器(qi)人發展能明顯看(kan)出這個(ge)趨勢。

不久前阿(a)加犀攜手高通,發(fa)布了(le)全球首臺完(wan)全基于高通SoC的(de)端側(ce)多模(mo)(mo)態(tai)AI大模(mo)(mo)型人(ren)形機器人(ren)——“通天曉”(Ultra Magnus)。根據(ju)官(guan)方給出的(de)定(ding)位,這是基于終端側(ce)生成式AI的(de)具(ju)身智能人(ren)形機器人(ren)解決方案。

高通的QCS8550處理器為機(ji)器人(ren)動作(zuo)控制(zhi)、感知(zhi)、決策規劃和語音交互提(ti)供底(di)層計算能力支(zhi)持。同時(shi)機(ji)器人(ren)基于終端(duan)側(ce)大語言(yan)模型(xing)(xing)技(ji)術(shu),運用端(duan)側(ce)語言(yan)小模型(xing)(xing)識別實現(xian)自然語音交互和用戶意圖理解,此外還融(rong)合了視覺感知(zhi)技(ji)術(shu)對機(ji)器人(ren)運動控制(zhi)與作(zuo)業進行規劃。

在英偉達演講“人形機器人軍團”中亮相的銀河通用Galbot G1則搭載了具身抓取基礎大模型。不久前銀河通用也聯合北京智源人工智能研究院(BAAI)及北京大學(xue)和(he)香(xiang)港(gang)大學(xue)研究人員正式(shi)(shi)發布了具身抓取(qu)基礎大模型 GraspVLA。Galbot是人形(xing)機器(qi)人分(fen)支下(xia)的輪式(shi)(shi)人形(xing)機器(qi)人,即下(xia)半(ban)身采用AMR式(shi)(shi)的輪式(shi)(shi)移動地盤(pan),不追求雙足式(shi)(shi)在靈活移動上(shang)的性能,聚焦于上(shang)半(ban)身的功能執(zhi)行。

這里不過多展開二者的形態之爭,輪式的優勢在于從目前發展階段的商業化角度來看,輪式人形機器人設計、制造成本會相對較低一些,輪式移動底盤已經相當成熟比雙足的運動控制簡單很多成本也更低,在商業化上可能先取得進展。聚焦在上肢的(de)功能執行,Galbot的(de)模(mo)型(xing)層(ceng)通(tong)過仿真合(he)成數(shu)(shu)據(ju)自研(yan)合(he)成千萬級的(de)場景(jing)數(shu)(shu)據(ju)以(yi)及(ji)海量抓(zhua)取(qu)和導(dao)航(hang)數(shu)(shu)據(ju)來掌握泛(fan)化閉環抓(zhua)取(qu)能力,達成基礎的(de)感知操作模(mo)型(xing)。

去年剛剛成(cheng)立的(de)靈(ling)初智(zhi)能(neng)不(bu)久前(qian)也發布(bu)首個(ge)基于強化學習(RL)的(de)具(ju)身(shen)模(mo)型(xing) Psi R0。該模(mo)型(xing)也是感知操作模(mo)型(xing),支(zhi)持雙靈(ling)巧手將多(duo)個(ge)技能(neng)串聯進行復雜(za)操作,還可以實現跨(kua)物(wu)品、跨(kua)場景(jing)級別的(de)泛化。

不止是2B類機器人在融合模型開始智能化升級,在許多消費類機器人產品上,這一趨勢發展得同樣迅速,特別以語言與感知模型與終端側的結合居多。

大象機器人開發(fa)陪伴(ban)類機器人以動物(wu)外(wai)觀作為外(wai)形設計,搭載AI大模型(xing),理解人類語(yu)意和情感判別,提供情緒價值為主的智能交(jiao)互。

TCL近期推出的的分體式智能家居陪(pei)伴機器人(ren)Ai Me基(ji)于AI大模型不僅能(neng)(neng)與人(ren)進行(xing)多模態(tai)的自然交互,提供溫暖的情感陪(pei)伴和(he)擬人(ren)互動,還能(neng)(neng)智(zhi)能(neng)(neng)移動并自動捕(bu)捉家(jia)庭美(mei)好瞬間。此外,Ai Me還會通過與用戶的互動不斷學習和(he)適應家(jia)庭成員(yuan)行(xing)為習慣控制家(jia)居設備,在陪(pei)伴等情緒價值(zhi)之外兼(jian)顧了家(jia)居智(zhi)能(neng)(neng)中控的功(gong)能(neng)(neng),功(gong)能(neng)(neng)發散得越來越多樣。

在清(qing)潔(jie)家電深耕多年的(de)云鯨智(zhi)能同樣在向(xiang)機(ji)器人+模型的(de)具(ju)身智(zhi)能方(fang)向(xiang)轉變,推(tui)出的(de)逍遙(yao)系列已(yi)經是具(ju)身智(zhi)能雛形,通(tong)過大模型下達清(qing)潔(jie)指令,機(ji)器人依靠(kao)自(zi)己的(de)語義理(li)解去(qu)行動、識別、完成清(qing)潔(jie)。

消費類機器人尤其是提供情緒價值的陪伴類機器人有著很強的玩具屬性,在模型技術的發展下這些機器人從簡單的互動設備進化到集教育、陪伴和娛樂功能于一身。這類機器人和手辦、玩偶以及“谷子”一樣,能在情緒上給予消費者很高價值反饋,有著很高的市場接受度高,市場空間正在打開。

其實將視野再放大一些,很多創新的實體終端設備都開始搭載AI技術來迭代功能,在終端設備與終端側AI的深度融合下,未來手機、PC,家電、汽車、玩具等等設備未嘗不是另一種形態的機器人,這些實體的智能終端也正是物理AI的愿景。

在這些終端市場的發展上,終端側AI也正朝著多模態融合、模型小型化與適配等方向發展,與終端硬件配置協同更新。可以說正是因為模型能力已演進到一定程度能在終端側賦能硬件,才讓物理AI變得可行。

Physical物理型AI,用模型賦能機器人潛力

Physical物理型AI在基礎硬件上的需求提升自然是全方位的,聚焦在模型上,硬件配置完備機器人能否在不確定的環境下正常運行,決定因素之一是具不具備泛化決策能力的“大腦”。建立起對空間與物理過程進行精準建模、理解與推理決策的“世界模型”是實現具身智能的前提。

以NVIDIA在CES 2025上面向物(wu)(wu)(wu)理(li)(li)AI開發發布的最新(xin)“世界基礎(chu)模(mo)(mo)型(xing)(xing)”——Cosmos為代(dai)表(biao),Cosmos是一套“用于物(wu)(wu)(wu)理(li)(li)感知視(shi)頻生(sheng)成(cheng)的開放式擴散和(he)自回歸 Transformer 模(mo)(mo)型(xing)(xing)”,擁(yong)有一系列開放的預訓練世界基礎(chu)模(mo)(mo)型(xing)(xing),可以預測和(he)生(sheng)成(cheng)虛擬環境未來狀(zhuang)態(tai)的物(wu)(wu)(wu)理(li)(li)感知視(shi)頻的神經網絡(luo)。該世界基礎(chu)模(mo)(mo)型(xing)(xing)通過(guo)生(sheng)成(cheng)合成(cheng)數據,使用包(bao)括文本、圖像、視(shi)頻和(he)運動(dong)在內的輸入數據來生(sheng)成(cheng)和(he)仿(fang)真虛擬世界,以準確模(mo)(mo)擬場景中(zhong)物(wu)(wu)(wu)體的空(kong)間關系及其物(wu)(wu)(wu)理(li)(li)交互(hu)。

應該說在當前的AI架構和模型范式下,通過生成式物理仿真,捕捉現實世界時空四維鏡像,從而獲取大量的物理數據是實現具身智能的關鍵。和語言大模型不一樣,機器人世界模型所需的訓練數據需要精確標定來進行學習和泛化,很難從現實世界完成龐大的采集量且采集后多模態數據很難標定,度量不一這些數據就無法被模型利用。

機器人模型從Sim到Real也就成了更有效率的一條路,生成大量可控的(de)(de)基于物(wu)理學(xue)的(de)(de)合成數據,仿(fang)真虛擬世界以(yi)(yi)準確模擬場景(jing)中(zhong)物(wu)體(ti)的(de)(de)空間(jian)關(guan)系及其物(wu)理交互。在(zai)物(wu)理AI模型部(bu)署(shu)到現實(shi)世界之前進行仿(fang)真測試和(he)調試,以(yi)(yi)及在(zai)虛擬環境中(zhong)進行強化學(xue)習以(yi)(yi)加速AI智(zhi)能體(ti)學(xue)習。然后通過部(bu)分(fen)真實(shi)數據做(zuo)對齊(qi),進一步提高機器人執行準確性,最終實(shi)現物(wu)理AI愿(yuan)景(jing)。

當然,實現真正意義上的Physical物理型AI,這些世界模型的建立與應用需要更多的計算能力和海量數據的學習與訓練。除了通向物理AI終局的世界模型,終端側大模型以及細分小模型的應用已經在持續推動終端設備智能化進程,讓其擁(yong)有(you)感知環境變化,依據(ju)觀測數據(ju)優化決策,從而更精確地進行物(wu)理交互的能(neng)力。而未來更全面(mian)更真實(shi)世界模型(xing)與(yu)終端(duan)機(ji)器人的融(rong)合將進一(yi)步將AI向物(wu)理AI終局推動。

世界模型與下沉到端側的語言、感知、操作模型共同賦能下物理Al將不斷賦予“以機器人為代表的終端物理設備”自我適應和深度決策能力,使其在(zai)真實世界中具備更強的動手與動腦能力。

這里強調了是“以機器人為代表的終端物理設備”,物理AI的終局并不一定是現階段我們認知的機器人,尤其不一定是人形。物理(li)形態只是載體(ti),在AI的加持下,設備(bei)外形設計(ji)適(shi)配具(ju)體(ti)任務的執行即可(ke)。在終(zhong)端(duan)設備(bei)與終(zhong)端(duan)側AI的深度融合(he)下,未(wei)來家電設備(bei)、自動汽車等(deng)設備(bei)又(you)何(he)嘗不是另(ling)一種形態的機器人,這些實體(ti)的智能終(zhong)端(duan)也正是物理(li)AI的愿(yuan)景。

寫在最后

世(shi)界基(ji)礎(chu)模型提供物理世(shi)界知(zhi)識和高(gao)仿真(zhen)數據(ju),奠定泛化基(ji)礎(chu);端側模型經細化、壓縮及(ji)多模態融合優化,適配終(zhong)端側設備(bei)算(suan)力需求(qiu);加之基(ji)礎(chu)硬件如專用計算(suan)芯片(pian)、AI加速(su)器性能(neng)的提升,物理AI時代正在慢慢變為現實(shi)。


熱門文章
1 月 21 日,法國蜂窩物聯網芯片制造商 Sequans 宣布收購瑞士公司 ACP Advanced Circuit Pursuit AG(ACP),收購費用暫未披露。就在去年 8 月,Sequan
2025-01-24
X