在NVIDIA對AI技術進(jin)化路徑梳理(li)中,AI從感知型AI演進(jin)為生成式AI,再到代(dai)理(li)型AI,最終(zhong)將(jiang)實現Physical物(wu)理(li)AI。在物(wu)理(li)AI終(zhong)局,人形機(ji)器人、移動機(ji)器人、智能(neng)攝像頭和AI智能(neng)體等(deng)等(deng)任(ren)何能(neng)感知并執行任(ren)務的設備(bei)都會由AI賦(fu)能(neng)釋放應(ying)用潛力(li)。
在(zai)物理AI最具落地前(qian)景(jing)的(de)工(gong)業領(ling)域,雖然此前(qian)數字(zi)化轉(zhuan)型(xing)智(zhi)(zhi)(zhi)能(neng)(neng)制造升級的(de)變革已(yi)滲透多(duo)年,但大(da)多(duo)數工(gong)廠(chang)場景(jing)仍停留在(zai)自動(dong)化而非智(zhi)(zhi)(zhi)能(neng)(neng)化階段,離真正(zheng)實現感知(zhi)到認知(zhi)到決策的(de)閉環(huan)智(zhi)(zhi)(zhi)能(neng)(neng)相去甚遠。而現在(zai),物理AI的(de)進步,終于(yu)讓工(gong)業場景(jing)的(de)智(zhi)(zhi)(zhi)能(neng)(neng)化變革迎(ying)來了轉(zhuan)折點。
物理AI在工業場景的落地生根催生出前所未有的智能化躍遷。從早期以PLC為核心構建的機械自動化基石,到物聯網與(yu)云計算掀(xian)起的數據互(hu)聯化浪潮,工業系統(tong)完成(cheng)了從孤立運算到云端協同的歷史性跨(kua)越。
現在,物理AI帶來的(de)(de)閉環智(zhi)能,突破了傳統規則引擎的(de)(de)邏(luo)輯桎梏,將工業系(xi)統的(de)(de)決策(ce)模式從“經驗驅動”推向(xiang)“自主智(zhi)能”。這種變革不僅(jin)是效率的(de)(de)提升,更是工業生(sheng)產力本(ben)質的(de)(de)重塑。
在此前物聯網智庫探討端(duan)(duan)側(ce)(ce)AI的(de)文章中,曾表達過這樣一個觀(guan)點(dian),“端(duan)(duan)側(ce)(ce)硬(ying)件(jian)設備借(jie)力智能(neng)模(mo)型通過多模(mo)態(tai)能(neng)力增強智能(neng)理解和(he)決(jue)策是(shi)現今(jin)產業鏈正(zheng)在(zai)推進的(de)方向,其目的(de)是(shi)通過硬(ying)件(jian)與模(mo)型的(de)深度融合將AI從數字世(shi)界帶入物理世(shi)界。”
物理AI設備其實可以看作是端側AI設備的終極形態,在基礎的算力、感知、運控硬件配置上,物理AI在模型配置上向前更進一步,即使用世界模型將人工智能與物(wu)理(li)世界的規律、機理(li)深度融合,通過數據驅動與物(wu)理(li)建模(mo)的協同,實現對物(wu)理(li)系統的精準模(mo)擬(ni)、預測、控制與優化(hua)。
以(yi)最具(ju)代表性(xing)的(de)(de)(de)物理(li)AI設備人(ren)(ren)形機(ji)器(qi)(qi)人(ren)(ren)為例,工(gong)規級機(ji)器(qi)(qi)人(ren)(ren)硬(ying)件配(pei)置(zhi)(zhi)雖(sui)然會有差異(yi),但基礎(chu)能(neng)力是(shi)完備的(de)(de)(de),拉不(bu)開太大(da)差距,機(ji)器(qi)(qi)人(ren)(ren)能(neng)否在動(dong)態(tai)且復雜的(de)(de)(de)工(gong)廠(chang)環境下對空間與(yu)物理(li)過程進行(xing)精(jing)準建模(mo)、理(li)解與(yu)推理(li)決策,很大(da)程度上取(qu)決于(yu)其配(pei)置(zhi)(zhi)的(de)(de)(de)世(shi)界(jie)(jie)模(mo)型大(da)腦。世(shi)界(jie)(jie)模(mo)型是(shi)實現物理(li)AI的(de)(de)(de)前提(ti),也是(shi)機(ji)器(qi)(qi)人(ren)(ren)實現具(ju)身智能(neng)的(de)(de)(de)前提(ti)。
在(zai)早些時候的(de)(de)CES上,NVIDIA發(fa)(fa)(fa)布過(guo)面向物理(li)AI開(kai)(kai)發(fa)(fa)(fa)的(de)(de)Cosmos。NVIDIA Cosmos是(shi)一個世(shi)界(jie)基礎模型(xing)(WFM)開(kai)(kai)發(fa)(fa)(fa)平(ping)(ping)臺,用(yong)于推(tui)動物理(li)AI的(de)(de)發(fa)(fa)(fa)展。其核心是(shi)Cosmos WFM,這些開(kai)(kai)放可(ke)用(yong)的(de)(de)預訓(xun)練(lian)多模態模型(xing)可(ke)供(gong)開(kai)(kai)發(fa)(fa)(fa)者直(zhi)接(jie)使(shi)用(yong),用(yong)于生成視頻形(xing)式的(de)(de)世(shi)界(jie)狀(zhuang)態和物理(li)AI推(tui)理(li),或(huo)通過(guo)后(hou)訓(xun)練(lian)開(kai)(kai)發(fa)(fa)(fa)專門的(de)(de)物理(li)AI模型(xing)。NVIDIA Cosmos還(huan)包括先進的(de)(de)視覺標記(ji)器(tokenizers)、護欄(lan)(guardrails)、加速視頻數(shu)據處理(li)平(ping)(ping)臺以(yi)及后(hou)訓(xun)練(lian)框架。
而后在GTC2025上,NVIDIA推(tui)(tui)出了(le)(le)全新NVIDIA Cosmos世界基礎(chu)模(mo)型(xing)(xing)的(de)重大更新,在基礎(chu)模(mo)型(xing)(xing)上引(yin)入了(le)(le)開放式、可完全定(ding)制的(de)物理(li)AI開發推(tui)(tui)理(li)模(mo)型(xing)(xing)。黃仁勛(xun)表示,“正(zheng)如大語言模(mo)型(xing)(xing)改變(bian)了(le)(le)生成式和代(dai)理(li)式AI,Cosmos世界基礎(chu)模(mo)型(xing)(xing)是(shi)物理(li)AI的(de)一(yi)(yi)項重大突(tu)破,它為物理(li)AI帶來了(le)(le)一(yi)(yi)個(ge)開放式、可完全定(ding)制的(de)推(tui)(tui)理(li)模(mo)型(xing)(xing),為機(ji)(ji)器人(ren)和物理(li)工業(ye)領域的(de)突(tu)破性發展帶來了(le)(le)機(ji)(ji)遇。”

據了解,Cosmos Predict是(shi)通(tong)用模(mo)型,用于從(cong)多模(mo)態(tai)輸入生(sheng)成世界狀態(tai)和運(yun)動預測(ce),專(zhuan)為后訓(xun)練開發(fa)專(zhuan)門的(de)物(wu)理AI模(mo)型而設(she)計。Cosmos Predict作為NIM提供,可(ke)(ke)以隨(sui)處部署以實現更快(kuai)推(tui)理。Cosmos Reason是(shi)完全可(ke)(ke)定制的(de)多模(mo)態(tai)模(mo)型,用于思(si)維鏈推(tui)理以規劃最(zui)佳響應。而Cosmos Transfer基于結構(gou)輸入或來(lai)自NVIDIA Omniverse的(de)真實數據,可(ke)(ke)根(gen)據提示,生(sheng)成不同場景風格的(de)視頻。
同時NVIDIA還推出了與(yu)Cosmos世界基礎模型相連接的(de)新NVIDIA Omniverse Blueprint,一(yi)個(ge)將全球(qiu)物(wu)理(li)數據(ju)與(yu)物(wu)理(li)AI領域連接起來的(de)操作系統(tong)(tong)。產業(ye)鏈可(ke)以借助(zhu)Omniverse,實現用于物(wu)理(li)AI開(kai)發的(de)機(ji)器(qi)人就緒設施(shi)和大規模合成數據(ju)生成,快速統(tong)(tong)一(yi)工(gong)業(ye)生態(tai)系統(tong)(tong)并構建(jian)新應(ying)用,助(zhu)力AI工(gong)廠的(de)實現。
這些世(shi)(shi)(shi)界(jie)模型(xing)為(wei)物(wu)理(li)AI提(ti)供(gong)“認(ren)知(zhi)底座(zuo)”,提(ti)供(gong)對(dui)物(wu)理(li)世(shi)(shi)(shi)界(jie)的(de)結構化理(li)解(jie);物(wu)理(li)AI則作(zuo)為(wei)世(shi)(shi)(shi)界(jie)模型(xing)的(de)“應用載體”,通(tong)過工程化設計(ji)使(shi)其(qi)適應真實(shi)場景(jing)的(de)嚴苛要求。二(er)者的(de)深度整合(he),正從數據驅動的(de)效率優(you)化邁(mai)向認(ren)知(zhi)驅動的(de)智能重構,這將明顯提(ti)升工業系(xi)統(tong)的(de)自主決策(ce)能力與復雜場景(jing)適應性(xing)。
在AI工廠(chang)內(nei),物理(li)(li)AI基于物理(li)(li)原理(li)(li)能(neng)(neng)夠充分理(li)(li)解并精(jing)準模擬工業設備的運(yun)行狀(zhuang)態(tai)與(yu)未來狀(zhuang)態(tai),大(da)幅提(ti)升(sheng)生(sheng)產效率與(yu)設備智能(neng)(neng)化程(cheng)(cheng)度。例如基于過往運(yun)行數據和物理(li)(li)規律,工廠(chang)能(neng)(neng)進行更(geng)精(jing)準的預測(ce)性(xing)維(wei)護,機器人等設備則能(neng)(neng)實時感知環境變化并基于物理(li)(li)規律做出精(jing)準動作(zuo)調整,增強生(sheng)產靈活性(xing)與(yu)協同性(xing),全方位提(ti)升(sheng)工業智能(neng)(neng)化程(cheng)(cheng)度。
物理AI以世界模型為數字(zi)引擎,正在賦(fu)予工業(ye)系統(tong)完整(zheng)智能閉環,推動(dong)工業(ye)智能化從(cong)“被動(dong)響(xiang)應”向“主動(dong)進化”躍遷。
不論是基(ji)礎的(de)(de)生成(cheng)(cheng)(cheng)式(shi)AI模(mo)型、VLA多模(mo)態(tai)模(mo)型還(huan)是推進物理AI實現的(de)(de)世(shi)界(jie)模(mo)型,都需要大(da)量的(de)(de)數據(ju)(ju)(ju)進行訓練優化(hua)。這(zhe)就涉(she)及真實數據(ju)(ju)(ju)與合成(cheng)(cheng)(cheng)數據(ju)(ju)(ju),特別是在(zai)工業場(chang)(chang)景(jing),采集(ji)大(da)量用(yong)(yong)于訓練的(de)(de)真實數據(ju)(ju)(ju)存在(zai)一(yi)定難度(du),且場(chang)(chang)景(jing)的(de)(de)多模(mo)態(tai)數據(ju)(ju)(ju)很(hen)難統(tong)(tong)一(yi)在(zai)同一(yi)個(ge)標(biao)定尺度(du)內,而這(zhe)些(xie)數據(ju)(ju)(ju)不經(jing)過精確統(tong)(tong)一(yi)標(biao)定就無(wu)法被(bei)用(yong)(yong)來訓練學習。這(zhe)也是為什么來自傳(chuan)統(tong)(tong)系統(tong)(tong)的(de)(de)海量數字(zi)和物理世(shi)界(jie)數據(ju)(ju)(ju)容易形成(cheng)(cheng)(cheng)多個(ge)孤島,無(wu)法被(bei)充(chong)分利用(yong)(yong)起來。
對(dui)齊部分真(zhen)實數(shu)(shu)據(ju)生(sheng)成大量可控的(de)(de)符合物(wu)理規律的(de)(de)合成數(shu)(shu)據(ju),在物(wu)理AI模型部署到現實世界之前(qian)進行仿真(zhen)測試(shi)和調試(shi),成為提高開發(fa)(fa)效率(lv)的(de)(de)一條路徑。這也是NVIDIA推出Omniverse的(de)(de)原因之一,幫(bang)助開發(fa)(fa)者統(tong)一物(wu)理世界的(de)(de)數(shu)(shu)據(ju)和應用,實現物(wu)理AI的(de)(de)大規模合成數(shu)(shu)據(ju)生(sheng)成。

根據不同的任務,Omniverse聚合現實世界中的傳感器數據,隨后對世界模型進行調控,將原始采集數據拓展生成為大量高度逼真且多樣的數據,借助被Cosmos與Omniverse增強后的數據集,設備運營策略能夠在數字孿生中進行充分的模(mo)擬(ni)訓(xun)練(lian)。
Cosmos與Omniverse提(ti)供(gong)了(le)一個在真實世界可采集的數據(ju)之外(wai),擴展逼真訓練數據(ju)的機會。據(ju)了(le)解(jie),領(ling)先的工(gong)業(ye)軟件和服(fu)務提(ti)供(gong)商如Ansys、Databricks、Dematic、Omron、SAP、Schneider Electric with ETAP、西門子等正在將NVIDIA Omniverse平(ping)臺集成(cheng)到(dao)他們(men)的解(jie)決(jue)方(fang)案中(zhong),利用Omniverse加速物理AI訓練推動工(gong)業(ye)數字化。
在GTC2025的主(zhu)題演講中(zhong),黃(huang)仁勛就(jiu)展示了如(ru)何基于Omniverse Blueprint開發(fa)應用,以(yi)規劃(hua)、優化(hua)和模擬一座AI工(gong)(gong)廠(chang)(chang)(chang)。Omniverse使用OpenUSD庫,使來自(zi)不同來源的3D數(shu)據得以(yi)聚合(he)在一起,為所有數(shu)據源提供通用語(yu)言。在合(he)成(cheng)數(shu)據與(yu)部分真實(shi)數(shu)據的實(shi)時(shi)仿真下,AI工(gong)(gong)廠(chang)(chang)(chang)配置能夠實(shi)時(shi)調整,并(bing)立即看(kan)到影響,進而繼續改進。可以(yi)說Omniverse既打破了工(gong)(gong)程(cheng)團隊中(zhong)的設(she)計(ji)壁壘,還加(jia)速了工(gong)(gong)廠(chang)(chang)(chang)決策制定(ding)與(yu)基礎設(she)施建設(she),同時(shi)降低了在現實(shi)世界中(zhong)測試(shi)所產生的成(cheng)本和風險。
其實在(zai)工(gong)業制(zhi)造走向物理AI的(de)過程中,工(gong)業代(dai)理式AI與(yu)工(gong)業智能體(ti)概念已經(jing)呼(hu)之欲出。在(zai)GTC上(shang)NVIDIA就提到過正(zheng)在(zai)將AI智能體(ti)集成到Omniverse中,并(bing)展示了工(gong)業視覺(jue)AI智能體(ti)的(de)應用。
在(zai)工(gong)(gong)業智(zhi)能(neng)(neng)(neng)化升級的(de)(de)轉(zhuan)折點上(shang)(shang),AI智(zhi)能(neng)(neng)(neng)體不再(zai)是(shi)被動的(de)(de)算法工(gong)(gong)具,而是(shi)被賦予了理(li)解能(neng)(neng)(neng)力(li)(li)與協作(zuo)能(neng)(neng)(neng)力(li)(li)的(de)(de)智(zhi)能(neng)(neng)(neng)工(gong)(gong)作(zuo)節點。從(cong)單個應用節點來說,在(zai)場(chang)景(jing)感知與物理(li)推理(li)的(de)(de)基礎上(shang)(shang),智(zhi)能(neng)(neng)(neng)體能(neng)(neng)(neng)應用到(dao)極其細(xi)分的(de)(de)工(gong)(gong)業應用上(shang)(shang),如上(shang)(shang)面(mian)提到(dao)的(de)(de)視覺應用。從(cong)工(gong)(gong)業全局場(chang)景(jing)來看,智(zhi)能(neng)(neng)(neng)體能(neng)(neng)(neng)夠聚合場(chang)景(jing)內IT與OT信(xin)息并提供自主(zhu)運營決策,這也是(shi)傳(chuan)統工(gong)(gong)廠(chang)向AI工(gong)(gong)廠(chang)升級的(de)(de)可預(yu)見方向。
從代理(li)式AI到(dao)物(wu)理(li)AI,工業世界(jie)正在向軟(ruan)硬共生軟(ruan)件(jian)定義轉型(xing),圍繞物(wu)理(li)AI體系搭建的模型(xing)與(yu)平(ping)臺,為AI快(kuai)速進(jin)入到(dao)工業應用(yong)提供了一條路徑。
隨著物理(li)AI與世界(jie)(jie)模(mo)型技術(shu)進一步迭代(dai),有(you)望打(da)破物理(li)世界(jie)(jie)與數字(zi)世界(jie)(jie)的(de)最(zui)后壁壘(lei)。特別(bie)是在工業領域,二(er)者融(rong)合(he)正在讓每一臺(tai)工業設備(bei)都(dou)成為智能節(jie)點,讓每一條工廠產(chan)線都(dou)成為進化單元,最(zui)終構建(jian)起自(zi)感知、自(zi)決策、自(zi)執行、自(zi)優(you)化的(de)下一代(dai)智能工業體(ti)系。