作者(zhe):彭昭(zhao)(智次方創始(shi)人(ren)、云和資本聯合(he)創始(shi)合(he)伙人(ren))
這(zhe)是我的第361篇專欄文章。
DeepSeek的(de)熱度持續(xu)發(fa)酵,目前已有超過30家企業推出了“大模型一體機”,其(qi)中以(yi)“DeepSeek”命名的(de)約有20家。
這一現象實際上反映了中國人工智能大模型從量變到質變的演進過程。
根據信(xin)通院發布(bu)的《全(quan)球數字(zi)經(jing)濟白皮書》,中國擁(yong)有全(quan)球超1/3的人(ren)工(gong)智能大型語言(yan)模型(LLM)。數據顯示,全(quan)球LLM數量已達1328個,中國占(zhan)比36%,僅次于美國,位居第二。
可以預見,在與LLM大模型接壤的小型語言模型SLM和AI智能代理領域,中國企業的崛起也指日可待。
作為制造業強國,中國為AI硬件的蓬勃發展提供了得天獨厚的土壤。
未來,我們將看到(dao)越來越多(duo)能夠(gou)智能響應(ying)主(zhu)人語音指令的(de)(de)AI家(jia)居硬(ying)件(jian),以及與環境(jing)無縫互動(dong)的(de)(de)AR智能眼(yan)鏡等創(chuang)新產品(pin)。這(zhe)些產品(pin)的(de)(de)問世,將進(jin)一步(bu)推動(dong)AI技術在日常生活中的(de)(de)普及和應(ying)用(yong)。
值得注意的是,進入2025年,AI智能代理的時代已經來臨。在不久的將來,AI代理(li)將能(neng)夠勝任許(xu)多任務(wu),大大提高生產效率和生活品質。新興(xing)的技(ji)術框架將使我們能(neng)夠更(geng)快、更(geng)高效地(di)構(gou)建AI代理(li)。
目前(qian)各大科技巨頭(tou)也已經展(zhan)開(kai)了一場爭奪AI代理(li)的關鍵競賽。
這將形成一種新的經濟形態:AI代理經濟的崛起,我們也將由此從AI模型進入AI代理經濟的發展階段。
在AIoT領域,尤其是SLM的發展(zhan)趨勢以及AI代理經濟的未(wei)來形態值得我們密切關注。
一(yi)方(fang)面,SLM與LLM的(de)(de)(de)融(rong)合將催生(sheng)出更多適用于(yu)特(te)定場(chang)景的(de)(de)(de)AI解決方(fang)案(an);另一(yi)方(fang)面,AI代理經濟的(de)(de)(de)崛(jue)起將重(zhong)塑人(ren)機交互(hu)的(de)(de)(de)方(fang)式(shi),為(wei)各行各業帶來創新變(bian)革。
因此今天這篇文章,我們(men)一(yi)起來探(tan)索更適(shi)合AIoT領(ling)域的SLM發展趨勢(shi)以(yi)及AI代理經(jing)濟的未(wei)來形態。

根據Gartner的預測,SLM(也被稱為輕量級LLM)的興起已經成為確定的趨勢。小型語言模型SLM彌合了高性能人工智能系統與安全、經濟高效的解決方案需求之間的差距。
這些SLM模型不僅(jin)經濟高(gao)效,而且(qie)適(shi)應性(xing)強(qiang),能夠以最少的資(zi)源(yuan)需求提供(gong)高(gao)質量的結果,因此成為企(qi)業的理想(xiang)選(xuan)擇。

看到了小模型的獨特機會,知名企業已經紛紛布局。隨著技術(shu)的(de)發展(zhan),小模型不僅發揮了低成(cheng)本上(shang)的(de)優(you)勢,在性能(neng)上(shang)也不遜色于大模型。
如下圖所(suo)示,通過將Llama 8B與(yu)大(da)(da)模型(xing)GPT-4o進(jin)行(xing)比較(jiao),我們發(fa)現(xian)雖然GPT在質量方面(mian)比小型(xing)模型(xing)高出20%以(yi)上,但在增強了小型(xing)Llama模型(xing)之(zhi)后,它(ta)可以(yi)與(yu)LLM相媲美,并且在某(mou)些任務(wu)中表現(xian)優于(yu)LLM,同時(shi)保持較(jiao)低的使用成本。差異如此之(zhi)大(da)(da),令人難(nan)以(yi)忽(hu)視。
Llama 3.1-8B與GPT-4o的(de)比(bi)較(jiao)進一步證(zheng)明了SLM在(zai)成(cheng)本(ben)和性能(neng)方面的(de)優勢,見下圖。首先,與LLM相(xiang)比(bi),SLM的(de)運行(xing)成(cheng)本(ben)只是其(qi)一小部分(fen)。在(zai)零樣本(ben)設置(zhi)中,Llama 3.1-8B的(de)成(cheng)本(ben)明顯低于GPT-4o。其(qi)次(ci),只需進行(xing)少量額外(wai)訓練(lian),SLM就能(neng)在(zai)特定任務(如客戶支持或法律研究)中達到接近甚至(zhi)超過(guo)LLM的(de)質(zhi)量水(shui)平。最后,Llama 3.1-8B在(zai)經過(guo)精細調整的(de)設置(zhi)下實(shi)現了超過(guo)96%的(de)任務質(zhi)量,證(zheng)明了其(qi)在(zai)重點用例中實(shi)現高精度輸出的(de)能(neng)力。


從功能定位上看,LLM更像是“云端AI操作系統”,吸收中間層,形成API生態;而SLM更像是“本地AI計算引擎”,嵌入終端設備,增強隱私與實時性。

未來,LLM與SLM將形成端云協同,共同推動AI的發展。
隨著技術的不斷發展,LLM和SLM的未來趨勢也呈現出不同(tong)的特(te)點,我們不妨進行一個對比。如上圖(tu)所示,我們先看(kan)左側的LLM部分:
首先,核心LLM將成為通用AI基礎設施。未來可能形成極少數頭(tou)部LLM競爭的(de)格局,類似于(yu)Android與iOS的(de)雙寡頭(tou)或多寡頭(tou)情(qing)形,而不是(shi)單(dan)一標準。OpenAI、Google、Anthropic、Meta、DeepSeek等都(dou)可能成為基礎模型(xing)提供商(shang),并(bing)各(ge)自(zi)形成生態。這種格局可能會演(yan)化(hua)成開源(yuan)vs商(shang)業閉源(yuan)的(de)兩大陣營。
其次,云服務商層將實現API化,但存在更多差異化競爭。大模型即(ji)服(fu)務(wu)(wu)(LLM-as-a-Service)將成為標配,但不(bu)同云服(fu)務(wu)(wu)商可能會圍繞行(xing)業(ye)垂(chui)類(lei)優化(hua),形(xing)成差(cha)異化(hua)競爭(zheng)。例如(ru),金融(rong)、醫療、法律(lv)、教育(yu)等垂(chui)直行(xing)業(ye)的LLM可能會有更(geng)定制化(hua)的API,而不(bu)是直接使用通用LLM。
第三,中間層將向更專業的AI代理形態演進。雖然(ran)一部分(fen)優(you)化(hua)和功能會(hui)被云(yun)服務(wu)和底層模型吸收(shou),但插件化(hua)、代理(li)(li)化(hua)、模型微調等(deng)工具仍然(ran)有生存空(kong)間。例如,企業(ye)級RAG解(jie)決(jue)方案、特(te)定行(xing)業(ye)的定制化(hua)LLM以及AI代理(li)(li)生態等(deng)都將得(de)到發(fa)展(zhan)。
第四,應用層將聚焦高價值場景。AI作(zuo)(zuo)為增強(qiang)人類(lei)能力(li)的Copilot存在,我們(men)與AI的交互(hu)方式(shi)可能發生改(gai)變,大部分企業(ye)都(dou)需要將(jiang)AI作(zuo)(zuo)為客(ke)戶類(lei)型之(zhi)一進行考慮。例(li)如(ru),AI可能會(hui)在法律、醫療、教(jiao)育、設計、軟(ruan)件(jian)開發等(deng)領域提升生產力(li),而不是(shi)完全取代人類(lei);AI可能會(hui)增強(qiang)個性化體驗(yan),如(ru)AI生成(cheng)的個性化教(jiao)育方案、健(jian)康管理等(deng)。軟(ruan)件(jian)與硬件(jian)的編寫和(he)制造方式(shi)都(dou)將(jiang)發生改(gai)變,例(li)如(ru)前特斯拉人工智(zhi)能高(gao)級總監Andrej Karpathy提出(chu)軟(ruan)件(jian)2.0就是(shi)從人工編寫代碼(ma)(ma)過渡(du)到(dao)基于大量數據(ju)觀察自動生成(cheng)代碼(ma)(ma)。
第五,零邊際成本社會可能會成真。各類(lei)AI的(de)邊際成(cheng)本確實在降低,但數據隱私、算力成(cheng)本、監(jian)管(guan)(guan)框(kuang)架可能會(hui)(hui)成(cheng)為影(ying)響因(yin)素(su)。例如,歐盟(meng)、美國(guo)(guo)、中國(guo)(guo)等國(guo)(guo)家可能會(hui)(hui)對AI訓練數據、生成(cheng)內容合規性(xing)進行監(jian)管(guan)(guan),影(ying)響AI任務(wu)的(de)自由度(du);個人數據安全(quan)、企業專(zhuan)有(you)數據的(de)AI處(chu)理(li),可能會(hui)(hui)影(ying)響AI服務(wu)的(de)邊際成(cheng)本是否真的(de)趨近于零(ling)。
與LLM主要依賴于云端大規模算力不同,SLM更適用于邊緣計算、低功耗設備、端側智能,因此其趨勢可能與LLM不同。
首先,SLM將廣泛植入邊緣硬件,如智能家居硬件、車載設備、工業設備等。受限于設備算力、尺寸以及功耗的制約,SLM將會(hui)被進一(yi)步(bu)針對設備“量身(shen)定制”。例如,智能門鎖的SLM可(ke)自主識別用戶,提供個性化安全管理;工業生產(chan)線的SLM可(ke)基(ji)于傳感器數(shu)據進行(xing)故(gu)障預測和優(you)化生產(chan)。
其次,本地AI計算將減少對云的依賴,增強隱私保護。本(ben)地運行SLM可(ke)(ke)以(yi)(yi)減(jian)少(shao)數(shu)據(ju)上傳云(yun)端的風(feng)險,例如端側AI計算可(ke)(ke)以(yi)(yi)在智能硬件上直接完成(cheng)NLP任務(wu),而無(wu)需(xu)聯網。邊緣AI可(ke)(ke)以(yi)(yi)本(ben)地識別(bie)語音(yin)、圖像、手勢(shi),減(jian)少(shao)依賴云(yun)端服務(wu)器,提高響應速度。此(ci)外,云(yun)端算力昂貴(gui),本(ben)地SLM可(ke)(ke)以(yi)(yi)降(jiang)低(di)AI計算的長(chang)期成(cheng)本(ben)。
第三,SLM可能形成“端云協同”模式。本(ben)地SLM處理常見(jian)任務(wu),如(ru)(ru)語音助手、圖像識別(bie)、文檔摘要、翻譯等;云(yun)端(duan)LLM處理高復雜度任務(wu),如(ru)(ru)AI代碼(ma)生成、AI科研(如(ru)(ru)AI生成藥物)等。
第四,SLM的商業模式可能是“設備即服務”或“AI訂閱制”。未來的(de)AI可(ke)能不再是單獨的(de)軟(ruan)件,而是硬件的(de)一部(bu)分。訂(ding)閱模(mo)式可(ke)能包括基(ji)礎AI功能免費(fei)、高(gao)級AI訂(ding)閱收費(fei),以及硬件+AI訂(ding)閱捆綁銷(xiao)售等。
最后,所有硬件都可以使用SLM重做一遍。在SLM的視角(jiao)下,硬(ying)件(jian)中的“原(yuan)子”和軟(ruan)件(jian)中的“比特”具(ju)有相似性,硬(ying)件(jian)可以按照軟(ruan)件(jian)的邏輯重新制(zhi)造,硬(ying)件(jian)制(zhi)造的邊際成本也(ye)將快速下降。

在(zai)探索(suo)了LLM與SLM的發展趨勢后(hou),我(wo)們再來分析基于這兩類人工智能(neng)模型的AI代理經濟。
與LLM主要依賴云端計算不同(tong),SLM更(geng)強(qiang)調本地計算、低(di)功耗和隱私保護,因此基于SLM的AI代理在組(zu)織方(fang)式和商業模式上都會有所不同(tong)。
SLM將更多嵌入智能家居、智能汽車、工業物聯網設(she)備(bei)等邊緣硬件,形成一個(ge)廣泛分(fen)布(bu)的AI代理網絡。
由此推斷,小模型AI代理可能將分為兩種模式:橫向AI代理生態和縱向AI代理生態。
橫向AI代理生態適用于大規模通用任務,如語音助手、智能翻譯、日(ri)程管理、家庭自動化等(deng)。這種模式具有低成本、高普及度(du)的(de)特(te)點(dian)。這類AI代理的(de)目標是提(ti)升用戶體驗(yan)、降低交互門檻(jian),并(bing)通(tong)過(guo)訂閱或(huo)硬(ying)件捆綁的(de)方式盈利。
縱向AI代理生態則適用于特定行業的專業AI任務,如(ru)智能汽車的AI駕(jia)駛助理、工業IoT設備(bei)的AI預(yu)測維護、醫療設備(bei)的AI診(zhen)斷支持等。這種模式具有高附加值、深度優化(hua)的特(te)點(dian)。這類AI代理可能直(zhi)接(jie)集成在終端設備(bei)中(zhong),由企(qi)業購(gou)買或訂閱。
相比LLM主要依賴云端API訪問,SLM代理經濟的核心驅動力在于以下幾點:
計算本地化,減少對云的依賴。SLM運行在本地設備上,減少云端計算成(cheng)本和隱私(si)風險(xian),適用于低時延任務(wu),如智能家居控制、車(che)載(zai)AI交互、邊(bian)緣(yuan)安全(quan)監控等。
AI代理的“隱形智能化”。未來AI代(dai)理(li)將默認嵌入(ru)設備,而不是單(dan)獨(du)的SaaS訂閱模式。硬件廠商會捆綁AI代(dai)理(li),例(li)如智能冰箱可以(yi)自動(dong)管理(li)食(shi)物存儲、智能汽(qi)車可以(yi)預測駕駛行(xing)為。
端云協同,智能分工。SLM處理本地(di)任務(wu),減少帶寬和算力消(xiao)耗,而云(yun)端LLM負責更復雜的推(tui)理任務(wu)。例如,智(zhi)能眼鏡上(shang)的AI助手可以(yi)本地(di)完成簡單任務(wu),但更復雜的任務(wu)仍然需要云(yun)端LLM支持。
SLM代理經濟的盈利模式也與LLM不同,更傾向于硬件+AI功能捆綁,或者采用訂閱增值模式。
硬件捆綁銷售可能將是一種主要模式,AI代(dai)理直接(jie)集成到智(zhi)(zhi)能設(she)備(bei)中,成為“默認功能”,用(yong)戶無需額外訂閱(yue)。這種模式適用(yong)于智(zhi)(zhi)能眼鏡(端(duan)側(ce)AI語(yu)(yu)音(yin)(yin)助手)、智(zhi)(zhi)能家居(AI語(yu)(yu)音(yin)(yin)控制+設(she)備(bei)管(guan)理)、智(zhi)(zhi)能汽車(AI駕駛輔助)、工業IoT設(she)備(bei)(AI預測性(xing)維護)等(deng)場景。
另一種模式是訂閱增值,部分高端AI代(dai)理(li)(li)功能(neng)可能(neng)會采用訂閱(yue)模式(shi),類似于特(te)斯拉FSD的(de)軟件訂閱(yue)。基(ji)礎AI代(dai)理(li)(li)免(mian)費(fei),高級AI代(dai)理(li)(li)訂閱(yue)收費(fei)。企(qi)業級AI代(dai)理(li)(li)(如(ru)AI質(zhi)檢、AI醫療分析)可能(neng)采用SaaS訂閱(yue)模式(shi)。
未來可能會出現端側AI代理市場,允許用(yong)(yong)戶下(xia)載(zai)和激活不(bu)同(tong)的SLM代理,類似于APP應用(yong)(yong)市(shi)場,但(dan)專門用(yong)(yong)于AI代理。用(yong)(yong)戶可(ke)以下(xia)載(zai)AI運動教練、AI營養師、AI車載(zai)助理等不(bu)同(tong)的智能體。“AI代理即服(fu)務”的商業模式可(ke)能成為主流(liu)。
總之(zhi),SLM在邊(bian)緣計算和端側智(zhi)能硬件中的AI代理經濟,將以“隱形AI智(zhi)能+端云協同(tong)”為核(he)心,形成“硬件捆綁+訂閱(yue)增(zeng)值+代理市場”的商(shang)業模式。
DeepSeek的(de)(de)持續熱度反映了中國在(zai)AI領域的(de)(de)快速崛起,這(zhe)種量變(bian)到質變(bian)的(de)(de)飛躍離(li)不(bu)(bu)開(kai)中國的(de)(de)獨特土(tu)壤,未來的(de)(de)進(jin)一步催化(hua)也(ye)離(li)不(bu)(bu)開(kai)LLM與SLM的(de)(de)協同發展。
LLM作為“云端(duan)AI操作系(xi)統”,SLM則扮(ban)演著“本(ben)地AI計算引擎”的(de)角色(se),兩者在功(gong)能定位和商業模式上各有側重。
DeepSeek現(xian)象(xiang)的(de)持續發酵,正(zheng)(zheng)是這一歷史性轉折的(de)生動注腳(jiao)。我(wo)們可能很快(kuai)將(jiang)會迎來(lai)一個“AI代理(li)(li)無處(chu)不(bu)在”的(de)時代,AI代理(li)(li)將(jiang)深度嵌入我(wo)們的(de)日常生活中(zhong),成為真正(zheng)(zheng)的(de)數字助手。
參考資料:
The Next 10 Years Will Be About the AI Agent Economy,來源:NFXSmall Language Models for enterprise AI: Challenges, benefits, and deployment strategies,來(lai)源:deviniti.com