作(zuo)者:彭昭(智(zhi)次方創始(shi)人、云(yun)和資(zi)本聯合創始(shi)合伙人)
這是我(wo)的(de)第361篇專欄文章(zhang)。
DeepSeek的(de)熱度持續發酵,目前已有超過30家企業推出(chu)了“大(da)模型一(yi)體機”,其中以“DeepSeek”命名的(de)約(yue)有20家。
這一現象實際上反映了中國人工智能大模型從量變到質變的演進過程。
根(gen)據(ju)(ju)信通院發布的《全(quan)(quan)球數(shu)字經(jing)濟白皮(pi)書》,中(zhong)國(guo)擁有全(quan)(quan)球超1/3的人工(gong)智能大型語言模型(LLM)。數(shu)據(ju)(ju)顯示(shi),全(quan)(quan)球LLM數(shu)量已達1328個,中(zhong)國(guo)占(zhan)比36%,僅次(ci)于美國(guo),位居第二。
可以預見,在與LLM大模型接壤的小型語言模型SLM和AI智能代理領域,中國企業的崛起也指日可待。
作為制造業強國,中國為AI硬件的蓬勃發展提供了得天獨厚的土壤。
未(wei)來(lai),我(wo)們將(jiang)(jiang)看到越來(lai)越多能夠智(zhi)能響應主(zhu)人(ren)語音指令的AI家居(ju)硬件(jian),以及與環境(jing)無(wu)縫互動的AR智(zhi)能眼鏡等創(chuang)新產品。這(zhe)些產品的問世,將(jiang)(jiang)進一步推動AI技術在日常生活中的普及和應用。
值得注意的是,進入2025年,AI智能代理的時代已經來臨。在不久的(de)將(jiang)來,AI代(dai)理將(jiang)能夠(gou)勝任許(xu)多任務,大(da)大(da)提高生產效率和生活品質(zhi)。新興的(de)技(ji)術框架(jia)將(jiang)使我(wo)們能夠(gou)更快、更高效地構(gou)建(jian)AI代(dai)理。
目前各(ge)大科技巨頭也已經展開了(le)一場爭奪AI代(dai)理的關鍵競賽。
這將形成一種新的經濟形態:AI代理經濟的崛起,我們也將由此從AI模型進入AI代理經濟的發展階段。
在AIoT領域,尤(you)其(qi)是(shi)SLM的發(fa)展趨勢(shi)以(yi)及AI代理經濟(ji)的未來形態值得我們密切關注。
一方(fang)(fang)面,SLM與LLM的(de)融合將(jiang)催生出更多適用于特定場景的(de)AI解決方(fang)(fang)案;另一方(fang)(fang)面,AI代(dai)理經濟的(de)崛起將(jiang)重塑人(ren)機(ji)交互(hu)的(de)方(fang)(fang)式,為各(ge)(ge)行各(ge)(ge)業帶來(lai)創新變(bian)革。
因此今天這篇文章(zhang),我(wo)們一(yi)起(qi)來探索更適合AIoT領域的SLM發展趨勢以及(ji)AI代理經濟的未來形態。
根據Gartner的預測,SLM(也被稱為輕量級LLM)的興起已經成為確定的趨勢。小型語言模型SLM彌合了高性能人工智能系統與安全、經濟高效的解決方案需求之間的差距。
這(zhe)些SLM模型不僅經濟高效(xiao),而(er)且適應性(xing)強(qiang),能夠(gou)以最少的(de)資源(yuan)需求提(ti)供(gong)高質量的(de)結果,因此(ci)成為企業(ye)的(de)理(li)想選擇。
看到了小模型的獨特機會,知名企業已經紛紛布局。隨著技術的(de)發展,小(xiao)模(mo)型(xing)不(bu)僅發揮了低成(cheng)本上的(de)優勢,在(zai)性能上也不(bu)遜色于大(da)模(mo)型(xing)。
如(ru)下(xia)圖所示,通過將Llama 8B與大模型(xing)(xing)GPT-4o進行比較(jiao),我們發(fa)現雖(sui)然GPT在質(zhi)量(liang)方面比小(xiao)型(xing)(xing)模型(xing)(xing)高出20%以(yi)上(shang),但在增(zeng)強了小(xiao)型(xing)(xing)Llama模型(xing)(xing)之后,它可以(yi)與LLM相媲美,并且在某些任務中表現優于LLM,同時保持較(jiao)低的使用成(cheng)本。差異如(ru)此之大,令(ling)人難以(yi)忽視。
Llama 3.1-8B與GPT-4o的(de)比(bi)較進一步證明(ming)(ming)了(le)SLM在(zai)成本(ben)和性能(neng)方面的(de)優勢,見(jian)下圖。首(shou)先,與LLM相比(bi),SLM的(de)運行成本(ben)只是其(qi)(qi)(qi)一小部分。在(zai)零樣(yang)本(ben)設置中,Llama 3.1-8B的(de)成本(ben)明(ming)(ming)顯低(di)于(yu)GPT-4o。其(qi)(qi)(qi)次,只需進行少量(liang)(liang)額外訓練,SLM就(jiu)能(neng)在(zai)特定任務(如客戶支持或法(fa)律(lv)研究)中達(da)到接近甚(shen)至超(chao)過(guo)LLM的(de)質量(liang)(liang)水平。最后,Llama 3.1-8B在(zai)經過(guo)精細調整(zheng)的(de)設置下實現了(le)超(chao)過(guo)96%的(de)任務質量(liang)(liang),證明(ming)(ming)了(le)其(qi)(qi)(qi)在(zai)重點用(yong)例中實現高精度輸出的(de)能(neng)力。
從功能定位上看,LLM更像是“云端AI操作系統”,吸收中間層,形成API生態;而SLM更像是“本地AI計算引擎”,嵌入終端設備,增強隱私與實時性。
未來,LLM與SLM將形成端云協同,共同推動AI的發展。
隨著技術的不(bu)斷發展,LLM和SLM的未(wei)來趨勢也呈現(xian)出不(bu)同的特(te)點,我們不(bu)妨(fang)進(jin)行一個對(dui)比。如上圖所示,我們先看左側(ce)的LLM部分(fen):
首先,核心LLM將成為通用AI基礎設施。未來可能形(xing)成(cheng)極少數頭部LLM競(jing)爭的格(ge)局,類似于Android與iOS的雙寡頭或多寡頭情形(xing),而(er)不(bu)是單一(yi)標準。OpenAI、Google、Anthropic、Meta、DeepSeek等都可能成(cheng)為基礎模型提供商,并各自(zi)形(xing)成(cheng)生態。這種(zhong)格(ge)局可能會演化成(cheng)開源(yuan)vs商業閉源(yuan)的兩大(da)陣(zhen)營。
其次,云服務商層將實現API化,但存在更多差異化競爭。大模型即(ji)服(fu)務(wu)(LLM-as-a-Service)將成為標配,但(dan)不(bu)同云服(fu)務(wu)商可能(neng)(neng)會(hui)圍繞行業(ye)(ye)垂類優化,形成差(cha)異化競爭。例如(ru),金融、醫(yi)療、法(fa)律(lv)、教(jiao)育等垂直(zhi)行業(ye)(ye)的(de)LLM可能(neng)(neng)會(hui)有更定制化的(de)API,而不(bu)是直(zhi)接(jie)使用通用LLM。
第三,中間層將向更專業的AI代理形態演進。雖然一部分優化和功能(neng)會被云(yun)服(fu)務和底層模(mo)型吸收,但插件化、代(dai)理(li)化、模(mo)型微調等工(gong)具仍然有生(sheng)存(cun)空(kong)間。例如(ru),企(qi)業級RAG解決方(fang)案、特定行業的定制化LLM以及AI代(dai)理(li)生(sheng)態等都將得到發(fa)展。
第四,應用層將聚焦高價值場景。AI作為增強(qiang)人類能力的(de)Copilot存在,我(wo)們(men)與AI的(de)交互方(fang)(fang)(fang)式(shi)可能發(fa)生(sheng)(sheng)改變,大部分企業(ye)都(dou)需要將(jiang)AI作為客戶(hu)類型之一進行考慮。例(li)如,AI可能會(hui)在法(fa)律、醫(yi)療、教(jiao)育、設(she)計、軟件(jian)開發(fa)等領(ling)域提升生(sheng)(sheng)產力,而不是完(wan)全取代(dai)人類;AI可能會(hui)增強(qiang)個性化體驗(yan),如AI生(sheng)(sheng)成(cheng)的(de)個性化教(jiao)育方(fang)(fang)(fang)案、健(jian)康管理等。軟件(jian)與硬件(jian)的(de)編寫(xie)(xie)和制(zhi)造方(fang)(fang)(fang)式(shi)都(dou)將(jiang)發(fa)生(sheng)(sheng)改變,例(li)如前特斯拉人工智能高(gao)級總監Andrej Karpathy提出軟件(jian)2.0就是從人工編寫(xie)(xie)代(dai)碼過(guo)渡到基于大量(liang)數據觀察自動生(sheng)(sheng)成(cheng)代(dai)碼。
第五,零邊際成本社會可能會成真。各類AI的(de)(de)邊際成本(ben)確實在降低,但數(shu)據隱私、算(suan)力(li)成本(ben)、監管框(kuang)架可能(neng)會(hui)(hui)成為(wei)影(ying)響因素(su)。例如,歐盟、美國、中國等(deng)國家可能(neng)會(hui)(hui)對AI訓(xun)練數(shu)據、生(sheng)成內容合(he)規性進行監管,影(ying)響AI任務的(de)(de)自由度;個人數(shu)據安全、企業專(zhuan)有數(shu)據的(de)(de)AI處理,可能(neng)會(hui)(hui)影(ying)響AI服(fu)務的(de)(de)邊際成本(ben)是否真的(de)(de)趨(qu)近于零(ling)。
與LLM主要依賴于云端大規模算力不同,SLM更適用于邊緣計算、低功耗設備、端側智能,因此其趨勢可能與LLM不同。
首先,SLM將廣泛植入邊緣硬件,如智能家居硬件、車載設備、工業設備等。受(shou)限于設(she)備(bei)(bei)算力、尺寸以及功耗(hao)的(de)(de)制約,SLM將(jiang)會被進(jin)一(yi)步(bu)針對(dui)設(she)備(bei)(bei)“量身(shen)定制”。例如,智(zhi)能門鎖的(de)(de)SLM可自主識(shi)別用戶,提供個性(xing)化安全管理;工業生產(chan)線的(de)(de)SLM可基于傳感器數據進(jin)行故(gu)障預測(ce)和優化生產(chan)。
其次,本地AI計算將減少對云的依賴,增強隱私保護。本地運行SLM可(ke)以(yi)減少(shao)數據上傳云端的(de)風險,例如端側AI計算(suan)可(ke)以(yi)在(zai)智能硬件上直接完成(cheng)NLP任務(wu),而無需(xu)聯(lian)網。邊緣(yuan)AI可(ke)以(yi)本地識別語(yu)音、圖像、手勢,減少(shao)依賴云端服務(wu)器(qi),提(ti)高響應速度(du)。此外,云端算(suan)力昂貴,本地SLM可(ke)以(yi)降低AI計算(suan)的(de)長(chang)期成(cheng)本。
第三,SLM可能形成“端云協同”模式。本地SLM處(chu)理(li)常見任務(wu)(wu),如(ru)語音助(zhu)手、圖(tu)像識別、文(wen)檔摘要(yao)、翻譯等(deng);云端(duan)LLM處(chu)理(li)高復雜度(du)任務(wu)(wu),如(ru)AI代(dai)碼生(sheng)成(cheng)、AI科研(如(ru)AI生(sheng)成(cheng)藥(yao)物(wu))等(deng)。
第四,SLM的商業模式可能是“設備即服務”或“AI訂閱制”。未來的(de)(de)AI可(ke)能不再(zai)是(shi)單獨的(de)(de)軟件(jian)(jian),而是(shi)硬(ying)件(jian)(jian)的(de)(de)一部分。訂(ding)(ding)閱(yue)(yue)模式(shi)可(ke)能包括基礎AI功能免費、高(gao)級AI訂(ding)(ding)閱(yue)(yue)收費,以及硬(ying)件(jian)(jian)+AI訂(ding)(ding)閱(yue)(yue)捆綁銷售等(deng)。
最后,所有硬件都可以使用SLM重做一遍。在(zai)SLM的(de)(de)(de)視角(jiao)下(xia),硬(ying)件(jian)(jian)中的(de)(de)(de)“原(yuan)子(zi)”和(he)軟(ruan)件(jian)(jian)中的(de)(de)(de)“比特(te)”具(ju)有相(xiang)似性,硬(ying)件(jian)(jian)可以按照軟(ruan)件(jian)(jian)的(de)(de)(de)邏輯重新(xin)制(zhi)造,硬(ying)件(jian)(jian)制(zhi)造的(de)(de)(de)邊(bian)際成本也將快速(su)下(xia)降。
在探(tan)索了LLM與SLM的發(fa)展趨勢后,我們再來(lai)分析基于這(zhe)兩類人工智能模型的AI代理經濟。
與LLM主要依賴云端計算不同,SLM更強調本地(di)計算、低功耗和(he)隱私(si)保護,因此基于SLM的AI代理在組織方式和(he)商業模式上都會有所不同。
SLM將更多嵌入智能家居、智能汽車、工業物聯網設備等邊緣(yuan)硬(ying)件,形成一(yi)個廣(guang)泛分布的(de)AI代理網(wang)絡。
由此推斷,小模型AI代理可能將分為兩種模式:橫向AI代理生態和縱向AI代理生態。
橫向AI代理生態適用于大規模通用任務,如語音助手、智能翻譯、日(ri)程管理、家庭自動化等。這種模式具有低(di)成本、高普及(ji)度的(de)特點。這類AI代理的(de)目標(biao)是(shi)提升用戶體驗、降低(di)交互門檻,并(bing)通過(guo)訂閱或硬件捆綁的(de)方式盈利。
縱向AI代理生態則適用于特定行業的專業AI任務,如智能汽車的(de)AI駕駛助理(li)、工業(ye)(ye)IoT設備(bei)的(de)AI預測維護、醫療設備(bei)的(de)AI診斷支持等。這種模式具(ju)有高附加值、深度優化(hua)的(de)特點。這類AI代(dai)理(li)可(ke)能直接(jie)集成在終端設備(bei)中(zhong),由企業(ye)(ye)購買(mai)或訂閱。
相比LLM主要依賴云端API訪問,SLM代理經濟的核心驅動力在于以下幾點:
計算本地化,減少對云的依賴。SLM運行在本地設備上(shang),減少云端計算成本和隱私風險,適用(yong)于低時延任務(wu),如(ru)智能家居(ju)控制、車載AI交互、邊緣安(an)全(quan)監(jian)控等。
AI代理的“隱形智能化”。未(wei)來AI代理(li)(li)將默認嵌入設(she)備,而不是單獨(du)的SaaS訂閱模式。硬件(jian)廠商會捆綁AI代理(li)(li),例如智能冰箱可以自(zi)動管(guan)理(li)(li)食物(wu)存儲、智能汽車可以預測駕(jia)駛行為。
端云協同,智能分工。SLM處理(li)本地任務(wu)(wu)(wu),減少帶寬和算力消耗,而云端LLM負責(ze)更復雜的推理(li)任務(wu)(wu)(wu)。例如,智能眼鏡上的AI助(zhu)手可以(yi)本地完成簡單任務(wu)(wu)(wu),但(dan)更復雜的任務(wu)(wu)(wu)仍(reng)然需要云端LLM支(zhi)持。
SLM代理經濟的盈利模式也與LLM不同,更傾向于硬件+AI功能捆綁,或者采用訂閱增值模式。
硬件捆綁銷售可能將是一種主要模式,AI代理(li)直(zhi)接集成到智(zhi)能(neng)設備(bei)中,成為“默認功(gong)能(neng)”,用戶無(wu)需額外訂閱(yue)。這種模(mo)式適(shi)用于智(zhi)能(neng)眼鏡(端側AI語音(yin)助(zhu)手)、智(zhi)能(neng)家居(AI語音(yin)控制(zhi)+設備(bei)管理(li))、智(zhi)能(neng)汽車(AI駕駛輔助(zhu))、工業IoT設備(bei)(AI預測(ce)性維護(hu))等場景。
另一種模式是訂閱增值,部分高(gao)端AI代(dai)(dai)(dai)理(li)(li)功能可能會(hui)采用(yong)訂(ding)閱(yue)模(mo)式(shi),類似于(yu)特斯(si)拉FSD的軟件訂(ding)閱(yue)。基礎AI代(dai)(dai)(dai)理(li)(li)免費,高(gao)級(ji)(ji)AI代(dai)(dai)(dai)理(li)(li)訂(ding)閱(yue)收費。企業級(ji)(ji)AI代(dai)(dai)(dai)理(li)(li)(如AI質檢、AI醫(yi)療分析)可能采用(yong)SaaS訂(ding)閱(yue)模(mo)式(shi)。
未來可能會出現端側AI代理市場,允許(xu)用戶下載(zai)和激活不同(tong)的SLM代理(li)(li),類似于APP應(ying)用市(shi)場,但專門用于AI代理(li)(li)。用戶可以(yi)下載(zai)AI運(yun)動教練、AI營(ying)養師、AI車載(zai)助理(li)(li)等不同(tong)的智能(neng)體(ti)。“AI代理(li)(li)即服務(wu)”的商業模式可能(neng)成為主流。
總之,SLM在邊緣計(ji)算和端側(ce)智(zhi)能硬件(jian)中的AI代理經(jing)濟(ji),將以“隱(yin)形AI智(zhi)能+端云協同(tong)”為(wei)核心,形成“硬件(jian)捆綁+訂(ding)閱(yue)增值+代理市場”的商業(ye)模式(shi)。
DeepSeek的(de)(de)(de)持(chi)續熱度反映(ying)了中國(guo)在AI領(ling)域的(de)(de)(de)快速崛起(qi),這種(zhong)量變到(dao)質變的(de)(de)(de)飛躍離不開(kai)中國(guo)的(de)(de)(de)獨特土壤,未來的(de)(de)(de)進一步催化也離不開(kai)LLM與SLM的(de)(de)(de)協同發展(zhan)。
LLM作(zuo)為(wei)“云端AI操作(zuo)系統”,SLM則扮演著“本地AI計(ji)算引擎”的角(jiao)色(se),兩者在(zai)功(gong)能(neng)定(ding)位和商業模式上各有側重。
DeepSeek現象(xiang)的(de)持(chi)續發酵,正(zheng)是這一歷史性轉折的(de)生動(dong)注腳。我們可(ke)能(neng)很快將會迎來一個“AI代理無(wu)處不在”的(de)時(shi)代,AI代理將深度嵌入我們的(de)日(ri)常生活中,成(cheng)為真(zhen)正(zheng)的(de)數字助手。
參考資料:
The Next 10 Years Will Be About the AI Agent Economy,來源:NFXSmall Language Models for enterprise AI: Challenges, benefits, and deployment strategies,來源:deviniti.com