2025 年初,DeepSeek 憑借其高效能(neng)、低成本的開源特(te)性迅速(su)引爆市場。
此前,以大模型為代表的 AI 在邊緣和端側推理應用存在諸多挑戰,比如邊緣側的計算能力與存儲容量難以滿足大模型的微調和推理需求,模型壓縮與輕量化可能導致精度損失從而影響業務結果等……而隨著算法技術的不斷進步,包括模型量化、剪枝、蒸餾等模型壓縮算法的發展,以及專為端側部署設計的軟硬件平臺的出現,AI 大模型在端側設備的部署變得更加高效便捷——DeepSeek-R1 正是其中的突破性選手。
具體(ti)而言,DeepSeek-R1 通過高(gao)效(xiao)蒸餾(liu)技(ji)術,將大模型的(de)推理(li)能力遷移到(dao)更(geng)小、更(geng)高(gao)效(xiao)的(de)版本中(zhong)。這一(yi)突破使其小尺寸版本在保持卓(zhuo)越性能的(de)同時(shi),顯著降低了模型體(ti)積和計(ji)算資源需(xu)求(qiu),成為端側部署的(de)理(li)想選(xuan)擇(ze)。
當 AI 大模型從云端下沉至邊側,一場“端側 AI 革命”正悄然展開。在這場革命中,通信模組作為連接物理世界與數字世界的核心紐帶發揮著至關重要的作用,成為產業關注的焦點。2025 年,在 DeepSeek 浪潮的引領下,智聯網產業或將迎來“端側 AI 元年”。
近日,我們能看到包括美格智能、廣和通、移遠通信、芯訊通在內的多家物聯網模組(zu)企業紛(fen)紛(fen)發(fa)布了(le)旗下 AI 模組(zu)適配 DeepSeek 的消(xiao)息(xi),筆者(zhe)整(zheng)理(li)如下:
美格智能
1 月 26 日,美格智能在官微發布消息稱,其研發團隊結合 AIMO 智能體、高算力 AI 模組的異構計算能力,結合多款模型量化、部署、功耗優化 Know-how,正在加速開發 DeepSeek-R1 模型在端側落地應用及端云結合整體方案。
超低功耗:首先(xian)持續對 DeepSeek-R1 模型(xing)的(de)(de)推(tui)理延遲進行優化,保證模型(xing)在(zai)高(gao)算力(li)模組軟硬件環境下的(de)(de)超低功耗(hao)運行。
開發工具鏈:不(bu)斷進行(xing)工具鏈(lian)打通(tong),模組內嵌的 SNPE 引(yin)擎直(zhi)接支持 DeepSeek-R1 模型的 ONNX/TFLite 格式,大模型適配周期將大幅(fu)縮短。
端云協同:結(jie)合動(dong)(dong)態卸載技術,根據任務復(fu)雜度自動(dong)(dong)分配端側與(yu)邊緣計算資源,保障實時性與(yu)能效平衡。為客(ke)戶提供端云協同模板(ban),面向開(kai)發者(zhe)提供動(dong)(dong)態任務分配框架,簡(jian)單配置即可實現“本地(di)優先,云端兜底(di)”。
同時,公司將結合美格智(zhi)(zhi)能自研的(de) AIMO 智(zhi)(zhi)能體(ti)及 DeepSeek-R1 模型的(de)基礎能力,開發面(mian)向工業智(zhi)(zhi)能化(hua)、座艙智(zhi)(zhi)能體(ti)、智(zhi)(zhi)能無(wu)人(ren)機、機器人(ren)等領域的(de) AI Agent 應用。
受 DeepSeek 概念影響,1 月 24 日至 2 月 10 日,美格智能股價區間漲幅達 77.20%。
廣和通
2 月 10 日,廣和通在官微發布消息,稱其高算力 AI 模組及解決方案全面支持小尺寸的 DeepSeek-R1 模型,高效且靈活地構建深度學習體系,不僅保護數據隱私,更大大提升終端推理和運算能力。
面(mian)向(xiang)更(geng)(geng)廣(guang)泛(fan)的行業端側 AI 應(ying)用,廣(guang)和(he)通將積極推動 DeepSeek 等優質(zhi)模型在高、中、低(di)算力 AI 模組(zu)及解決方(fang)案部署,提供不同參數(shu)模型服務,進一步降低(di)端側 AI 的門檻(jian),并優化成本(ben),幫助客戶快速增強終端 AI 推理能力,賦能更(geng)(geng)廣(guang)泛(fan)的物(wu)聯網(wang)設備實現(xian) AI 化。
移遠通信
2 月 12 日,移遠通信在官微發布消息,宣布其搭載高通 QCS8550 平臺的邊緣計算模組 SG885G,成功實現了 DeepSeek-R1 蒸餾小模型的穩定運行。實測數(shu)據顯示,其生(sheng)成 Tokens 的速度超過每秒 40 個 Tokens,且未(wei)來(lai)隨著性(xing)(xing)能的不斷優(you)化,速度還(huan)(huan)將(jiang)進(jin)一步提(ti)升,為智(zhi)能終端設備帶來(lai)更強大的 AI 能力(li)。此外,在成功實現 DeepSeek 模(mo)型(xing)端側運行的基礎上,移遠通信還(huan)(huan)完成了(le)該(gai)模(mo)型(xing)的針對性(xing)(xing)微調,并應用于自身(shen)的大模(mo)型(xing)解決(jue)方(fang)案中,為客戶提(ti)供更精(jing)準、更高效的端側 AI 服(fu)務(wu)。
據悉,搭載 DeepSeek 模型的移遠邊緣計算模組和解決方案,不僅適用于消費類和工業類機器人領域,還可廣泛應用于智能座艙、機器視覺、個性化虛擬助理、平板電腦、老人監護、智能家居、AI 玩具(ju)及可穿戴設(she)備(bei)等多元化場景。
芯訊通
2 月 12 日,芯訊通 SIMcom 官微發布消息稱,芯訊通高算力 AI 模組 SIM9650L 已實測跑通 DeepSeek R1 模型,AI 算力超過 14Tops,能夠高效地幫助客戶終端搭建深度學習體系。
目前(qian),芯(xin)訊通正(zheng)在開展相關技術研究接入豆包等其他大(da)(da)模(mo)(mo)型(xing),積極(ji)探索更多深度(du)應用。AI 大(da)(da)模(mo)(mo)型(xing)爆(bao)火(huo)背后,是產(chan)業(ye)智能化對價(jia)值(zhi)創造的本質需求,芯(xin)訊通將以通信模(mo)(mo)組為支點,通過“模(mo)(mo)組+算(suan)法+場景(jing)”的深度(du)融(rong)合,讓端側 AI 真正(zheng)落地(di)。
有方科技
2 月 13 日,面對“公司是否針對 DeepSeek 相關模型開展了模型適配及端側部署工作”的問題,有方科技在投資者關系平臺上答復表示,公司依托于自身物聯感知體系“云-管-端”架構建立的優勢,積極融合物聯網與人工智能技術,在 Deepseek 模型上,公司一方面正在云側基于模型融合公司運管服云平臺開發城域物聯感知模型,另一方面也正在端側開展模型與模組的適配工作,但目前還處于在研狀態,尚未產生收入。
值得強(qiang)調的是,雖然不少模組企業(ye)因布局(ju)端(duan)側 AI,股價迎(ying)來(lai)大幅(fu)上漲,但尚且無(wu)法判斷相關概(gai)念股是否(fou)(fou)真正受益于(yu) DeepSeek 的技術突破(po),還是僅(jin)僅(jin)在蹭熱點?許多產品都(dou)處于(yu)早期研發階(jie)段(duan),尚未(wei)產生明(ming)確訂單,未(wei)來(lai)是否(fou)(fou)能產生收入(ru)及產生多少收入(ru)受市(shi)場(chang)需(xu)求和公司市(shi)場(chang)拓展進度影響,具有很強(qiang)的不確定(ding)性,尚有賴(lai)于(yu)應用端(duan)和最(zui)終用戶的檢驗。
而智聯網模組企業以(yi)及(ji)整個產業鏈上(shang)下(xia)游(you)要(yao)想進一步將拓展端側 AI 能力,還需要(yao)克服(fu)以(yi)下(xia)挑(tiao)戰:
首先是計算資源受限問題。這(zhe)包含(han)三(san)個維度:第一是(shi)算力限制(zhi)(zhi)(zhi),端側(ce)設(she)備(bei)(如(ru)嵌入(ru)式系統、移動設(she)備(bei)、工業設(she)備(bei)等)通常受(shou)制(zhi)(zhi)(zhi)于處理器性能(neng),無法(fa)匹配云(yun)端數據中心的(de) GPU、TPU 等高性能(neng)計算單元;第二(er)是(shi)存儲(chu)和(he)內存限制(zhi)(zhi)(zhi),端側(ce)設(she)備(bei)的(de)存儲(chu)容(rong)量有限,無法(fa)容(rong)納大規模的(de) AI 模型和(he)數據集;第三(san)是(shi)能(neng)耗(hao)限制(zhi)(zhi)(zhi),端側(ce)設(she)備(bei)通常依(yi)賴電池或低(di)功耗(hao)架構,難以支持高功耗(hao)的(de) AI 推理任(ren)務。
如今,DeepSeek 為解(jie)決計(ji)算資源受(shou)限挑戰提(ti)出(chu)了突破性的思路。DeepSeek 是一(yi)個具有 6710 億參(can)數的大型(xing)語(yu)言模(mo)型(xing),其基于(yu)預訓(xun)練的開源模(mo)型(xing)(如 LLaMA)進行改進和微調,推出(chu)了多個精(jing)簡版(ban)本(參(can)數從 15 億到 700 億不等),降低了對硬件資源的要求(qiu),使其能夠在資源受(shou)限的設(she)備(bei)上運行。
未來,在 DeepSeek 的啟發的引領下,更多類似的模型或將被陸續推出,從而給端側 AI 帶來無窮的想象力。對此,模組企業需要持續優化平臺部署,大幅縮短新模型的落地周期,從而賦能終端側真正享受到 AI 帶來的受益。
然后是端云協同部署問題。如今,關(guan)于(yu)邊緣(yuan)和(he)(he)云端哪個是理想工作(zuo)負(fu)載位置的(de)(de)(de)爭論,已經逐漸被現實的(de)(de)(de)共生關(guan)系所取(qu)代——云端(Cloud)負(fu)責(ze)高(gao)性能計(ji)算(suan)、大數(shu)據(ju)存儲、深度學習訓練(lian)等任務(wu);邊緣(yuan)(Edge)靠(kao)近數(shu)據(ju)源,負(fu)責(ze)實時推理、數(shu)據(ju)預(yu)處理、流(liu)式計(ji)算(suan)等;端側(Device)處理本地任務(wu),如智能手機、傳感器、IoT設備的(de)(de)(de)輕量(liang)化推理……隨(sui)著跨云、邊緣(yuan)和(he)(he)數(shu)據(ju)中心的(de)(de)(de)高(gao)效數(shu)據(ju)處理和(he)(he)流(liu)動需求不斷增長,混合邊緣(yuan)-云的(de)(de)(de)應用趨(qu)勢(shi)將(jiang)繼續提升。
對智聯網解決方案提供商而言,未來需要以協同化的架構,進一步合理劃分云、邊、端計算任務,確保在保證性能的同時優化能耗和數據同步效率。
最后是應用場景適配與生態建設問題。不同應用(yong)場景(智能(neng)(neng)家居、智能(neng)(neng)制(zhi)造(zao)、自動駕(jia)駛等(deng))對計(ji)算能(neng)(neng)力(li)、功耗、隱私(si)等(deng)有不同需(xu)求,對此,模組企業需(xu)要定制(zhi)化產(chan)品和服務。
美(mei)格智能提及(ji),未來(lai)將(jiang)推(tui)出(chu)面向 AI 場景(jing)的(de)訂閱服務,針對中(zhong)小(xiao)型的(de) B 端(duan)或 C 端(duan)客戶,推(tui)出(chu)“端(duan)側 AI 能力包”,與大模(mo)型廠商合(he)作,針對 Token 輸(shu)入(ru)/輸(shu)出(chu)數量、不同類型模(mo)型調用、流量費用等(deng)領域,推(tui)出(chu)一(yi)體化端(duan)側 AI Turn-key 方案。
總體而言,雖然道路是波折的,但前途是光明的。根據 Market.us 的預測,從2022 年至2032 年,全球端側 AI 市場空間將從 152 億美元提升至 1436 億美元,年復合增長率達 25.9%。
而隨著端側 AI 的進一步(bu)深入落地,我(wo)們將看到除手機、PC、智能(neng)眼鏡、耳(er)機等傳統(tong)設備外(wai),家(jia)電、機器(qi)人、教(jiao)育辦(ban)公設備、玩具等也將深度集成 AI 功(gong)能(neng),形成“萬物皆可 AI 化(hua)”的生態。
回顧模組的(de)發展歷程(cheng),標準通信(xin)模組從(cong) 1.0 時(shi)代(dai)(dai)的(de)純通信(xin)能力(li)(li),到 2.0 時(shi)代(dai)(dai)利用 Open CPU 技術替代(dai)(dai)外(wai)(wai)部 MCU,實現一(yi)些簡單(dan)的(de)邏輯控制能力(li)(li),到 3.0 時(shi)代(dai)(dai)的(de)同時(shi)具備 4G/5G 高速通信(xin)能力(li)(li)以及(ji)內置智(zhi)能化操作(zuo)系統(tong)和(he)豐富的(de)外(wai)(wai)設(she)接口。復雜系統(tong)的(de)智(zhi)能模組經歷了史(shi)無(wu)前例(li)的(de)快速發展,大大加(jia)速了傳統(tong)行業的(de)信(xin)息化和(he)智(zhi)能化的(de)改(gai)造(zao)進(jin)程(cheng)。
而在模(mo)組不斷(duan)進(jin)化迭代的過程中,市場(chang)迎(ying)來過“春風”,也經(jing)歷過“寒冬”。Counterpoint 數據(ju)顯示,受需求減少影響,2023 年全球物(wu)聯網模(mo)組出貨量(liang)首次出現下(xia)滑,同比下(xia)降(jiang)2%,但2024年隨(sui)著庫(ku)存水平正常化和智能(neng)電表、POS、汽車等(deng)領域需求增加,模(mo)組市場(chang)有望下(xia)半年恢復增長(chang)。伴隨(sui) 5G、AIoT 等(deng)技術應用,預(yu)計 2025 年市場(chang)將出現大(da)幅(fu)增長(chang)。
如今,端側 AI 概念的爆發又為模組(zu)市(shi)場注(zhu)入了新的動力(li),在此影響(xiang)下,整個市(shi)場的“回暖”或許(xu)會比預期中來得更早一些。
參考資料:
美(mei)格智(zhi)能AIMO智(zhi)能體+DeepSeek-R1模(mo)型(xing),AI應用(yong)的iPhone時刻來了,美(mei)格智(zhi)能
移(yi)遠(yuan)通(tong)信(xin)邊緣(yuan)計算模組成功運行(xing)DeepSeek模型(xing),以領先的工程(cheng)能力加速端側AI落地,移(yi)遠(yuan)通(tong)信(xin)
芯訊(xun)(xun)通(tong)高算力AI模(mo)組(zu)SIM9650L實(shi)測(ce)跑通(tong)DeepSeek R1模(mo)型,芯訊(xun)(xun)通(tong)
正在(zai)端側(ce)開展Deepseek模型與模組(zu)的適配工作,有方科技
端側AI元年爆發!廣和(he)通AI模組及解決方(fang)案全(quan)面支(zhi)持(chi)DeepSeek-R1蒸餾模型(xing),廣和(he)通
廣和通/美格/移遠/日海紛紛布局,一文盤點算力模組現狀、挑戰和前景,物聯網智庫
戴爾副總裁:五大趨勢(shi)將定義智能(neng)邊緣(yuan)的發展(zhan),戴爾