這是我的第(di)352篇專欄文章。
在(zai)我(wo)之前的文章《從LLM大模(mo)型(xing)到(dao)SLM小模(mo)型(xing)再到(dao)TinyML,這個領(ling)域(yu)有望增長31倍》中,曾經提到(dao)小模(mo)型(xing)SLM的進展,如(ru)今這一(yi)領(ling)域(yu)正在(zai)悄(qiao)然(ran)發生突(tu)破。
小模(mo)(mo)型(xing)SLM,可以看(kan)作是大模(mo)(mo)型(xing)LLM的“迷你版”,它們雖然體(ti)型(xing)小巧,但卻擁有著(zhu)不(bu)容小覷的能力。相(xiang)比動輒(zhe)數(shu)百(bai)萬、數(shu)十億參(can)數(shu)的GPT-4等大模(mo)(mo)型(xing),SLM的運行規模(mo)(mo)要簡單(dan)得(de)多。經過優化的SLM能夠(gou)高(gao)效處理較為簡單(dan)的任(ren)務,而無需(xu)消耗大量計算資源。
如(ru)今,小(xiao)模(mo)型正朝著產業落地的方向大(da)步邁進,它們(men)不再(zai)是(shi)實(shi)驗室里的“玩具”,而(er)是(shi)正在成為各行各業的“生力軍”。
科技(ji)巨頭們已經(jing)嗅到了(le)小模(mo)型的(de)無限潛力,紛紛加入這場爭奪未來的(de)戰局。
微(wei)軟、谷(gu)歌和蘋果等公司均已入局(ju)小模型SLM,例如微(wei)軟的Phi-3、谷(gu)歌的Gemma和蘋果的Foundation Models。
最近,微(wei)軟更是推出了適用于工業領域的全新AI小模型。
通過與(yu)拜耳、羅克韋爾自動化、西(xi)門(men)子等公司合作,這些小模(mo)型(xing)使用行業特(te)定數(shu)據(ju)進行了預(yu)先訓練,可用于處理一些關鍵(jian)問題。這就像是(shi)為每(mei)個行業量(liang)身(shen)定制了一套“智能(neng)裝備”,讓AI的(de)力量(liang)深入到每(mei)個生產環節,提升效率、優(you)化流(liu)程、創造價值。
今天這篇文章,我們(men)將(jiang)一起(qi)探(tan)索(suo)小(xiao)模型在工業應用中的最(zui)新進(jin)展,了解(jie)它(ta)們(men)所蘊(yun)藏的機遇與挑戰。
首先,我(wo)們需要進一(yi)步理(li)清大(da)模型(xing)與小模型(xing)之間(jian)的區別,如上圖所示。
小(xiao)模型(xing)之所以“小(xiao)”,不僅僅在(zai)于其(qi)(qi)參數(shu)數(shu)量(liang)較少,更(geng)重要(yao)的是,小(xiao)模型(xing)常(chang)(chang)常(chang)(chang)在(zai)小(xiao)型(xing)數(shu)據集上進行微調,以優化(hua)其(qi)(qi)在(zai)特定任務上的性能,使其(qi)(qi)更(geng)加契合業務工作流的需求。
小模(mo)(mo)型的強項在于處(chu)理特定任務和工作流程。盡管參數數量(liang)有限(xian),但當使用(yong)定制數據集(ji)針對特定領域(yu)任務進行微調時(shi),小模(mo)(mo)型完(wan)全(quan)能夠勝過大型通用(yong)模(mo)(mo)型。針對特定任務的訓練可以減輕幻覺現象,增(zeng)強問題(ti)解決能力(li)。
資源(yuan)效率是(shi)小型(xing)語言模型(xing)的(de)(de)另一大亮(liang)點,對于希(xi)望(wang)跨越各種平臺和設備實施(shi)AI解決方案的(de)(de)企業來說,它們尤其具有吸(xi)引力。小模型(xing)使(shi)企業能夠以更簡單的(de)(de)基礎架構和更低的(de)(de)成(cheng)本(ben),充分享受AI帶來的(de)(de)優勢。據測算,小模型(xing)可(ke)以節省高達75%的(de)(de)模型(xing)訓練(lian)成(cheng)本(ben)和超過50%的(de)(de)總部(bu)署成(cheng)本(ben)。
在小(xiao)模型的基礎上,我(wo)們還可以玩出(chu)許多(duo)新花(hua)樣。
一些公司將小模(mo)型用(yong)于AI代理工作流(liu)中,其中多個小模(mo)型通(tong)過通(tong)信(xin)和(he)協作來執行更加(jia)復雜的任務(wu)。
例如,在AI代(dai)(dai)理(li)(li)工(gong)作流中,第(di)一個(ge)AI代(dai)(dai)理(li)(li)可能負責規劃如何解(jie)決(jue)任務,第(di)二(er)個(ge)AI代(dai)(dai)理(li)(li)進行必要(yao)的研(yan)究,第(di)三個(ge)AI代(dai)(dai)理(li)(li)執行該(gai)計劃,第(di)四個(ge)AI代(dai)(dai)理(li)(li)則驗證和評估(gu)結果。這(zhe)(zhe)種協作方式展示了(le)這(zhe)(zhe)些模型如何協同工(gong)作,以提高生產力并實現更(geng)復雜的結果。
說到(dao)這(zhe)里,我(wo)來解釋一下什么是AI智(zhi)能代理。
AI代(dai)理的(de)官方定義是一種能夠感知環境、進行決策和執行動作的(de)智(zhi)能體。
簡而言(yan)之(zhi),ChatGPT不屬于AI代理,但戰(zhan)勝李(li)世石的AlphaGo可以被視為(wei)AI代理。
目前,我們與AI的交互形(xing)式基本上都(dou)是(shi)先(xian)輸入指令(ling),AI模型根據指令(ling)內容做(zuo)出響應,這就導(dao)致我們每(mei)次都(dou)需要提(ti)供有(you)效的提(ti)示詞(ci),才能達到預期效果。
而AI代(dai)理則不同,它被設(she)計為具有(you)獨立思考和行動能力的AI程序。我(wo)們(men)只需要提(ti)供一個目標,比如寫(xie)一個游戲、開發一個網(wang)頁,AI代(dai)理就(jiu)會自主生(sheng)成一個任務(wu)序列(lie),開始工(gong)作。
讓我們通過幾個例子來更深(shen)入(ru)地理解AI代理。
一個(ge)初級的AI代理,是家(jia)中的空調(diao)自(zi)動控制系統。它(ta)遵循簡單的“如(ru)果(guo)(guo)-那么”原則(ze)運行:如(ru)果(guo)(guo)溫度低(di)于設定點(dian),則(ze)打開空調(diao)暖(nuan)風;如(ru)果(guo)(guo)溫度高(gao)于設定點(dian),則(ze)關(guan)閉空調(diao)暖(nuan)風。這種(zhong)基礎的AI代理雖然簡單,但在日常(chang)生活中已經發揮(hui)了重要(yao)作用(yong)。
而高級的AI代理,如DeepMind的AlphaGo,則是專為復雜的圍棋而設計的人工智能系統。AlphaGo展示了非凡的學習能力,最終擊敗了世(shi)界冠(guan)軍圍棋選手。這一里程碑式的事件,彰顯了AI代(dai)理(li)在處(chu)理(li)復雜任務方面(mian)的巨大潛力。
就像俄羅斯套娃(wa)一(yi)樣,多個初級和(he)高級的AI代理可以(yi)建立起分(fen)層代理系統。
分(fen)層代理(li)(li)是一(yi)種(zhong)將復(fu)雜任務分(fen)解(jie)為更簡單的(de)子任務,并(bing)以(yi)分(fen)層結構組織(zhi)起來的(de)AI系(xi)統。這種(zhong)方法允許代理(li)(li)管理(li)(li)不同(tong)級別的(de)抽象,更有效地處理(li)(li)復(fu)雜問題。
分層代理的一個(ge)典型例子,就是亞馬(ma)遜Amazon Go商店的“Just Walk Out”技(ji)術。該系統在運作中表現(xian)出(chu)了清晰(xi)的層級結構:
頂層:整體商店管理(li)和庫存(cun)跟蹤(zong)
中(zhong)級:客戶跟蹤和(he)行為(wei)分析
低級:產(chan)品識別(bie)和交互檢(jian)測
最低級(ji)別:傳感(gan)器(qi)數(shu)據處理和(he)融合
依(yi)靠這些AI代(dai)理的協同工作,Amazon Go以“不用排(pai)隊,拿了(le)就走”的全新購(gou)物體(ti)驗,在零售行業和科技圈吸引了(le)無數目(mu)光。
上述案例只(zhi)是冰山一角,AI代理(li)在(zai)實(shi)際應用中的想象力正在(zai)被激發。
在了解了小(xiao)模型與(yu)AI代(dai)理的(de)概況后,讓(rang)我(wo)們一起探索(suo)微(wei)軟(ruan)與(yu)工(gong)業企業的(de)最新合作。
本次(ci)嘗試微軟小模型的企(qi)業包括拜耳、羅克韋爾(er)自(zi)動化、西門(men)子、Sight Machine等(deng)。
以羅克韋爾自(zi)動化為例,該公司(si)從操作層面(mian)開(kai)始(shi)嘗試(shi)應用小(xiao)模(mo)型(xing)。在人機界面(mian)可視化平臺FactoryTalk Optix的(de)食品(pin)和飲(yin)料版(ban)本中(zhong),他們運用小(xiao)模(mo)型(xing),將行(xing)業特定功能的(de)優(you)勢帶給制造業一(yi)線工人,支持食品(pin)和飲(yin)料領域的(de)資產(chan)故障排除。AI模(mo)型(xing)為工廠車間(jian)工人和工程(cheng)師提供關于(yu)特定制造流程(cheng)、機器(qi)和輸入的(de)實時建議、解釋和知識。
另一款產品FactoryTalk Design Studio是羅(luo)克(ke)韋爾自動化專注(zhu)于系(xi)統(tong)設計(ji)的云原(yuan)生(sheng)軟件(jian),它使用(yong)Copilot增強了PLC代碼(ma)創建和(he)用(yong)戶管理。工程師(shi)能夠使用(yong)自然語言提示執行產品指(zhi)導、代碼(ma)生(sheng)成、故障排除和(he)代碼(ma)解釋等任(ren)務,使系(xi)統(tong)設計(ji)更快、更直觀。
同樣,西門子正在為CAD解決方案NX X軟件引入(ru)全(quan)新(xin)的(de)Copilot。該軟件利用經(jing)過(guo)調整的(de)AI模型,使(shi)用戶能(neng)夠通過(guo)自然(ran)語言提問、獲取(qu)詳細的(de)技(ji)術見解并簡化(hua)復(fu)雜的(de)設(she)計(ji)任務(wu),實現更(geng)快、更(geng)智能(neng)的(de)產(chan)品開發。
目(mu)前,包括舍弗(fu)勒和蒂森克(ke)虜伯(bo)自(zi)動(dong)(dong)化工(gong)程(cheng)在(zai)內(nei)的100多(duo)家公司正在(zai)使用西(xi)門(men)子(zi)工(gong)業Copilot來(lai)簡化流程(cheng)、解決勞動(dong)(dong)力(li)短(duan)缺問題并推動(dong)(dong)創新。12萬名西(xi)門(men)子(zi)工(gong)程(cheng)軟件用戶,現在(zai)有機(ji)會通過生成式AI驅(qu)動(dong)(dong)的助手來(lai)提升工(gong)作效率。
作為敢于吃螃蟹的用(yong)戶,蒂森克虜伯(bo)自動化工程公(gong)司(si)(si)是(shi)首家使用(yong)Copilot的公(gong)司(si)(si),并(bing)且計劃從(cong)2025年初開始,在該公(gong)司(si)(si)的全球體(ti)系內(nei)普及應用(yong)。
根(gen)據實踐,工(gong)程師現在可(ke)以在30秒內創(chuang)建可(ke)視(shi)化面板,并生成代(dai)碼,根(gen)據經驗這(zhe)些代(dai)碼僅需20%左右的調(diao)整就可(ke)以直接應用。這(zhe)簡化了工(gong)作(zuo)流程,減少了人工(gong)工(gong)作(zuo)量(liang),解決了熟練勞動(dong)力短缺(que)的問題(ti)。
就具體場(chang)景而言,蒂森克虜伯使用AI輔(fu)助開發用于生(sheng)產汽車(che)電(dian)(dian)(dian)池的自(zi)動(dong)化系(xi)統。例如(ru)在(zai)一臺電(dian)(dian)(dian)池質量(liang)的檢測(ce)(ce)裝置中(zhong),傳感器、攝像頭和測(ce)(ce)量(liang)系(xi)統集成在(zai)一起,監控(kong)多個階段的電(dian)(dian)(dian)池單元(yuan)質量(liang),進行復雜的評估以檢測(ce)(ce)超(chao)出設定閾值的放電(dian)(dian)(dian)。Copilot通過(guo)自(zi)動(dong)執行多個任(ren)務,如(ru)數據管理、傳感器配置、電(dian)(dian)(dian)池質量(liang)檢測(ce)(ce)等各個重復性步(bu)驟,輔(fu)助操作員(yuan)增強(qiang)了該(gai)設備的運行效果。
在工業領域,“想到”和(he)“做到”完全是(shi)兩碼(ma)事(shi),生(sheng)成式(shi)AI的(de)工業價值尚需被驗(yan)證。
古人(ren)云“欲得(de)其(qi)利、先(xian)知其(qi)弊”,要充分發揮小模(mo)型的(de)優(you)勢,就必須了解(jie)它(ta)的(de)局限性。
生成式AI的弊(bi)端在于(yu)(yu)可(ke)靠(kao)性較低(di),具有不可(ke)解釋(shi)性,只能應(ying)用(yong)于(yu)(yu)對可(ke)靠(kao)性要求不高的場合。
小(xiao)模型(xing)的(de)缺點則是精度有限(xian),無法(fa)捕捉大規模和復雜數據集中的(de)細致特征和關系,預測(ce)能(neng)力相對(dui)較弱;此外,它們難(nan)以(yi)應對(dui)復雜問題。這些弊端決定(ding)了小(xiao)模型(xing)只能(neng)承擔輔助思考的(de)角色(se),為(wei)我們提供更(geng)多可(ke)行性方案作(zuo)為(wei)選擇,而最終決策仍需由人來做(zuo)。
在實際應(ying)用過程中(zhong),也(ye)是挑戰重重。
工業(ye)領域廣泛使用(yong)AI的最大(da)(da)障礙是數(shu)(shu)據的缺失。由于工業(ye)涉及設(she)備、工藝、操(cao)作、環境等多(duo)重因素(su)影響,獲取(qu)大(da)(da)量且多(duo)維的全面數(shu)(shu)據難度很大(da)(da)。大(da)(da)多(duo)數(shu)(shu)制造商雖然坐擁數(shu)(shu)據,但其中大(da)(da)部分(fen)是時間序列(lie)數(shu)(shu)據,沒有得到適當(dang)的標(biao)準(zhun)化,甚至無法(fa)用(yong)于AI的模型訓練。
數據(ju)問(wen)(wen)題(ti)(ti)的本(ben)質,很多時候不單純(chun)是技術問(wen)(wen)題(ti)(ti),而是人員和流程(cheng)問(wen)(wen)題(ti)(ti)。不成熟的數據(ju)管(guan)理(li)流程(cheng)、始終(zhong)存在的OT與IT鴻(hong)溝,以(yi)及(ji)缺乏對小模(mo)型的理(li)解,都是導(dao)致生成式AI目前僅限于一(yi)次性試點或實驗的因(yin)素。
因此,目前生成式AI在工業領(ling)域更多以虛擬助(zhu)手(shou)的功能存在,并(bing)將(jiang)會持續較長時間。
這些AI虛擬助手為工廠車間操作(zuo)員提供指(zhi)導,或(huo)(huo)幫助控(kong)制工程(cheng)師編(bian)寫PLC代碼(ma)。鑒于(yu)當前(qian)吸引和留(liu)住工廠車間人才(cai)的挑(tiao)戰,Copilot能(neng)夠輕松幫助合成實時信息(xi)或(huo)(huo)提供編(bian)碼(ma)輔助。
過去,工程師需要熟悉云平臺、傳感器、物聯網、人(ren)工智能和(he)不(bu)同類型的時(shi)間序列和(he)工程數(shu)據(ju),而生成式AI則(ze)允許(xu)工程師輕松進行數(shu)據(ju)查詢、可視化和(he)工作流程,而無(wu)需(xu)(xu)擔心復雜性。操作員可以(yi)按(an)需(xu)(xu)提出(chu)問(wen)題,而不(bu)需(xu)(xu)要了解軟件。
許(xu)多(duo)(duo)制造企業配備了復雜(za)的系統和(he)更(geng)多(duo)(duo)的自動化設備,但那些擁有(you)幾(ji)十年經驗與知識(shi)的資深員工卻(que)逐漸離(li)開了職場,制造商們很難(nan)找到年輕的技術人員來維護(hu)現有(you)的系統。Copilot可(ke)以(yi)成(cheng)為幫助縮小這(zhe)一(yi)差距的工具。
例如,工業軟件企業Aveva的(de)(de)AI助手(shou)可以幫助操作員回答(da)以下問(wen)題:上個月(yue)車(che)間的(de)(de)最大產量是多少(shao)?或者(zhe)為什么這臺壓縮機本周效率較低?杜邦(bang)公司(si)也已經開始使用生(sheng)成式AI來幫助工程師(shi)更快(kuai)地找到信息(xi),生(sheng)成式AI可以節省(sheng)數小(xiao)時(shi)的(de)(de)手(shou)冊(ce)搜索時(shi)間。
這些Copilot就像(xiang)操(cao)作員的(de)專家顧(gu)問,根據需(xu)要建議如何提高產(chan)量(liang)、降低能耗等。從某(mou)種意(yi)義上說(shuo),它們與原有的(de)“專家系統”并沒有本(ben)質區別(bie),是否(fou)采(cai)納這些建議取決于操(cao)作員。
面臨的(de)(de)(de)挑(tiao)戰也(ye)與過去的(de)(de)(de)“專家(jia)系(xi)統”大同(tong)小異:如何(he)建立對顧問(wen)的(de)(de)(de)信任。工廠中的(de)(de)(de)新配方經(jing)常出(chu)現,如果(guo)沒有適當的(de)(de)(de)更新和維護,專家(jia)系(xi)統也(ye)會很快過時(shi)。另一(yi)個風(feng)險在于(yu),如何(he)檢查和驗證(zheng)所(suo)有生成(cheng)式AI的(de)(de)(de)輸(shu)出(chu)。AI不會說“我不知道”;如果(guo)沒有數據,它可能會進行編造(zao)。
在(zai)這(zhe)個萬物互聯、智能無處(chu)不(bu)在(zai)的時代,小模(mo)型和生成(cheng)式(shi)AI正(zheng)在(zai)工(gong)業領域(yu)掀起一場革命。從制造車間(jian)到產品設計,從運(yun)營優化到故障診斷,AI正(zheng)在(zai)重塑著每(mei)一個環節(jie)。
然(ran)而,我們也(ye)必須清醒地認(ren)識到(dao),工業領域(yu)的(de)AI應用(yong)之路并非(fei)坦途(tu)。數據缺失、可靠(kao)性不足(zu)、解釋(shi)性有限等挑戰,都在提醒我們要謹慎對(dui)待這(zhe)項新興技術。盡管如此,我們仍然(ran)有理由(you)對(dui)未來保持樂觀。
隨著技術的(de)不斷進步和(he)(he)企業實踐的(de)深入,人機協(xie)作將(jiang)更加緊密(mi),小模(mo)型(xing)和(he)(he)生成式AI也將(jiang)在工業領域釋放出(chu)更大的(de)潛力。
參考資料:
忍不住談談工業大模型,作者:郭朝(chao)暉,來源:蟈蟈創(chuang)新隨筆(bi)
Microsoft Introduces New Adapted AI Small Language Models for Industry,作者:Colin Masson,來源:ARC Advisory Group
What is Agentic AI? Is It the Next Big Thing?作者:Nora He,來(lai)源:arcee.ai