AI有多火?運營商們(men)也(ye)紛紛開足(zu)馬(ma)力做(zuo)了。
就在近日,中國電信公(gong)布了(le)類(lei)ChatGPT產品—— “TeleChat”大模型。聯通也在上周MWC期(qi)間(jian),官宣了(le)旗下的“鴻湖(hu)”大模型。
中國移動也有動作。同樣是上周,移動宣布——正建設面向通用智能的“人工智能大平臺”,該(gai)平臺定(ding)位為新型人工智能基礎(chu)設施。
AI大模型,并(bing)非(fei)今年才誕生的新鮮(xian)概(gai)念(nian)。但因ChatGPT以驚人速度傳播,大模型概(gai)念(nian)也因此(ci)在(zai)2023年破(po)圈。
多(duo)數人看來,投身AI大(da)模型研發(fa)的(de)廠(chang)商或是(shi)OpenAI、DeepMind等(deng)專業(ye)團(tuan)隊,亦或是(shi)Google Brain、Meta旗下FAIR等(deng)大(da)廠(chang)部門,在(zai)國內,明星玩(wan)家也主要是(shi)百度、阿里、騰訊、訊飛(fei)、商湯等(deng)企業(ye)。
那么,運營商們做大模型,水平如何?在該領域國內外廠商又有什么其他動作?今天就來盤一盤。
TeleChat、鴻湖與算力競賽
先(xian)來看看運(yun)營商(shang)們的大模型產品(pin)及相關布局。
(1)中國電信TeleChat大模型
關(guan)于電(dian)信(xin)此次發(fa)布的大(da)模型,TeleChat,據公開資料,該模型支持輸出代碼、寫(xie)演講(jiang)稿等(deng),其公司研發(fa)目標是成(cheng)為“百億級(ji)AI服務商”,產品涵蓋AI算法、平(ping)臺、應用、硬件、大(da)模型等(deng)。
盡管參數量及(ji)更多技(ji)術細節暫(zan)時沒有公布(bu),但能看出,該模型并非多模態LLM,有別于OpenAI旗(qi)下的GPT-4及(ji)百度文(wen)心一言,后面兩(liang)者可生成(cheng)文(wen)字、代(dai)碼、圖片、音(yin)頻等(deng)內容(rong)。
據行業媒體CWW信息,中國電信可能使用華為的鯤鵬920芯片或海光 HYGON Dhyana 系(xi)列處理器進行(xing)相關產(chan)品的部署訓(xun)練,中國電信在2020年采購了一批此類硬件,用于“培(pei)育自主可(ke)控產(chan)業鏈”,實(shi)現“云(yun)計算(suan)服務”。
值(zhi)得一提的(de)是電信TeleChat的(de)官宣機構為(wei)——中國電信股(gu)份有限公(gong)司數字(zi)智能科技分公(gong)司。該企業于2023年(nian)5月剛成立,曾用名為(wei):中國電信股(gu)份有限公(gong)司企業信息(xi)化事業部(bu)。
公(gong)開報(bao)道顯示,該(gai)公(gong)司設立(li)目的(de),在于(yu)三方面(mian):
(1)爭做核(he)心技(ji)術自主掌控的科(ke)技(ji)型企業;
(2)加快推動公司大數據和AI核心(xin)能力建設;
(3)進一步強化公司科技創新(xin)能力。
對于未來規(gui)劃,該公司稱,將(jiang)打(da)造萬級AI算法艙,強化大數(shu)(shu)據和AI關(guan)鍵核心技術攻關(guan),依(yi)托自有(you)算法及設備打(da)造多(duo)場景(jing)、多(duo)應用、可復制的標準產品和平臺,持續提升(sheng)大數(shu)(shu)據和AI研發(fa)創新和運營能(neng)力。
6月公開的一份招聘海報顯示,中(zhong)國電(dian)信(xin)數字智能科(ke)技分公司還(huan)(huan)在招聘大模型算法工程師,包(bao)括圖像、語義兩個方(fang)向。實習生(sheng)招聘還(huan)(huan)包(bao)括多模態、強化學習方(fang)向,工作地點(dian)為北京東城區。
中(zhong)國電信(xin)對GPT的(de)規劃,之前已經(jing)透(tou)露出一些信(xin)息。
據IT時報內容,今(jin)年(nian)5月一(yi)次活動中,中國電信(xin)科(ke)技(ji)委主任、首席科(ke)學家韋樂平對外表示:
“(電(dian)(dian)信)企業可能需要在基礎大(da)模型GPT框架上開發一(yi)個規模沒有那(nei)么大(da)、成本可控、專(zhuan)業性更強(qiang)、更有利(li)于AI廣泛網(wang)絡(luo)應用的大(da)模型,即‘電(dian)(dian)信專(zhuan)業GPT’。”
TeleChat為代表的NLP模型之外,中國電信在今年4月末發布了“星河”通用視覺大模型2.0。
據稱,該大模型“星河”大模型數據量(liang)從(cong)百(bai)(bai)萬(wan)提升至(zhi)億(yi)級,模型參數從(cong)10億(yi)提升至(zhi)百(bai)(bai)億(yi)。
該參數量(liang)距離(li)人們(men)熟(shu)知(zhi)的千億模(mo)型(xing)規(gui)模(mo)尚有距離(li),不(bu)過中國電信稱,他們(men)融入圖像、視(shi)頻、語(yu)(yu)義多(duo)源(yuan)信息,提升模(mo)型(xing)語(yu)(yu)義理解能力,并擴展視(shi)覺多(duo)元(yuan)感知(zhi)、精細分割和(he)空間(jian)交(jiao)互(hu)關系能力。在對外宣傳(chuan)中,他們(men)稱,該模(mo)型(xing)在超百項業務中算法平均提升10%以上。
在(zai)更(geng)底層的算力等數(shu)字(zi)基(ji)礎設施布局方面。中國電信集團大數(shu)據(ju)和AI中心AI研發(fa)中心副總(zong)經理李永(yong)翔,在(zai)今(jin)年6月(yue)對外表示:
中國(guo)電信正(zheng)依托天翼云進行人工智能4級算力的平臺建設(she):在全(quan)國(guo)6個大區建設(she)核心的、大型的算力集群,承載全(quan)國(guo)大數(shu)據規模AI訓練和大規模云端數(shu)據推理場景(jing)。
李永(yong)翔還(huan)補充(chong)道,電信目前已適(shi)配(pei)了十余款國產(chan)AI芯片,并自研了端云結合的渲(xuan)染引擎和(he)統一(yi)跨(kua)平臺AI推理(li)框架。
(2)中國聯通“鴻湖”大模型
聯通旗下大(da)模型名為“鴻湖”,號稱首個面向運營商增(zeng)值業務的大(da)模型。
目前,它擁有(you)8億訓(xun)練參數和(he)20億訓(xun)練參數兩個版本,最大參數數量級與15億的GPT-2幾乎同等量級。
值得一提(ti)的(de)是,“鴻湖”大(da)模型(xing)屬(shu)于多模態大(da)模型(xing),官方宣(xuan)稱,它可以(yi)實(shi)現以(yi)文生圖、視頻剪輯、以(yi)圖生圖等功能。
單個模(mo)(mo)型(xing)之外,前幾日的MWCSH上,中國(guo)聯通還對(dui)外表示,要構建多行業多場景的大模(mo)(mo)型(xing),推動(dong)AI為千(qian)行百業創造更大價值。
圖源:中國聯通
案(an)例(li)之(zhi)一是在5月,上海(hai)聯通攜手華(hua)(hua)山(shan)醫(yi)院、上海(hai)超算(suan)中心等單位發布“Uni-talk”醫(yi)療算(suan)網大(da)(da)模型。該大(da)(da)模型是一款為醫(yi)療行業定(ding)制的(de)大(da)(da)模型產品,功能類似ChatGPT,不過更加聚焦于醫(yi)療領域的(de)應(ying)用。華(hua)(hua)山(shan)醫(yi)院會將“Uni-talk”應(ying)用于專(zhuan)業醫(yi)學(xue)文獻(xian)檢索,輔助診斷等場景。
算力服務方(fang)面,中國(guo)聯通(tong)同樣重視,其2022年算力網(wang)相關投資為124億元,同比(bi)增長65%昭示了聯通(tong)在算力方(fang)面的決心。
在MWC期間,該公(gong)司(si)表示:欲構建(jian)大(da)算(suan)力的平臺底座......充分滿足人工智能(neng)對“通用算(suan)力+智能(neng)算(suan)力+超算(suan)算(suan)力”的異構混合算(suan)力需求,打造面(mian)向(xiang)大(da)模(mo)型(xing)的統一AI研(yan)發平臺,全面(mian)提供(gong)大(da)模(mo)型(xing)訓練推理的服(fu)務(wu)能(neng)力。
具體(ti)到項目,聯通落地算(suan)力(li)項目不少。
據人民郵電報報道,中國(guo)聯通5月在(zai)廣東韶關,部(bu)署了(le)國(guo)家(jia)級算力(li)中心,率先(xian)建成融(rong)合通算、超算、智算的綜合型算力(li)中心。
6月8日,廣(guang)東聯通(tong)智算中心正式揭牌(pai),相關負責人對其價值進行(xing)(xing)(xing)介紹(shao):“未來(lai),面對各行(xing)(xing)(xing)各業大模型的訓練,通(tong)過(guo)超級計算對數據先進行(xing)(xing)(xing)預處理(li)(li)和清(qing)洗(xi),再把預處理(li)(li)之后的數據送至智算中心進行(xing)(xing)(xing)AI計算,將是一種更高效、更經濟(ji)的方式”。
近期中國聯通(tong)還對外表示,公司在算力上(shang)形成“5+4+31+X”的(de)云網邊一體化(hua)多層(ceng)級(ji)布局, 即9個樞紐節點、31個省級(ji)核(he)心數據(ju)中心和X個地市級(ji)區域及邊緣數據(ju)中心。
值得一提的是,聯通還有個名叫CubeAI智立(li)方的開(kai)源算能(neng)服務平臺,據稱,它由中國聯通研究院自(zi)主研發,集AI模型自(zi)動化(hua)服務封(feng)裝、發布、共享(xiang)、部(bu)署和(he)能(neng)力開(kai)放(fang)等(deng)功(gong)能(neng)于一體。
在(zai)對外合作方(fang)面,聯(lian)(lian)(lian)通(tong)與科(ke)大訊飛成立了(le)人工(gong)智(zhi)能反詐聯(lian)(lian)(lian)合實驗(yan)室,此(ci)外,還成立了(le)中(zhong)國聯(lian)(lian)(lian)通(tong)昇騰(teng)人工(gong)智(zhi)能創新(xin)實驗(yan)室。在(zai)MWCSH現場,聯(lian)(lian)(lian)通(tong)工(gong)作人員也表(biao)示,公司目前也在(zai)同科(ke)大訊飛商討大語言(yan)模型方(fang)面的更多(duo)合作可能。
(3)中國移動押注算力
不同于前面兩家,移動暫(zan)時(shi)還(huan)未發布旗下大(da)模型。
其打法在(zai)于——站(zhan)在(zai)幕后,大模(mo)型提供(gong)基礎設(she)施服(fu)務。此(ci)種思路,更像是不(bu)發大模(mo)型,但服(fu)務了(le)MiniMax、智譜(pu)AI、百(bai)川智能、瀾舟科技等團隊的字節火(huo)山(shan)引擎。
近期,移動(dong)在大模型領域的最大動(dong)作(zuo),莫過于官宣(xuan)了建設中(zhong)的“人工智能大平臺”。
公開資料顯示(shi),該平臺(tai)定位(wei)為新型(xing)人工(gong)智能基(ji)礎設(she)施(shi)(shi),承載面(mian)向國民經濟主體的(de)通用(yong)智能大模型(xing)、行業大模型(xing)等(deng),基(ji)于(yu)泛(fan)在的(de)算網基(ji)礎設(she)施(shi)(shi),實現數據的(de)高質量利(li)用(yong)。
事實上,移動在(zai)兩年前就提出(chu)了“以(yi)網強(qiang)算”,發展算力網絡的理念。
2022年,移(yi)動在算力方(fang)面投資金(jin)額達(da)335億(yi)元,2023年預計達(da)到452億(yi),同比增加(jia)35%。
在近日(ri)舉辦的“算力(li)網絡(luo)技術(shu)與產業(ye)大(da)會”上,中國移(yi)動副總經(jing)理高同慶對(dui)外表示,移(yi)動將在算力(li)方面形(xing)成七大(da)成果。
這當中(zhong)就包括(kuo):以新(xin)型智算(suan)(suan)為重點打造算(suan)(suan)力高峰,正在構建E級超大(da)規模單體(ti)智算(suan)(suan)中(zhong)心,支撐AI大(da)模型訓練和孵化;
更(geng)早(zao)之前,移動還(huan)發布了“九天”人工智(zhi)能(neng)平(ping)臺。該(gai)平(ping)臺由是中國(guo)移動自主研發的人工智(zhi)能(neng)創新平(ping)臺,提供從基礎設施到核心能(neng)力的開(kai)放AI服務(wu)。
在號(hao)稱AI春晚的2023智(zhi)源大會上,中國(guo)移動副總(zong)經理高(gao)同慶提及(ji):
以“九天”人工智能平(ping)臺為(wei)核心(xin)實現新型(xing)智算引擎,針對大模型(xing)開(kai)放服務(wu)需求(qiu)。
高同慶補充(chong)道,“九天”平臺支持多樣化智能(neng)算力(li)、深度學(xue)習框架,基于跨域(yu)異構算力(li)的高效(xiao)調度、千卡并行的高性能(neng)模型(xing)訓(xun)練加(jia)速以及云邊(bian)協同的一(yi)體化訓(xun)推等新(xin)型(xing)智算技術,能(neng)夠提供(gong)全面的大模型(xing)訓(xun)推一(yi)體化研發能(neng)力(li)和新(xin)型(xing)MaaS能(neng)力(li)。
“九天(tian)”平臺背后研發團隊,是移動在AI領域的(de)重要研發機構,中國移動研究院旗下,人工智(zhi)(zhi)能與(yu)智(zhi)(zhi)慧運(yun)營(ying)中心。
根據官網介(jie)紹,人工智(zhi)能與(yu)智(zhi)慧運營(ying)中心由(you)研(yan)究院(yuan)(yuan)首席科(ke)學家馮俊蘭博士領銜,是(shi)中國(guo)移動(dong)(dong)研(yan)究院(yuan)(yuan)圍繞中國(guo)移動(dong)(dong) “5G+AICDE”融合創新和融智(zhi)發(fa)展目標而設立的(de)專門從事AI領域(yu)技術創新和產品研(yan)發(fa)運營(ying)的(de)部門,是(shi)中國(guo)移動(dong)(dong)在AI方向的(de)核心研(yan)發(fa)團隊(dui)。
(4)中國廣電也有探討
中國(guo)廣電在大(da)模(mo)型領域(yu)近期動作不算多,值得一(yi)提的是今年(nian)4月,中國(guo)廣電召開大(da)模(mo)型人工智能技術與應(ying)用專題研(yan)討會。
當(dang)中(zhong)提及(ji),加(jia)快打(da)造智慧廣電“算網大腦”,建設融合業務(wu)(wu)平(ping)臺,更好實現“有(you)線+5G”全業務(wu)(wu)運營。
海外運營商與大模型二三事
不止國內運營商,國外發力大模型的運營商亦不在少數。
身為巨頭運營商之一,Verizon Communications Inc (Verizon)在近(jin)期一次采訪中(zhong)就(jiu)透(tou)露,他們在生(sheng)成測試用例及代(dai)碼遷移方面(mian)使用了生(sheng)成式AI技術。
此外,Verizon Business首席(xi)產(chan)品官(guan)也曾告訴行業媒體Light Reading,該運營商正在使用(yong)專門的人工智能(neng)來改進網絡性能(neng)、跟蹤數據(ju)趨(qu)勢和(he)客戶體驗,并(bing)探(tan)索(suo)生成式(shi)人工智能(neng)的潛在用(yong)途。
不(bu)過(guo)值得一提的(de)是,Verizon此前(qian)也禁止內部員工使用ChatGPT,原因在于——防止公司(si)機密泄露。
美國(guo)通信(xin)巨(ju)頭AT&T并未推出大(da)模(mo)型,卻也在(zai)運用大(da)模(mo)型技術,毫(hao)不意外地,其(qi)合作方是OpenAI。
據介紹,AT&T部署了OpenAI的工具,幫(bang)助(zhu)其技術(shu)人員完成寫代碼、客戶支(zhi)持、多種語(yu)言(yan)翻譯等(deng)任務。其中(zhong)一個系統名(ming)為Ask AT&T,能(neng)通(tong)過自然語(yu)言(yan)溝通(tong)方式,幫(bang)助(zhu)員工找(zhao)到各類公司(si)(si)文檔及數據,并且還(huan)能(neng)幫(bang)助(zhu)公司(si)(si)優化網(wang)絡、升(sheng)級老舊代碼。
AT&T首(shou)席(xi)數(shu)據(ju)官對此(ci)表(biao)示,幾(ji)乎不需要增加任(ren)何工(gong)作(zuo),生(sheng)產率平(ping)均提高了 25% 到(dao) 50%。
今年早些時候,AT&T與英偉達官宣(xuan)合作,前者將使用NVIDIA 的AI處理數(shu)據,組織員工(gong)培訓(xun)、增強(qiang)客(ke)戶體(ti)驗,甚至是規(gui)劃公(gong)司用車行駛路線。
有(you)趣(qu)的是,AT&T本身與人工智(zhi)能頗有(you)淵源(yuan)。其(qi)曾經(jing)旗(qi)下的貝爾實驗室,走出不(bu)少人工智(zhi)能先驅,其(qi)中就(jiu)包括名聲(sheng)橫跨通信及(ji)(ji)AI兩界的香農(nong),以及(ji)(ji)三巨頭之一的LeCun......
另一家跨國公司Amdocs,業務為通信與媒體服務,也最新推出了電信生成式AI框架,amAIz。
該公(gong)司表示,amAIz能將運營商級架構與開源技術、大(da)語言模型(LLM)相結合,為(wei)通信公(gong)司創造一(yi)個平(ping)臺,發(fa)揮AI價值(zhi)。
根據(ju)其官網介紹(shao),Amdocs合作方為OpenAI。更(geng)早之前,Amdocs還(huan)官宣與微軟擴(kuo)大(da)伙伴關系,聯(lian)合創建AI支持(chi)的客戶互動平臺。
也有運營商直接自己訓練AI大模(mo)型。來自韓國的運營商KT,就(jiu)使用了NVIDIA DGX SuperPOD平臺和NeMo框架(jia),訓練出(chu)一個參數量為十億參數的大型語(yu)言模(mo)型。
該模型名(ming)為(wei)GiGA Genie智能對(dui)話(hua)者,可被集成進智能音響(xiang)中,同樣基于Transformer,它可以對(dui)話(hua)并操控電視、更新路況信(xin)息,目前已經與800人進行(xing)過對(dui)話(hua)。
寫在最后
在過(guo)去幾年(nian),AI及大模型已經解決了(le)不(bu)少通信領域(yu)的問題與挑戰,但這輪LLM爆(bao)發下,讓人們獲取了(le)更多信心(xin)。
谷(gu)歌云上月發表了(le)一(yi)篇博客,探討生成式AI對通信服(fu)務商的(de)轉(zhuan)型影(ying)響。
當中認(ren)為,三(san)個領域的(de)影響最為突出:
(1)改善(shan)客服效率,幫助選(xuan)擇套(tao)餐,提供客戶個性化體驗;
(2)將網絡(luo)規劃和日(ri)常(chang)運(yun)行與AI連接起來(lai),為自主網絡(luo)鋪平道路;
(3)簡化通信運營(ying)效(xiao)率(lv),提升故(gu)障問題診斷效(xiao)率(lv)及服(fu)務滿意(yi)率(lv)。
表(biao)面(mian)看,各家運營商(shang)只是發(fa)發(fa)大模(mo)型,更多細節也尚(shang)未披(pi)露,但追本溯源(yuan),大模(mo)型本身并非關鍵所在,實際(ji)上這是技術(shu)對既(ji)有流程、模(mo)式、認知的一(yi)次革新(xin)——
大模型對通信行業的重塑,早已發生,還在繼續。
參考(kao)資料:
//www.chinatelecom.com.cn/zp/202306/t20230608_74692.html
//analyticsindiamag.com/how-will-genai-help-verizon-revolutionise-telecom/
//www.amdocs.com/news-press/amdocs-launches-amaiz-cutting-edge-enterprise-grade-generative-ai-framework
//cloud.google.com/blog/topics/telecommunications/the-promise-of-generative-ai-in-telecommunications?hl=en