圍繞大(da)模型(xing)的(de)創業(ye)熱潮方興(xing)未(wei)艾,百度、阿里、360等互聯網巨(ju)頭(tou)均(jun)已下場,張一鳴開(kai)始抓大(da)模型(xing)的(de)消息也傳了許久,雖然字(zi)節跳動還沒有(you)發布(bu)通用(yong)大(da)模型(xing)產品(pin),但其在大(da)模型(xing)上的(de)布(bu)局一直在進(jin)行。
6月(yue)28日(ri),字節跳動公布大(da)(da)模型(xing)(xing)業務(wu)最新(xin)進展(zhan),旗下火(huo)(huo)山引擎(qing)發布大(da)(da)模型(xing)(xing)服務(wu)平(ping)臺(tai)(tai)“火(huo)(huo)山方舟”。這是一項針對B端的(de)大(da)(da)模型(xing)(xing)業務(wu),其(qi)運營(ying)模式是,火(huo)(huo)山引擎(qing)與大(da)(da)模型(xing)(xing)生產(chan)方合(he)作,讓(rang)它們(men)在平(ping)臺(tai)(tai)上提供大(da)(da)模型(xing)(xing)服務(wu),企業可同步(bu)試用多個大(da)(da)模型(xing)(xing),選用更適合(he)自(zi)(zi)身業務(wu)需(xu)要(yao)的(de)模型(xing)(xing)組(zu)合(he)。火(huo)(huo)山引擎(qing)自(zi)(zi)己不(bu)做大(da)(da)模型(xing)(xing)。
圖片來自火山引(yin)擎官網
本(ben)質上,火山方(fang)舟還是一個MaaS(Model-as-a-Service)平臺(tai),最終服務的(de)是模型(xing)應用(yong)方(fang),也就(jiu)是廣大企業(ye)客(ke)戶。火山引擎(qing)智能算法負(fu)責人(ren)吳迪認為,火山方(fang)舟是一個精品店(dian),里面是優選的(de)大模型(xing)服務。
而就在一(yi)個(ge)多星期(qi)以(yi)前,騰訊公布(bu)了行業大模型(xing)研發進展,依托騰訊云TI平臺(tai)打造行業大模型(xing)精(jing)選商店,為客(ke)戶(hu)(hu)提供MaaS(Model-as-a-Service)一(yi)站式服(fu)務,助(zhu)力(li)客(ke)戶(hu)(hu)構建專(zhuan)屬大模型(xing)及智能(neng)應用(yong)。
更早之前,百度、阿里等大廠(chang)已經官宣伙(huo)伴(ban)計(ji)劃和工具(ju)鏈,聲稱(cheng)要讓每一個(ge)行業都能夠用(yong)上(shang)自己的大模型。
同為To B的(de)大(da)模(mo)型服務,意圖都(dou)在加速大(da)模(mo)型應用落地,火山方舟和騰訊等推(tui)出(chu)的(de)行業大(da)模(mo)型服務有何(he)不(bu)同?
“大家首先理念(nian)就不一(yi)致。”火山引(yin)擎總裁譚待向TechWeb等說(shuo)到(dao),“很多友商推出模(mo)型平臺,模(mo)型是自(zi)(zi)己做(zuo)(zuo)的(de),模(mo)型平臺是自(zi)(zi)己做(zuo)(zuo)的(de),各種體系也是自(zi)(zi)己做(zuo)(zuo)的(de),所以是很封閉的(de)端到(dao)端。”“火山方舟是一(yi)個(ge)開放(fang)的(de)MaaS,行業(ye)這些(xie)模(mo)型都可以放(fang)在上(shang)面。”
火(huo)山引(yin)擎(qing)多次強調自己不(bu)做大模型(xing)(xing),卻推出了(le)大模型(xing)(xing)服務平臺,內部(bu)是如何(he)決定的?
為什么要做大模型服務平臺?
根據譚(tan)待的講述,他(ta)在過去(qu)半(ban)年接觸(chu)了很(hen)多企業,絕大多數(shu)企業對大模(mo)型仍有(you)困惑,不知道(dao)該如何使用。他(ta)認為(wei),選擇性價比合適的很(hen)重要(yao)。比如,有(you)20個博士學(xue)位的人看上去(qu)很(hen)厲害,但(dan)是(shi)工資特別高(gao),你(ni)要(yao)解一道(dao)小學(xue)數(shu)學(xue)題,可能(neng)并不需要(yao)這樣的人。
譚待(dai)認為,企業使(shi)用大模(mo)型(xing)(xing),未來可能會(hui)呈現“1+N”的模(mo)式,即通過(guo)自研或深度合(he)作,形成(cheng)1個(ge)主力模(mo)型(xing)(xing),同時由于成(cheng)本和場(chang)景復雜多(duo)元等原因,在主力模(mo)型(xing)(xing)之外,還(huan)會(hui)有N個(ge)模(mo)型(xing)(xing)同時應用。
“大模(mo)(mo)型(xing)市場未來的發展趨(qu)勢一定是多云多模(mo)(mo)型(xing),即少數超級大模(mo)(mo)型(xing)+多個大模(mo)(mo)型(xing)+更多個行業/垂類模(mo)(mo)型(xing)。”基于這樣的判斷(duan),火(huo)山引擎要做(zuo)的就是把平臺做(zuo)好(hao)。
火山方(fang)舟(zhou)的多(duo)模型架構支持企業同(tong)步(bu)試用(yong)多(duo)個大(da)模型,選用(yong)更(geng)適合自身業務(wu)需要的模型組(zu)合,并提(ti)供模型精調、評(ping)測、推理(li)等多(duo)項服務(wu)。
目前,“火山(shan)方舟”已經(jing)集成了百川智(zhi)能、出門問(wen)(wen)問(wen)(wen)、復旦大(da)學MOSS、IDEA研究院、瀾舟科(ke)技、MiniMax、智(zhi)譜AI(以拼音首字母排序)等多家AI科(ke)技公司及科(ke)研院所的大(da)模型,并已啟動邀測,首批邀測企業分布(bu)在金(jin)融、消費、汽車等眾多行業。
據(ju)悉,目(mu)前抖音集(ji)團內部已(yi)有(you)十(shi)多個業務團隊試用“火山方(fang)舟”,主要(yao)用于代(dai)碼糾錯等(deng)研發提效場(chang)景,文本(ben)分(fen)類(lei)、總(zong)結摘要(yao)等(deng)知(zhi)識管理場(chang)景,以(yi)及數據(ju)標(biao)注、歸因分(fen)析等(deng)方(fang)面(mian)。
如何服務好大模型企業?
話說回(hui)來,火山(shan)引(yin)擎自己(ji)沒有(you)從(cong)0到1做過(guo)大模(mo)型,要如何服務好大模(mo)型企業來做這件事?
譚待(dai)坦言,這個顧(gu)慮(lv)是有道理的(de),但好在我們現在從0到1服務了(le)很多企業,所(suo)以不(bu)擔(dan)心(xin)了(le)。
今年(nian)4月,火山引(yin)擎發(fa)布大模型訓練(lian)云平臺,支(zhi)持萬(wan)卡級(ji)大模型訓練(lian)、微秒級(ji)延(yan)遲網絡。當(dang)時(shi),譚待對(dui)外披露,火山引(yin)擎已經拿下國內(nei)70%的大模型玩(wan)家。
MiniMax作(zuo)為合作(zuo)方,在分(fen)享中表示(shi),火(huo)山引擎(qing)這一套機器學習(xi)平臺,已經部署到了MiniMax的(de)(de)文(wen)本、視(shi)覺、聲音三個模(mo)(mo)態大模(mo)(mo)型訓(xun)練和推理場景中。有穩健的(de)(de)大模(mo)(mo)型基(ji)礎設施,MiniMax從零開始自(zi)主完整地跑通了大模(mo)(mo)型與用戶(hu)交互的(de)(de)迭代閉環(huan)。
“因為在訓(xun)練端(duan)和(he)這些(xie)大模型企(qi)業(ye)(ye)建立了很強的合作關系和(he)信任感,它們也愿(yuan)意把推(tui)理放到(dao)火山(shan)上。”譚待(dai)表示,而(er)訓(xun)練和(he)推(tui)理放在一起,可以大大節省企(qi)業(ye)(ye)的運營(ying)成本(ben)。
長期來(lai)看,模(mo)型的(de)(de)推(tui)(tui)理開(kai)銷(xiao)會超過(guo)訓練開(kai)銷(xiao),降低推(tui)(tui)理成(cheng)本會是大模(mo)型應用(yong)落(luo)地的(de)(de)重要(yao)因素。吳迪補充說,“一個經過(guo)良好精調的(de)(de)中(zhong)小(xiao)規(gui)格模(mo)型,在特定工作上的(de)(de)表現可(ke)(ke)能(neng)不亞于通用(yong)的(de)(de)、巨大的(de)(de)基座模(mo)型,而推(tui)(tui)理成(cheng)本可(ke)(ke)以降低到原(yuan)來(lai)的(de)(de)十分之一。”
據吳迪介(jie)紹,火山(shan)方(fang)舟已經上線基于安全沙箱的大模型(xing)安全互(hu)信計(ji)算(suan)方(fang)案,利用計(ji)算(suan)隔離(li)、存儲隔離(li)、網絡隔離(li)、流量審計(ji)等(deng)方(fang)式,實現了模型(xing)的機(ji)密(mi)性、完整性和可用性保證(zheng),適用于對訓練和推理延(yan)時要求較(jiao)低(di)的客(ke)戶(hu)。
在(zai)算(suan)力(li)方面,據《晚點 LatePost》報道,字節(jie)跳動(dong)今年向英偉達訂(ding)購了超過10億美元(yuan)的GPU。對(dui)于AI算(suan)力(li)的儲備(bei)情(qing)況,譚待回應稱,“涉(she)及商業機密,不(bu)方便(bian)披露。”
此前,火山引(yin)擎(qing)宣布與字節國內(nei)業(ye)務并池。基于內(nei)外統(tong)一的云原(yuan)生基礎(chu)架構,抖音等業(ye)務的空閑計(ji)算資(zi)源(yuan)(yuan)可(ke)極(ji)速調度(du)給火山引(yin)擎(qing)客(ke)戶使(shi)用(yong)(yong),離(li)線(xian)業(ye)務資(zi)源(yuan)(yuan)分鐘級調度(du)10萬核(he)CPU,在線(xian)業(ye)務資(zi)源(yuan)(yuan)也可(ke)潮汐(xi)復用(yong)(yong)。
字節通用大模型還在路上
雖(sui)然火(huo)山引擎(qing)不做大(da)(da)模型(xing)(xing),但在研發(fa)大(da)(da)模型(xing)(xing)這件事上,字節是(shi)相當(dang)認真的,因為其創始人(ren)張一鳴(ming)非常(chang)重視AI相關產業。
早在2021年5月,張(zhang)一鳴在內(nei)部信中(zhong)表示,“大(da)家更容易關注商(shang)業模式的變(bian)化和(he)品牌渠道的更新,很少(shao)注意到(dao)技術變(bian)革已(yi)經(jing)在醞釀中(zhong)。虛擬現(xian)實、生命科(ke)學(xue)、科(ke)學(xue)計(ji)算(suan)對人類生活(huo)的影響都已(yi)現(xian)黎(li)明之曙光”。
2022年11月,AI聊天機(ji)器(qi)人ChatGPT橫空問(wen)世,引發(fa)(fa)全(quan)球新一輪AI熱潮(chao),國內(nei)外科技巨頭(tou)紛(fen)紛(fen)入局(ju)大(da)模(mo)型(xing)。今年2月,36氪爆料(liao),字節在大(da)模(mo)型(xing)上已(yi)有布局(ju),分別在語言(yan)和圖像兩(liang)種模(mo)態上發(fa)(fa)力。
其中,語言大模型團(tuan)隊(dui)由(you)字(zi)節搜索(suo)部門(men)牽(qian)頭(tou),目前團(tuan)隊(dui)規模在十數(shu)人左(zuo)右。圖片大模型團(tuan)隊(dui)則由(you)產品(pin)研發與工程架(jia)構部下屬的智能(neng)創作團(tuan)隊(dui)牽(qian)頭(tou)。對此(ci),字(zi)節方面(mian)承認技術中臺在這些領域有探索(suo),但還很(hen)初期,不(bu)成熟。
今年(nian)4月,張一鳴在(zai)2023公開信中強調(diao),“字(zi)節跳動無法錯過AGI。”他(ta)確信AGI是抖音TikTok在(zai)全球(qiu)發現新的(de)(de)增長機遇不可(ke)或缺(que)的(de)(de)伙伴(ban),可(ke)以解決字(zi)節跳動的(de)(de)第二曲線(xian)增長困境。
為了研(yan)究大模(mo)型,張(zhang)一鳴(ming)做了大量功課。今年5月,《中(zhong)國企業家雜志》報道(dao)稱,張(zhang)一鳴(ming)最近在看OpenAI的(de)一系列論文(wen),并且常(chang)常(chang)讀至深夜。他想搞明白,太平(ping)洋對岸究竟(jing)發生了什么。
幾(ji)天后,張一(yi)(yi)鳴在香(xiang)港成立(li)了一(yi)(yi)家個人(ren)投資(zi)(zi)基金(jin),名為Cool River Venture。據(ju)消(xiao)息人(ren)士透露(lu),該基金(jin)的(de)主要投資(zi)(zi)方向是科技相(xiang)關行業。
6月初,字節正在內(nei)部(bu)測(ce)試一款AI對話(hua)類產(chan)品,目前(qian)暫時稱作(zuo)“Grace”,該(gai)產(chan)品處于(yu)測(ce)試完善的(de)階段。字節確認了這一消(xiao)息,稱Grace是一個AI對話(hua)類測(ce)試項目的(de)內(nei)部(bu)代號,目前(qian)還處于(yu)初級階段,僅用(yong)于(yu)內(nei)部(bu)體驗測(ce)試。
由此來看(kan),字節發布大模(mo)型產品只(zhi)是時間(jian)問題。譚待(dai)表示,火(huo)山(shan)引擎不做(zuo)大模(mo)型,字節內(nei)部其(qi)他(ta)團隊如果(guo)做(zuo)好了模(mo)型,也(ye)會(hui)放到(dao)火(huo)山(shan)方舟上,對外提(ti)供服務。