圍(wei)繞大(da)模型(xing)的(de)創業(ye)熱潮方興未艾(ai),百度、阿里、360等互聯網巨頭均已下場,張一(yi)鳴(ming)開始抓大(da)模型(xing)的(de)消(xiao)息(xi)也傳了許久,雖(sui)然(ran)字(zi)節跳動還沒有發布(bu)通(tong)用大(da)模型(xing)產品,但其(qi)在(zai)大(da)模型(xing)上(shang)的(de)布(bu)局一(yi)直在(zai)進行。
6月28日(ri),字(zi)節(jie)跳動公布(bu)大(da)(da)模型(xing)業(ye)(ye)務最新進展,旗下火(huo)山(shan)(shan)引(yin)擎發布(bu)大(da)(da)模型(xing)服務平(ping)臺“火(huo)山(shan)(shan)方舟”。這(zhe)是(shi)一項(xiang)針對B端的大(da)(da)模型(xing)業(ye)(ye)務,其運營模式是(shi),火(huo)山(shan)(shan)引(yin)擎與大(da)(da)模型(xing)生產(chan)方合作,讓它們在平(ping)臺上提供大(da)(da)模型(xing)服務,企業(ye)(ye)可同(tong)步(bu)試用(yong)多個大(da)(da)模型(xing),選用(yong)更適合自身業(ye)(ye)務需要(yao)的模型(xing)組合。火(huo)山(shan)(shan)引(yin)擎自己不(bu)做大(da)(da)模型(xing)。

圖片來自火(huo)山(shan)引擎官網
本(ben)質上,火(huo)山方(fang)舟還是(shi)一個(ge)MaaS(Model-as-a-Service)平(ping)臺(tai),最終(zhong)服務的(de)是(shi)模(mo)型應用(yong)方(fang),也就是(shi)廣大企(qi)業客戶。火(huo)山引擎智能算(suan)法(fa)負責人吳迪認(ren)為,火(huo)山方(fang)舟是(shi)一個(ge)精(jing)品(pin)店(dian),里面是(shi)優(you)選的(de)大模(mo)型服務。
而就在(zai)一(yi)個多星期以前,騰訊(xun)公布了(le)行業(ye)大(da)(da)模型(xing)研(yan)發進展,依(yi)托(tuo)騰訊(xun)云TI平臺打造行業(ye)大(da)(da)模型(xing)精選商店,為客戶(hu)提供MaaS(Model-as-a-Service)一(yi)站式服務,助力客戶(hu)構建專屬大(da)(da)模型(xing)及(ji)智(zhi)能應用。
更(geng)早(zao)之前,百度、阿里等大廠已經(jing)官(guan)宣伙伴計(ji)劃和(he)工具鏈,聲(sheng)稱要讓每(mei)一個行業(ye)都能夠(gou)用上自己的(de)大模(mo)型。
同為To B的(de)大(da)模型(xing)服務(wu),意圖(tu)都在加速大(da)模型(xing)應用(yong)落(luo)地,火山(shan)方(fang)舟和騰訊等(deng)推(tui)出的(de)行業大(da)模型(xing)服務(wu)有何不同?
“大家(jia)首先理(li)念(nian)就不(bu)一(yi)致。”火山(shan)引擎總裁譚待向TechWeb等說(shuo)到,“很多(duo)友商(shang)推出(chu)模型平臺,模型是(shi)自己(ji)做(zuo)的,模型平臺是(shi)自己(ji)做(zuo)的,各種體系也是(shi)自己(ji)做(zuo)的,所以(yi)是(shi)很封閉的端到端。”“火山(shan)方舟是(shi)一(yi)個開放(fang)(fang)的MaaS,行業這些模型都(dou)可以(yi)放(fang)(fang)在(zai)上面(mian)。”
火山引擎多次強(qiang)調自己不做大(da)模(mo)型,卻推(tui)出了(le)大(da)模(mo)型服務平臺,內部是如何決定的?
為什么要做大模型服務平臺?
根據譚待的講述,他在過去半年(nian)接觸(chu)了(le)很多(duo)企(qi)業,絕大(da)多(duo)數企(qi)業對(dui)大(da)模(mo)型仍(reng)有困惑,不(bu)知道該(gai)如何使用。他認(ren)為(wei),選擇性價比(bi)合適(shi)的很重要。比(bi)如,有20個博士學位的人看上去很厲害,但是(shi)工資特(te)別高,你要解一道小學數學題(ti),可能并不(bu)需要這樣的人。
譚(tan)待認為,企業使用(yong)大(da)模(mo)型(xing),未來(lai)可(ke)能會(hui)呈(cheng)現“1+N”的模(mo)式,即通過自研或深度合作,形成1個主力(li)模(mo)型(xing),同(tong)時由于成本和場景復雜(za)多元等原因,在主力(li)模(mo)型(xing)之外(wai),還(huan)會(hui)有N個模(mo)型(xing)同(tong)時應用(yong)。
“大(da)模(mo)型(xing)市場未(wei)來的發展趨勢一定是多云多模(mo)型(xing),即少數(shu)超級大(da)模(mo)型(xing)+多個大(da)模(mo)型(xing)+更多個行業(ye)/垂類模(mo)型(xing)。”基于這樣(yang)的判斷,火(huo)山引擎要做的就是把平(ping)臺做好(hao)。
火山方舟的(de)多模型架構支持企(qi)業(ye)同步試用多個大模型,選用更適合自(zi)身業(ye)務(wu)需要(yao)的(de)模型組合,并提供模型精調(diao)、評測、推理(li)等多項(xiang)服務(wu)。
目前(qian),“火山方舟”已(yi)經集(ji)成了(le)百川智能、出門問問、復旦(dan)大(da)學MOSS、IDEA研(yan)究院(yuan)、瀾舟科技(ji)、MiniMax、智譜AI(以拼(pin)音首(shou)字(zi)母排序)等多(duo)家(jia)AI科技(ji)公司(si)及科研(yan)院(yuan)所的大(da)模型,并(bing)已(yi)啟(qi)動邀(yao)測,首(shou)批(pi)邀(yao)測企業分布在金融(rong)、消(xiao)費、汽車等眾多(duo)行業。
據悉,目前抖音集團內部(bu)已有十多個業務團隊試(shi)用“火山(shan)方(fang)舟”,主要用于(yu)代碼糾錯等研(yan)發提效場景,文本分類、總結摘要等知識(shi)管理(li)場景,以及數(shu)據標注、歸因分析等方(fang)面。
如何服務好大模型企業?
話說回來,火山(shan)引擎自己沒有從0到1做(zuo)過(guo)大(da)模型,要如何服務好(hao)大(da)模型企(qi)業來做(zuo)這件事?
譚待坦言,這個(ge)顧慮是有道(dao)理的,但好在(zai)我(wo)們(men)現在(zai)從0到1服(fu)務了很(hen)多企業(ye),所以不(bu)擔心了。
今年4月(yue),火(huo)山引擎(qing)發布大(da)模(mo)(mo)型訓(xun)練云平(ping)臺,支持萬(wan)卡級大(da)模(mo)(mo)型訓(xun)練、微秒(miao)級延遲(chi)網絡(luo)。當時,譚(tan)待對外(wai)披露,火(huo)山引擎(qing)已經拿下國內70%的大(da)模(mo)(mo)型玩家(jia)。
MiniMax作(zuo)為合作(zuo)方(fang),在(zai)分享中表示,火(huo)山引(yin)擎這一套機器學(xue)習(xi)平臺,已經部(bu)署到了(le)MiniMax的文(wen)本、視覺(jue)、聲音三個模態大模型訓練和(he)推理場(chang)景中。有(you)穩健(jian)的大模型基礎(chu)設(she)施,MiniMax從零開始自主完整地(di)跑通了(le)大模型與(yu)用(yong)戶交互的迭代閉環。
“因為在(zai)訓(xun)練(lian)端和這些大模型企業建立了很強的合(he)作關系和信(xin)任感,它(ta)們(men)也愿意把(ba)推理(li)放到火山上。”譚待(dai)表示(shi),而訓(xun)練(lian)和推理(li)放在(zai)一起,可以大大節省(sheng)企業的運營成本。
長期來(lai)(lai)看(kan),模(mo)型(xing)的(de)(de)推(tui)(tui)理(li)開銷會超過訓練開銷,降低推(tui)(tui)理(li)成(cheng)本會是大(da)模(mo)型(xing)應用落地的(de)(de)重要因素。吳(wu)迪(di)補充說,“一(yi)(yi)個經過良好精調的(de)(de)中小規格模(mo)型(xing),在特定工作上的(de)(de)表現(xian)可能不亞(ya)于通用的(de)(de)、巨大(da)的(de)(de)基座(zuo)模(mo)型(xing),而(er)推(tui)(tui)理(li)成(cheng)本可以降低到(dao)原(yuan)來(lai)(lai)的(de)(de)十(shi)分之一(yi)(yi)。”
據吳迪介(jie)紹,火(huo)山方(fang)舟已經(jing)上線基于(yu)安全沙箱的(de)大模型(xing)安全互信計算方(fang)案(an),利(li)用(yong)(yong)計算隔(ge)離(li)、存儲隔(ge)離(li)、網絡(luo)隔(ge)離(li)、流量(liang)審計等方(fang)式,實(shi)現了模型(xing)的(de)機密(mi)性、完整(zheng)性和可用(yong)(yong)性保(bao)證,適用(yong)(yong)于(yu)對訓練和推(tui)理延時要求較低的(de)客戶(hu)。
在算力方面,據《晚點(dian) LatePost》報道,字節跳動(dong)今年(nian)向英偉達(da)訂購(gou)了超過10億美元的(de)GPU。對于AI算力的(de)儲備情(qing)況,譚(tan)待回應(ying)稱,“涉及商業(ye)機密,不(bu)方便披露。”
此(ci)前,火山(shan)引擎宣(xuan)布(bu)與字節(jie)國(guo)內業(ye)務并池。基(ji)于(yu)內外統(tong)一的(de)云原(yuan)生基(ji)礎架構,抖音(yin)等業(ye)務的(de)空閑計(ji)算資源可極速調度給火山(shan)引擎客(ke)戶使用,離線業(ye)務資源分(fen)鐘(zhong)級調度10萬核CPU,在(zai)線業(ye)務資源也可潮汐復(fu)用。
字節通用大模型還在路上
雖然(ran)火山引擎(qing)不做大模型(xing),但在研發(fa)大模型(xing)這件事上,字(zi)節是相當認真的,因為(wei)其創始人張一鳴非常重(zhong)視(shi)AI相關(guan)產業。
早在2021年(nian)5月,張(zhang)一鳴(ming)在內部信中表示,“大(da)家更容易(yi)關注(zhu)商(shang)業模式(shi)的變(bian)化和品牌渠道的更新(xin),很(hen)少注(zhu)意到(dao)技(ji)術變(bian)革已經在醞釀中。虛擬現實、生命科學、科學計算對人(ren)類(lei)生活的影響(xiang)都(dou)已現黎(li)明之(zhi)曙光(guang)”。
2022年11月,AI聊天機(ji)器人(ren)ChatGPT橫空問世(shi),引發全球(qiu)新一輪AI熱潮,國內外科技巨頭紛紛入局大模型。今(jin)年2月,36氪(ke)爆(bao)料,字(zi)節在(zai)(zai)大模型上(shang)已(yi)有布(bu)局,分別在(zai)(zai)語(yu)言和(he)圖像兩種模態上(shang)發力(li)。
其(qi)中(zhong),語(yu)言大模型團隊由字節(jie)搜(sou)索(suo)部(bu)門牽頭(tou)(tou),目前團隊規模在十數(shu)人左(zuo)右。圖(tu)片(pian)大模型團隊則由產品(pin)研發(fa)與工(gong)程(cheng)架構部(bu)下屬的智能(neng)創作團隊牽頭(tou)(tou)。對此(ci),字節(jie)方面承認技術中(zhong)臺在這些領域有探索(suo),但還很初期,不(bu)成熟。
今(jin)年4月,張(zhang)一(yi)鳴在(zai)2023公開信(xin)中(zhong)強(qiang)調,“字節(jie)跳(tiao)動無法(fa)錯過AGI。”他確(que)信(xin)AGI是抖音TikTok在(zai)全球(qiu)發現新的增(zeng)(zeng)長機遇不可或缺的伙伴,可以解決字節(jie)跳(tiao)動的第(di)二曲線增(zeng)(zeng)長困境。
為了研(yan)究(jiu)大(da)模型,張(zhang)一鳴(ming)做了大(da)量(liang)功(gong)課。今年5月(yue),《中(zhong)國企(qi)業家雜志》報道稱(cheng),張(zhang)一鳴(ming)最近在看(kan)OpenAI的一系列論(lun)文,并(bing)且常常讀至(zhi)深(shen)夜。他想(xiang)搞明(ming)白(bai),太平(ping)洋對(dui)岸究(jiu)竟發生(sheng)了什(shen)么(me)。
幾(ji)天后,張(zhang)一鳴(ming)在香港(gang)成立(li)了(le)一家個人(ren)投資(zi)基(ji)金(jin)(jin),名為Cool River Venture。據消息人(ren)士(shi)透露,該基(ji)金(jin)(jin)的主要投資(zi)方向(xiang)是(shi)科(ke)技相(xiang)關行(xing)業。
6月初(chu),字(zi)節(jie)正在(zai)內(nei)部測(ce)試一款AI對話(hua)類產品(pin),目(mu)前暫時稱(cheng)作“Grace”,該產品(pin)處于測(ce)試完善的階(jie)段。字(zi)節(jie)確認了這一消息,稱(cheng)Grace是(shi)一個AI對話(hua)類測(ce)試項目(mu)的內(nei)部代(dai)號,目(mu)前還處于初(chu)級階(jie)段,僅用于內(nei)部體(ti)驗(yan)測(ce)試。
由(you)此來看,字節發布大模型產品只(zhi)是時(shi)間問題(ti)。譚待表示,火(huo)山引擎不做大模型,字節內部(bu)其他團隊如(ru)果做好了模型,也(ye)會放到火(huo)山方(fang)舟上,對外提供服(fu)務。