2023年(nian)是當之(zhi)(zhi)無(wu)愧的“大(da)模型之(zhi)(zhi)年(nian)”,據瑞銀(yin)集團的一份(fen)報告顯示(shi),ChatGPT推出僅僅兩個月后,月活用(yong)戶(hu)已經突破了1億,成為史上(shang)用(yong)戶(hu)增長速度最快(kuai)的消費(fei)級應用(yong)程序(xu)。
在(zai)炙熱的(de)大(da)模(mo)(mo)(mo)型(xing)賽道里,基(ji)于中文(wen)大(da)模(mo)(mo)(mo)型(xing)的(de)發(fa)布也是層出不窮,相(xiang)較于通用(yong)大(da)模(mo)(mo)(mo)型(xing)的(de)“大(da)而全”,冪律(lv)(lv)(lv)(lv)聯(lian)合智譜AI此次聯(lian)合發(fa)布基(ji)于中文(wen)千億大(da)模(mo)(mo)(mo)型(xing)的(de)法律(lv)(lv)(lv)(lv)垂(chui)直大(da)模(mo)(mo)(mo)型(xing)——PowerLawGLM,聚(ju)焦于法律(lv)(lv)(lv)(lv)細(xi)分領(ling)域,針對(dui)中文(wen)法律(lv)(lv)(lv)(lv)場景(jing)的(de)應用(yong)效果具有獨特(te)優勢,具備豐富的(de)法律(lv)(lv)(lv)(lv)知識和法律(lv)(lv)(lv)(lv)語言理解能力。
一、“法律垂直大模型”的誕生
通用大模型是具有強大語言理解能力和生成能力的人工智能模型(xing),但(dan)由(you)于專業知識及數據的(de)(de)欠缺(que),將通(tong)用(yong)大(da)模型(xing)直(zhi)接應用(yong)在法(fa)律(lv)領域,往往存(cun)在著嚴重的(de)(de)效果問題,例如(ru)法(fa)律(lv)知識錯誤、專業引用(yong)偏差、法(fa)律(lv)體系差異等問題。比如(ru)前段時間美國(guo)律(lv)師使用(yong)ChatGPT來提交法(fa)庭簡報,結果引用(yong)的(de)(de)6個案(an)例都是ChatGPT編造的(de)(de)虛假案(an)例,這(zhe)種“人(ren)工智能幻(huan)覺”現象在法(fa)律(lv)場景屢見不(bu)鮮,也說明了目前通(tong)用(yong)大(da)模型(xing)難(nan)以保證法(fa)律(lv)專業層面的(de)(de)真實性(xing)、正確(que)性(xing)。
冪律(lv)智(zhi)(zhi)能(neng)自2017年成立以(yi)來即深(shen)(shen)耕于(yu)法(fa)律(lv)+AI領(ling)(ling)域,基于(yu)領(ling)(ling)先的(de)(de)(de)法(fa)律(lv)AI能(neng)力,向企業提供智(zhi)(zhi)能(neng)合(he)同產(chan)品,并且(qie)深(shen)(shen)度參(can)與(yu)了清(qing)華大(da)(da)學自然語言處理實驗室的(de)(de)(de)OpenCLaP、LawFormer等法(fa)律(lv)大(da)(da)模(mo)型(xing)的(de)(de)(de)研發及(ji)應(ying)用(yong)。而智(zhi)(zhi)譜AI作為領(ling)(ling)先的(de)(de)(de)通(tong)用(yong)大(da)(da)模(mo)型(xing)廠商,法(fa)律(lv)領(ling)(ling)域是(shi)其大(da)(da)模(mo)型(xing)迭代及(ji)布局的(de)(de)(de)重要方(fang)向,基于(yu)雙方(fang)達成的(de)(de)(de)戰略合(he)作,在法(fa)律(lv)大(da)(da)模(mo)型(xing)上展開深(shen)(shen)度合(he)作,來加快推動大(da)(da)模(mo)型(xing)在法(fa)律(lv)行業應(ying)用(yong)落地及(ji)商業化。
自2023年初雙方成立(li)聯合項(xiang)目組,啟動法(fa)律(lv)大模型(xing)研發(fa)以來,經過千億(yi)規模的基(ji)座模型(xing)增量訓(xun)練、對話層(ceng)(ceng)監督微調、應(ying)用(yong)層(ceng)(ceng)工(gong)程優(you)化,推出了基(ji)于中文千億(yi)大模型(xing)的法(fa)律(lv)垂直大模型(xing)——PowerLawGLM。
二、“PowerLawGLM”的打造
PowerLawGLM法律(lv)大模(mo)(mo)(mo)型,基(ji)于智譜目前效果(guo)最(zui)好的(de)ChatGLM 130B通用(yong)千億對話大模(mo)(mo)(mo)型進(jin)行聯(lian)合研發。在2022年(nian)11月斯坦(tan)福大學基(ji)礎模(mo)(mo)(mo)型中(zhong)心(xin)對全球 30 個大模(mo)(mo)(mo)型的(de)評測結果(guo)中(zhong),GLM-130B 是亞洲唯一入選的(de)Top10大模(mo)(mo)(mo)型。
訓練法律(lv)垂直大模型第一步——基座層:閱讀大量法律(lv)文本。
通用大(da)(da)模(mo)型(xing)在法(fa)(fa)(fa)律(lv)場景的(de)應(ying)用效果問題,最基(ji)礎的(de)原因在于(yu)基(ji)座大(da)(da)模(mo)型(xing)沒有經過大(da)(da)量高質量專(zhuan)業(ye)法(fa)(fa)(fa)律(lv)文本數據(ju)(ju)的(de)訓(xun)練。雙(shuang)方基(ji)于(yu)ChatGLM130B的(de)基(ji)座大(da)(da)模(mo)型(xing)GLM 130B,經過了多(duo)輪多(duo)次高質量法(fa)(fa)(fa)律(lv)文本數據(ju)(ju)(裁判文書(shu)、法(fa)(fa)(fa)律(lv)法(fa)(fa)(fa)規、法(fa)(fa)(fa)律(lv)知識問答等)清洗及(ji)模(mo)型(xing)增(zeng)量訓(xun)練,得(de)到法(fa)(fa)(fa)律(lv)版(ban)基(ji)座大(da)(da)模(mo)型(xing)LawGLM 130B。
訓練法(fa)律(lv)(lv)垂直大模型第二步(bu)——對話(hua)(hua)層:與法(fa)律(lv)(lv)對話(hua)(hua)場景(jing)對齊,具(ju)備法(fa)律(lv)(lv)場景(jing)的對話(hua)(hua)能力。
LawGLM 130B基(ji)座模型(xing)具(ju)備了(le)文本生成能力(li)(li),但在法律對話能力(li)(li)上存在欠缺,因此(ci)需要利用大量(liang)的法律領域對話數(shu)據進(jin)行監督(du)微調。雙方(fang)利用了(le)近百萬對高質量(liang)法律知識問題(ti)數(shu)據,來訓練(lian)得(de)到(dao)PowerLawGLM beta版,此(ci)時,它(ta)已(yi)經初步具(ju)備了(le)法律場景的端(duan)到(dao)端(duan)生成式對話能力(li)(li)以及獨(du)特的回答習慣。
訓練法律垂直(zhi)大(da)模型第三步——應用層:保(bao)證(zheng)輸出結果質量和可靠(kao)性。
法(fa)律(lv)問(wen)答(da)的(de)很(hen)(hen)多(duo)場景(jing)都(dou)有其特(te)殊性(xing)(xing)(xing),對于結果準確性(xing)(xing)(xing)的(de)要求、可(ke)解(jie)釋(shi)性(xing)(xing)(xing)的(de)要求較高,直接(jie)大模型來端(duan)到端(duan)生成(cheng)回(hui)答(da),會(hui)面(mian)臨(lin)很(hen)(hen)多(duo)效果問(wen)題,例(li)如(ru)引用(yong)(yong)失效法(fa)律(lv)、杜撰法(fa)條案例(li)、與法(fa)律(lv)人處(chu)理邏輯(ji)不一致等(deng)等(deng)。因此冪律(lv)設計了一系(xi)列通(tong)用(yong)(yong)型及場景(jing)特(te)定型的(de)工程(cheng)化優化方案,來提(ti)升法(fa)律(lv)問(wen)答(da)的(de)有法(fa)可(ke)依和引用(yong)(yong)法(fa)條內(nei)容的(de)準確性(xing)(xing)(xing),最終提(ti)升法(fa)律(lv)問(wen)答(da)的(de)專業性(xing)(xing)(xing)和可(ke)靠性(xing)(xing)(xing)。
通過以上(shang)三層(ceng)(ceng)結構,在基座層(ceng)(ceng)、對(dui)話層(ceng)(ceng)、應用層(ceng)(ceng)上(shang)提升了大模型(xing)對(dui)法(fa)律專業文(wen)本的理解、推理與生(sheng)成能力:
理解(jie)能力:理解(jie)復雜(za)的法律文本,包括(kuo)各(ge)種(zhong)法律條(tiao)款、判例(li)、合同(tong)和(he)其他法律文件(jian)。
推理能力:從法律文本中推斷(duan)出(chu)潛在的(de)(de)問(wen)題,提供可能的(de)(de)解(jie)決方案,或(huo)者(zhe)預測出(chu)可能的(de)(de)法律后果。
生成(cheng)能力:回答法律問題(ti),為用戶提供咨詢,甚(shen)至幫助起草法律文件。它(ta)還(huan)可以進行法律對話,幫助用戶理(li)解(jie)復雜的(de)法律問題(ti)。
三、“PowerLawGLM”的實際能力
為了(le)測(ce)試PowerLawGLM與(yu)通用(yong)(yong)大(da)(da)模型之間(jian)的(de)(de)效果(guo)(guo)對比(bi),冪律(lv)(lv)(lv)的(de)(de)法(fa)律(lv)(lv)(lv)團隊收集了(le)互聯網上法(fa)律(lv)(lv)(lv)相關的(de)(de)Top100高頻問(wen)題,進(jin)行(xing)了(le)不同(tong)模型的(de)(de)效果(guo)(guo)人(ren)工評測(ce),并且(qie)從法(fa)律(lv)(lv)(lv)專業人(ren)員的(de)(de)角(jiao)度(du),與(yu)ChatGPT等典型的(de)(de)通用(yong)(yong)大(da)(da)模型進(jin)行(xing)的(de)(de)效果(guo)(guo)對比(bi)。評測(ce)的(de)(de)維度(du)包括:對問(wen)題點的(de)(de)把握是(shi)否準(zhun)(zhun)確(que)、對問(wen)題所含信(xin)息的(de)(de)分(fen)析是(shi)否全面(mian)準(zhun)(zhun)確(que)、答案(an)的(de)(de)操(cao)(cao)作可行(xing)性(xing)強弱、答案(an)的(de)(de)法(fa)律(lv)(lv)(lv)專業性(xing)程度(du)、法(fa)律(lv)(lv)(lv)依(yi)據有無,以及準(zhun)(zhun)確(que)性(xing)全面(mian)性(xing)程度(du)。最終的(de)(de)評測(ce)結(jie)果(guo)(guo)顯(xian)示(shi),100個(ge)問(wen)題的(de)(de)最優(you)答案(an)中,PowerLawGLM接近70%是(shi)最優(you)答案(an),并且(qie)在操(cao)(cao)作可行(xing)性(xing)、法(fa)律(lv)(lv)(lv)專業性(xing)等方面(mian)差(cha)異顯(xian)著。
如(ru)圖所示,以(yi)下是部(bu)分ChatGPT和PowerLawGLM的回答:
1.針對某(mou)一(yi)法律問題的咨詢:
ChatGPT對(dui)于彩禮(li)問題(ti)的回(hui)答
PowerLawGLM對同一問題給出的回答(da)
在此(ci)法(fa)律問(wen)(wen)題上,ChatGPT沒(mei)有(you)對(dui)(dui)(dui)能否請求對(dui)(dui)(dui)方返還彩禮進行(xing)正面解答,也沒(mei)有(you)對(dui)(dui)(dui)彩禮問(wen)(wen)題從法(fa)律角度進行(xing)分(fen)析(xi)并給(gei)出相關法(fa)律依據(ju);而PowerLawGLM則對(dui)(dui)(dui)此(ci)問(wen)(wen)題進行(xing)了明確回答,對(dui)(dui)(dui)題目進行(xing)分(fen)析(xi)并給(gei)出了相關法(fa)律依據(ju)。
2.關于(yu)買賣合(he)同的起草:
ChatGPT對于合同(tong)起草的回答
PowerLawGLM關于(yu)合同(tong)起草的回答(da)
如圖所(suo)示,ChatGPT起(qi)草的合(he)同(tong)(tong)較為簡略(lve),整(zheng)體合(he)同(tong)(tong)格式(shi)及(ji)條(tiao)款(kuan)表述與(yu)一份真實可用的合(he)同(tong)(tong)差距(ju)較大,經常出現引(yin)用失效法(fa)律、條(tiao)款(kuan)缺失、信息不完備等問題;而PowerLawGLM將用戶提問中的主體、標的物、單價、訴訟(song)法(fa)院等信息準確無誤(wu)的體現在(zai)合(he)同(tong)(tong)正文中,并且合(he)同(tong)(tong)條(tiao)款(kuan)的完整(zheng)性、專業性差異顯著。
四、基于PowerLawGLM大模型的對話產品ChatMe正式上線
基于PowerLawGLM大模(mo)型(xing)的能力,冪律打造了法律對話產(chan)品ChatMe,現(xian)已正式上(shang)線,首批(pi)開放50個內測(ce)名(ming)額,掃碼(ma)文末二維碼(ma)即可直接(jie)預(yu)約報名(ming)體驗(yan)。
ChatMe的功能和特點:
合同咨詢:ChatMe擁有豐富的合同知(zhi)識(shi)(shi)數(shu)據,能夠回答諸如“合同租期(qi)期(qi)限(xian)”等(deng)合同知(zhi)識(shi)(shi)問題。
合同(tong)起(qi)(qi)草(cao):貼近中文合同(tong)起(qi)(qi)草(cao)場景,模版起(qi)(qi)草(cao)、條款(kuan)組合起(qi)(qi)草(cao)、端(duan)對端(duan)生(sheng)(sheng)成起(qi)(qi)草(cao)等多種解決方案,讓生(sheng)(sheng)成的合同(tong)質(zhi)量更高。
合(he)同(tong)信(xin)息(xi)抽取:能夠(gou)識別合(he)同(tong)中的關鍵信(xin)息(xi)進(jin)行提取,如(ru)主體(ti)信(xin)息(xi),合(he)同(tong)總(zong)金額等等。
合同(tong)審查:能夠(gou)針對合同(tong)條款的風險點(dian)給出相關(guan)建議,提示風險。
通用法(fa)(fa)律咨詢:提供具(ju)有(you)專業法(fa)(fa)律依據的法(fa)(fa)律咨詢服務(wu)。
未來(lai),冪(mi)律(lv)智(zhi)能(neng)將持續專注法(fa)律(lv)垂直大模型(xing)的技(ji)術提升(sheng)和落地應用,將法(fa)律(lv)大模型(xing)能(neng)力深度融入(ru)智(zhi)能(neng)合同管理產品(pin)MeFlow及智(zhi)能(neng)合同審查產品(pin)MeCheck中。同時,冪(mi)律(lv)將面向企(qi)業客(ke)戶(hu)開放能(neng)力接(jie)口,企(qi)業可以將法(fa)律(lv)大模型(xing)能(neng)力快(kuai)速(su)接(jie)入(ru)現有業務流與系統中,帶來(lai)顯著效率提升(sheng)。
冪律(lv)也會不斷更新和改進(jin)(jin)模型,面向(xiang)不斷變化(hua)的(de)法律(lv)知識和應(ying)用(yong)進(jin)(jin)行針(zhen)對性的(de)效果優化(hua),進(jin)(jin)一(yi)步(bu)提升(sheng)PowerLawGLM大模型的(de)進(jin)(jin)化(hua)能力。