幂律智能联合智谱AI发布千亿参数级法律垂直大模型PowerLawGLM

国产人妻精品区一区二区,国产农村妇女毛片精品久久,JAPANESE日本丰满少妇,日本公妇理伦a片,射精专区一区二区朝鲜

冪律智能聯合智譜AI發布千億參數級法律垂直大模型PowerLawGLM

作者 | 甲子光年2023-07-03

甲子光年

2023年是當(dang)之無愧的(de)“大模型(xing)之年”，據瑞(rui)銀集團的(de)一份報告顯示，ChatGPT推出僅(jin)僅(jin)兩(liang)個月后，月活用戶已經突(tu)破了(le)1億，成(cheng)為史上用戶增長速度(du)最快的(de)消(xiao)費級應用程序。

在炙熱(re)的大(da)(da)模(mo)型賽道里，基(ji)于(yu)(yu)中(zhong)文(wen)大(da)(da)模(mo)型的發布也是層出不(bu)窮，相較(jiao)于(yu)(yu)通用大(da)(da)模(mo)型的“大(da)(da)而全”，冪律(lv)(lv)聯合智(zhi)譜(pu)AI此(ci)次(ci)聯合發布基(ji)于(yu)(yu)中(zhong)文(wen)千億大(da)(da)模(mo)型的法(fa)律(lv)(lv)垂直大(da)(da)模(mo)型——PowerLawGLM，聚(ju)焦于(yu)(yu)法(fa)律(lv)(lv)細分(fen)領域，針對中(zhong)文(wen)法(fa)律(lv)(lv)場景的應(ying)用效果具有獨(du)特優勢(shi)，具備豐富的法(fa)律(lv)(lv)知識和法(fa)律(lv)(lv)語(yu)言理解能力。

一、“法律垂直大模型”的誕生

通用大模型是具有強大語言理解能力和生成能力的人工智能模(mo)(mo)型，但由于專業知識及(ji)數據(ju)的欠缺，將通(tong)(tong)用(yong)(yong)大模(mo)(mo)型直(zhi)接應用(yong)(yong)在法(fa)律領(ling)域，往往存在著嚴(yan)重的效果問題，例如法(fa)律知識錯誤、專業引用(yong)(yong)偏差、法(fa)律體系差異等問題。比如前段時間(jian)美國律師(shi)使用(yong)(yong)ChatGPT來提交法(fa)庭(ting)簡(jian)報，結果引用(yong)(yong)的6個(ge)案例都是ChatGPT編(bian)造的虛假案例，這種“人工智能幻覺”現象(xiang)在法(fa)律場景(jing)屢見不鮮(xian)，也說明了目前通(tong)(tong)用(yong)(yong)大模(mo)(mo)型難以保(bao)證法(fa)律專業層面(mian)的真(zhen)實性、正確性。

冪律(lv)智能自2017年成立以來即深耕于法(fa)律(lv)+AI領(ling)(ling)域，基(ji)于領(ling)(ling)先的(de)法(fa)律(lv)AI能力，向(xiang)企業提供智能合(he)(he)同產品(pin)，并(bing)且深度(du)參與了清華大學自然(ran)語言處(chu)理實驗(yan)室的(de)OpenCLaP、LawFormer等法(fa)律(lv)大模(mo)(mo)型的(de)研發及(ji)應(ying)用(yong)。而(er)智譜(pu)AI作為領(ling)(ling)先的(de)通用(yong)大模(mo)(mo)型廠商(shang)，法(fa)律(lv)領(ling)(ling)域是其大模(mo)(mo)型迭代及(ji)布局的(de)重(zhong)要方向(xiang)，基(ji)于雙方達成的(de)戰略(lve)合(he)(he)作，在(zai)法(fa)律(lv)大模(mo)(mo)型上展開(kai)深度(du)合(he)(he)作，來加快推(tui)動大模(mo)(mo)型在(zai)法(fa)律(lv)行業應(ying)用(yong)落(luo)地(di)及(ji)商(shang)業化。

自2023年(nian)初雙方(fang)成立(li)聯合項(xiang)目組，啟(qi)動法(fa)律大(da)模(mo)型(xing)研發(fa)以來，經過千(qian)(qian)億規模(mo)的(de)基座模(mo)型(xing)增量訓練、對話層監(jian)督(du)微調(diao)、應用層工程(cheng)優化，推出了基于中文(wen)千(qian)(qian)億大(da)模(mo)型(xing)的(de)法(fa)律垂(chui)直大(da)模(mo)型(xing)——PowerLawGLM。

二、“PowerLawGLM”的打造

PowerLawGLM法律大(da)(da)模型(xing)，基(ji)(ji)于智(zhi)譜目前效果(guo)最好的(de)ChatGLM 130B通用千億(yi)對話大(da)(da)模型(xing)進(jin)行聯合研發。在2022年11月斯坦福大(da)(da)學(xue)基(ji)(ji)礎模型(xing)中心對全球 30 個大(da)(da)模型(xing)的(de)評測結果(guo)中，GLM-130B 是亞洲唯(wei)一入選的(de)Top10大(da)(da)模型(xing)。

訓練法律垂(chui)直大模型第一步——基座層：閱讀大量法律文(wen)本。

通(tong)用大(da)模(mo)型(xing)在(zai)法律(lv)場景的應(ying)用效(xiao)果問題，最基(ji)(ji)礎的原因(yin)在(zai)于基(ji)(ji)座大(da)模(mo)型(xing)沒有經過大(da)量(liang)高質(zhi)量(liang)專業法律(lv)文本(ben)數據的訓練(lian)。雙方基(ji)(ji)于ChatGLM130B的基(ji)(ji)座大(da)模(mo)型(xing)GLM 130B，經過了多輪多次高質(zhi)量(liang)法律(lv)文本(ben)數據(裁判文書、法律(lv)法規、法律(lv)知識問答(da)等)清洗及(ji)模(mo)型(xing)增量(liang)訓練(lian)，得到法律(lv)版基(ji)(ji)座大(da)模(mo)型(xing)LawGLM 130B。

訓練(lian)法(fa)律垂直大模型第二(er)步(bu)——對話(hua)層：與法(fa)律對話(hua)場(chang)景(jing)對齊，具備法(fa)律場(chang)景(jing)的對話(hua)能力。

LawGLM 130B基座(zuo)模型(xing)具(ju)備了(le)文本生(sheng)成能力，但(dan)在(zai)法律(lv)對話(hua)能力上存在(zai)欠缺，因此需要利用大量的(de)法律(lv)領(ling)域對話(hua)數據進行監(jian)督微(wei)調(diao)。雙方利用了(le)近百萬對高質量法律(lv)知識(shi)問題數據，來訓(xun)練得到PowerLawGLM beta版，此時，它已經初步(bu)具(ju)備了(le)法律(lv)場景的(de)端到端生(sheng)成式對話(hua)能力以及獨特(te)的(de)回答習慣。

訓練法律垂直(zhi)大模型第三步——應用(yong)層(ceng)：保證輸出結(jie)果質量和(he)可靠性。

法(fa)律(lv)(lv)(lv)問(wen)(wen)答(da)的很(hen)多(duo)場景都有其特殊(shu)性，對于(yu)結果準確性的要求(qiu)、可解釋性的要求(qiu)較(jiao)高，直接(jie)大模型(xing)來(lai)端到(dao)端生成回(hui)答(da)，會面臨(lin)很(hen)多(duo)效果問(wen)(wen)題，例如(ru)引用(yong)(yong)失效法(fa)律(lv)(lv)(lv)、杜撰法(fa)條(tiao)案(an)例、與法(fa)律(lv)(lv)(lv)人(ren)處(chu)理邏輯(ji)不(bu)一致等等。因此冪律(lv)(lv)(lv)設計了(le)一系列通(tong)用(yong)(yong)型(xing)及(ji)場景特定型(xing)的工程化(hua)優化(hua)方案(an)，來(lai)提升法(fa)律(lv)(lv)(lv)問(wen)(wen)答(da)的有法(fa)可依和引用(yong)(yong)法(fa)條(tiao)內(nei)容的準確性，最終提升法(fa)律(lv)(lv)(lv)問(wen)(wen)答(da)的專業性和可靠性。

通過以上(shang)三層結(jie)構，在(zai)基座層、對(dui)話(hua)層、應用(yong)層上(shang)提(ti)升了大模型對(dui)法律專業文本的理解(jie)、推(tui)理與生成能力：

理(li)解能力：理(li)解復(fu)雜的法(fa)律文(wen)本(ben)，包括各種法(fa)律條款、判例、合(he)同和其(qi)他法(fa)律文(wen)件(jian)。
推理能(neng)力：從法律文本中(zhong)推斷出潛在的問題，提供可(ke)能(neng)的解決(jue)方案，或者預測出可(ke)能(neng)的法律后(hou)果(guo)。
生成能(neng)力：回答法(fa)律(lv)問題，為用戶(hu)提(ti)供咨詢(xun)，甚至(zhi)幫助起草法(fa)律(lv)文件。它還可以進行(xing)法(fa)律(lv)對話，幫助用戶(hu)理解復雜(za)的法(fa)律(lv)問題。

三、“PowerLawGLM”的實際能力

為了(le)(le)測(ce)試PowerLawGLM與通用大模型(xing)之間的(de)(de)(de)效(xiao)果(guo)對(dui)比，冪(mi)律(lv)的(de)(de)(de)法(fa)律(lv)團隊收集(ji)了(le)(le)互(hu)聯網上法(fa)律(lv)相關(guan)的(de)(de)(de)Top100高頻問(wen)題(ti)(ti)(ti)，進行(xing)了(le)(le)不(bu)同模型(xing)的(de)(de)(de)效(xiao)果(guo)人工評測(ce)，并且從法(fa)律(lv)專(zhuan)業(ye)人員的(de)(de)(de)角度，與ChatGPT等(deng)典型(xing)的(de)(de)(de)通用大模型(xing)進行(xing)的(de)(de)(de)效(xiao)果(guo)對(dui)比。評測(ce)的(de)(de)(de)維度包括：對(dui)問(wen)題(ti)(ti)(ti)點的(de)(de)(de)把(ba)握(wo)是(shi)否準(zhun)確(que)、對(dui)問(wen)題(ti)(ti)(ti)所含信息的(de)(de)(de)分析是(shi)否全(quan)面準(zhun)確(que)、答(da)案的(de)(de)(de)操作可行(xing)性(xing)強弱、答(da)案的(de)(de)(de)法(fa)律(lv)專(zhuan)業(ye)性(xing)程度、法(fa)律(lv)依據有無(wu)，以及準(zhun)確(que)性(xing)全(quan)面性(xing)程度。最(zui)(zui)終的(de)(de)(de)評測(ce)結果(guo)顯示，100個(ge)問(wen)題(ti)(ti)(ti)的(de)(de)(de)最(zui)(zui)優答(da)案中(zhong)，PowerLawGLM接近(jin)70%是(shi)最(zui)(zui)優答(da)案，并且在操作可行(xing)性(xing)、法(fa)律(lv)專(zhuan)業(ye)性(xing)等(deng)方(fang)面差異顯著。

如圖所示，以下是(shi)部分ChatGPT和PowerLawGLM的回答：

1.針對(dui)某一(yi)法律問題的咨詢：

ChatGPT對于彩禮問題的回答

PowerLawGLM對同一問(wen)題給(gei)出的回答

在此法(fa)律問題上(shang)，ChatGPT沒(mei)有對(dui)(dui)能否請求對(dui)(dui)方返還(huan)彩(cai)(cai)禮(li)進行(xing)(xing)(xing)(xing)正面解答(da)，也沒(mei)有對(dui)(dui)彩(cai)(cai)禮(li)問題從(cong)法(fa)律角度進行(xing)(xing)(xing)(xing)分析(xi)并給(gei)(gei)出相關法(fa)律依據(ju);而PowerLawGLM則對(dui)(dui)此問題進行(xing)(xing)(xing)(xing)了(le)明確回答(da)，對(dui)(dui)題目進行(xing)(xing)(xing)(xing)分析(xi)并給(gei)(gei)出了(le)相關法(fa)律依據(ju)。

2.關于買賣(mai)合同(tong)的(de)起(qi)草：

ChatGPT對于合同起草的回答

PowerLawGLM關于合同起草的回答

如圖所示，ChatGPT起草(cao)的合(he)同(tong)較(jiao)為簡略，整體合(he)同(tong)格(ge)式及(ji)條款表述與一份真實可用的合(he)同(tong)差(cha)距較(jiao)大，經常出現(xian)引用失效(xiao)法(fa)(fa)律、條款缺失、信息(xi)(xi)不(bu)完(wan)備等(deng)問(wen)題(ti);而PowerLawGLM將用戶提問(wen)中(zhong)(zhong)的主體、標的物、單價、訴訟法(fa)(fa)院等(deng)信息(xi)(xi)準(zhun)確無誤的體現(xian)在合(he)同(tong)正文中(zhong)(zhong)，并且合(he)同(tong)條款的完(wan)整性、專業性差(cha)異顯著(zhu)。

四、基于PowerLawGLM大模型的對話產品ChatMe正式上線

基(ji)于PowerLawGLM大(da)模型的能力，冪律(lv)打(da)造(zao)了(le)法律(lv)對話(hua)產(chan)品ChatMe，現已正式上(shang)線，首(shou)批開放50個內測名(ming)額，掃(sao)碼文末(mo)二(er)維碼即可直接預約報名(ming)體驗。

ChatMe的功(gong)能和(he)特點：

合(he)同咨(zi)詢：ChatMe擁有(you)豐富的合(he)同知(zhi)識數(shu)據，能夠回答(da)諸如“合(he)同租期(qi)期(qi)限”等合(he)同知(zhi)識問題。
合(he)同(tong)起(qi)(qi)(qi)草(cao)：貼近中(zhong)文(wen)合(he)同(tong)起(qi)(qi)(qi)草(cao)場景，模(mo)版起(qi)(qi)(qi)草(cao)、條(tiao)款組(zu)合(he)起(qi)(qi)(qi)草(cao)、端對(dui)端生成起(qi)(qi)(qi)草(cao)等多種解決(jue)方案，讓(rang)生成的合(he)同(tong)質量更高。
合同(tong)(tong)信息抽取(qu)：能夠識別(bie)合同(tong)(tong)中的關鍵信息進行提取(qu)，如主體(ti)信息，合同(tong)(tong)總金額等等。
合同審(shen)查：能夠針對合同條款的風(feng)險(xian)(xian)點給出相關建議，提示風(feng)險(xian)(xian)。
通用法(fa)律咨(zi)詢(xun)：提(ti)供具有專業法(fa)律依據的法(fa)律咨(zi)詢(xun)服務。

未來，冪律智(zhi)能(neng)(neng)將持續專(zhuan)注法(fa)律垂直大(da)(da)模型(xing)(xing)的(de)技術提(ti)升和落地應用，將法(fa)律大(da)(da)模型(xing)(xing)能(neng)(neng)力(li)深(shen)度融入智(zhi)能(neng)(neng)合(he)同(tong)管理產品MeFlow及智(zhi)能(neng)(neng)合(he)同(tong)審查(cha)產品MeCheck中。同(tong)時(shi)，冪律將面向企業客戶(hu)開放能(neng)(neng)力(li)接口，企業可以將法(fa)律大(da)(da)模型(xing)(xing)能(neng)(neng)力(li)快速(su)接入現有業務流與系統中，帶來顯著效率(lv)提(ti)升。

冪律(lv)也會不(bu)斷(duan)(duan)更新和改(gai)進模型(xing)，面向不(bu)斷(duan)(duan)變(bian)化(hua)(hua)的法律(lv)知識和應用進行針(zhen)對性(xing)的效(xiao)果優(you)化(hua)(hua)，進一步提升(sheng)PowerLawGLM大模型(xing)的進化(hua)(hua)能力(li)。

冪律智能

智譜AI

法律垂直大模型