5 月 24 日,阿里達摩院發(fa)布了一個關(guan)于用 GPT-4 取代數據分析師的(de)成(cheng)本核算的(de)研(yan)究論文。
該論文指出:“除了所有數(shu)據(ju)分(fen)(fen)析(xi)師和 GPT-4 之間(jian)(jian)(jian)的(de)(de)(de)(de)可比(bi)績效(xiao)外(wai),我們(men)可以注意到 GPT-4 所花(hua)費的(de)(de)(de)(de)時(shi)(shi)間(jian)(jian)(jian)要比(bi)人類數(shu)據(ju)分(fen)(fen)析(xi)師短得多。我們(men)假設每個(ge)(ge)月(yue)有大約 21 個(ge)(ge)工(gong)(gong)作(zuo)日(ri),每天工(gong)(gong)作(zuo) 8 小時(shi)(shi)左(zuo)右,并根據(ju)每個(ge)(ge)級別的(de)(de)(de)(de)數(shu)據(ju)分(fen)(fen)析(xi)師所花(hua)費的(de)(de)(de)(de)平均時(shi)(shi)間(jian)(jian)(jian)計(ji)算出每個(ge)(ge)實(shi)例在(zai)美元方面的(de)(de)(de)(de)成本(ben)。GPT4 的(de)(de)(de)(de)成本(ben)約為初級數(shu)據(ju)分(fen)(fen)析(xi)員(yuan)成本(ben)的(de)(de)(de)(de) 0.71%和高(gao)級數(shu)據(ju)分(fen)(fen)析(xi)員(yuan)成本(ben)的(de)(de)(de)(de) 0.45%。”
這篇來(lai)自阿(a)里(li)達摩院與新加坡南洋理工(gong)大(da)學的(de)新論(lun)文(wen),主要(yao)探(tan)討了(le) GPT-4 能(neng)否(fou)做好數據(ju)分析(xi)師(shi)的(de)工(gong)作(zuo),論(lun)文(wen)標(biao)題為“Is GPT-4 a Good Data Analyst?”
該論文重點考察(cha)了 GPT-4 作(zuo)為數據分析師的(de)以下幾種能力:
生(sheng)成(cheng) SQL 和 Python 代碼;
執行(xing)代(dai)碼(ma)獲(huo)得數據和圖表;
從數據(ju)和外部知識源中分(fen)析數據(ju),得出(chu)結(jie)論。
在(zai) 5.3 節“主要結果”中,該(gai)論(lun)文指(zhi)出,GPT-4 的表(biao)(biao)現(xian),在(zai)大多(duo)數(shu)指(zhi)標上能(neng)與(yu)一位金融行業工作 6 年的人(ren)類(lei)相當(dang),正確(que)(que)性低于(yu)人(ren)類(lei),但復(fu)雜性和一致(zhi)性指(zhi)標高(gao)于(yu)人(ren)類(lei)。在(zai)與(yu)另一位 5 年工作經驗的分析師對比中,GPT-4 在(zai)信息的正確(que)(que)性、圖表(biao)(biao)的美觀(guan)性、洞察的復(fu)雜性等方面輸給人(ren)類(lei)。如果與(yu) 2 年工作經驗的初級分析師對比,GPT-4 在(zai)正確(que)(que)性上表(biao)(biao)現(xian)更好,而且能(neng)完成更多(duo)的工作。
雖(sui)然(ran)在(zai)高級數據分(fen)析任務(wu)中,GPT-4 目前的準確性低于人類,但是(shi)勝(sheng)在(zai)成本便宜。
也(ye)就是說,根(gen)據(ju)實驗結(jie)果和分(fen)析(xi),GPT-4 在數據(ju)分(fen)析(xi)上有(you)與人類相當的性能,但是否(fou)可以取(qu)代數據(ju)分(fen)析(xi)師需要近(jin)一(yi)步研究才能得出(chu)結(jie)論(lun)。
論文地(di)址:
//arxiv.org/abs/2305.15038
本(ben)文轉(zhuan)載來源:
//www.infoq.cn/article/PbYjsR5iYRuEESxs6o7N