天才數學家陶哲軒(xuan)搞數學研(yan)究,已經離不開普通人手里(li)的(de)“數學菜(cai)雞”GPT 了!
就(jiu)在他最新解(jie)決(jue)的(de)一個(ge)數學難題下面,陶哲軒明(ming)確指出自(zi)己(ji)“使用了(le) GPT-4”,后者給(gei)他提出了(le)一種(zhong)可行的(de)解(jie)決(jue)方法(fa)。
借助 GPT-4,他不僅(jin)成功(gong)地突(tu)破了這一難題,還將答案分享在了 MathOverflow 上:
它給(gei)我提供了最(zui)終的解題思路(lu),接下來我只需(xu)要繼(ji)續計算就行。
為了給更(geng)多數學家分享用 GPT-4 工作(zuo)的便利性(xing),陶哲軒還將自己的聊天記錄(lu) po 了出來,里(li)面完(wan)整地記載了他和 GPT-4 的對話。
可以看見,在這(zhe)份聊天(tian)記錄中,他把 GPT-4 稱呼(hu)為“專業數學合作(zuo)者”,而不僅僅是一個普通的數學助(zhu)手。
這個身份屬實不一般了(le),不知(zhi)道(dao)之后陶哲(zhe)軒(xuan)寫論(lun)文的(de)時(shi)候(hou)會不會把 GPT-4 列為共同作者(手動狗頭)。
不僅如此,戳(chuo)對話(hua)記錄底部(bu)的“continue this conversation”按鈕,還能一鍵把對話(hua)記錄導入自己(ji)的 ChatGPT 中,突然闖入人類大師和 AI 的交談。
陶哲軒解決了什么新問題?
陶哲軒研(yan)究(jiu)的問題,是(shi)一(yi)個兩天前在(zai)數學網站 MathOverflow 上更(geng)新的提問。
這(zhe)個名叫“優雅(ya)的遞(di)歸之 A301897”問(wen)題,具體長(chang)這(zhe)樣:
其中,A301897 是一個被整數(shu)數(shu)列網(wang)站 OEIS 收錄的數(shu)列:
這個(ge)數列中有(you)一系(xi)列來自長度為 n 的排列 b 的數,它們有(you)一個(ge)共同(tong)點,就是滿足(zu) Diaconis-Graham 不(bu)等(deng)式且(qie)等(deng)號成立。
Diaconis-Graham 不等式由戴康尼斯(si)(Persi Diaconis)和葛(ge)立(li)恒(沒錯,就是“最大(da)數”之父 Ronald Graham)于 1977 年(nian)共同提出(chu),屬(shu)于概(gai)率統計方面(mian)的研究(jiu)。
顯然,這一大段提問中不僅夾雜著大量專業數學公式,而且還涉及需要跳轉的網頁資料。
作(zuo)為數(shu)(shu)(shu)學公(gong)認不(bu)太好的“數(shu)(shu)(shu)學菜雞”,GPT-4 真(zhen)的能像一名(ming)專業(ye)數(shu)(shu)(shu)學家那(nei)樣(yang)快速讀懂公(gong)式、給出解決問題的專業(ye)建議嗎?
事實上,相比直接把問題復制粘貼給 GPT-4,陶哲軒做了三件事:
首先,做一些提示工程,明確 GPT-4 的(de)“身份”和“目標”。其中身份是“一(yi)個擅長給技巧性(xing)建(jian)議的(de)數(shu)學合作專家”,目標是“提(ti)供一(yi)些建(jian)議”而非(fei)解決(jue)問題。
然后,相比直接把大段公式復制進 GPT-4 提問欄(確實可以這樣做),陶哲軒選擇將問題描述轉成 Markdown 格式。
最后,涉及需要 GPT-4 自己查找資料的內容,陶哲軒將它轉變成一個引用注釋,并在結尾給出網址。
完整(zheng)的提問過程長(chang)這樣:
也就是(shi)說,相比讓 GPT-4 直接化身數學家去“解決問題”,陶哲(zhe)軒只(zhi)是(shi)把它當成(cheng)一(yi)(yi)個提供靈(ling)感來源的“專家”,給自己建議一(yi)(yi)些(xie)研究的方向。
GPT-4 很快給出(chu)了 8 個具(ju)體的建議(yi):
1、理(li)解問(wen)題:在深入證明之前,確保(bao)你理(li)解了(le)問(wen)題中的(de)每(mei)一項。如果你不熟(shu)悉 Diaconis-Graham 不等式,研究(jiu)一下它,了(le)解表達式 a (n) 和 R (n, q) 中的(de)每(mei)一項代表什么(me)。
2、簡(jian)化(hua)表達(da):有時候(hou),復(fu)雜的(de)表達(da)可以被簡(jian)化(hua)。例如,你可能(neng)想(xiang)看(kan)(kan)看(kan)(kan)表達(da)式(shi)中 a (n) 的(de)二項(xiang)式(shi)系數是否(fou)可以簡(jian)化(hua),或者是否(fou)可以用更簡(jian)單的(de)方式(shi)計算總和。
3、歸納(na)法:由(you)于 R (n, q) 是(shi)遞歸定義的(de),因(yin)此證(zheng)明猜想的(de)一種自(zi)然方(fang)法是(shi)使用數(shu)學歸納(na)法。你可(ke)能想要證(zheng)明,如果這個猜想對 n 成立(li)(li),那么它對 n+1 也成立(li)(li)。
4、生成(cheng)函數(shu)(shu)(shu):另(ling)一種方法是(shi)使用生成(cheng)函數(shu)(shu)(shu)。嘗試(shi)找(zhao)到 a (n) 和 R (n, 0) 的(de)生成(cheng)函數(shu)(shu)(shu),然(ran)后證明它們是(shi)相等的(de)。這有時(shi)可以(yi)把一個復雜的(de)組合問題變成(cheng)一個更簡單的(de)代數(shu)(shu)(shu)問題。
5、漸(jian)近(jin)分(fen)(fen)析:正如(ru)你提到的(de)(de)(de),分(fen)(fen)析 a (n) 和 R (n, 0) 的(de)(de)(de)漸(jian)近(jin)行(xing)為可(ke)能會對它們的(de)(de)(de)關系有一些深入的(de)(de)(de)了解。這有時可(ke)以(yi)用斯特(te)林的(de)(de)(de)階乘近(jin)似來實現,或(huo)者通(tong)過分(fen)(fen)析表達式中的(de)(de)(de)主(zhu)導項來實現。
6、數值(zhi)證(zheng)據:雖然不是證(zheng)明,但(dan)收集數值(zhi)證(zheng)據有(you)時可(ke)(ke)以(yi)讓我們了解如何(he)證(zheng)明一個猜(cai)想(xiang)。因為你有(you) PARI / GP 代碼,可(ke)(ke)以(yi)用數值(zhi)來檢查猜(cai)想(xiang),你可(ke)(ke)能(neng)想(xiang)讀一讀每個序列的前幾項,看(kan)看(kan)是否能(neng)發現任何(he)模式。
7、尋(xun)找類似問(wen)(wen)題(ti):有時,一個問(wen)(wen)題(ti)或(huo)猜想是(shi)一個已知問(wen)(wen)題(ti)的(de)泛(fan)化或(huo)變體(ti)。在組合文(wen)獻中尋(xun)找類似的(de)問(wen)(wen)題(ti)或(huo)定(ding)理,看看它們的(de)證明是(shi)否可(ke)以適(shi)用于這個問(wen)(wen)題(ti)。
8、尋求反(fan)(fan)饋和合作(zuo):不要(yao)猶豫,從同事那里(li)尋求反(fan)(fan)饋,或者(zhe)在(zai) MathOverflow 這樣(yang)的論壇(tan)上發布你的部(bu)分(fen)結果。協(xie)作(zuo)和同行(xing)評(ping)議通常是解決復雜數(shu)學問題的關鍵(jian)。
最終,陶哲(zhe)軒使用(yong)建議 4,也(ye)就是(shi)生成函數的(de)方法,成功(gong)解(jie)決了(le)問題。
當然,解(jie)決問題的過程并(bing)不需要用(yong)到 GPT-4,采(cai)用(yong) MAPLE 工(gong)作表 + 紙筆(bi)手動(dong)計算就能完成(cheng)。陶哲軒(xuan)也嘗試(shi)了漸(jian)進分析(建議 5)的方法,不過事實證明還是用(yong)生成(cheng)函數更有(you)效。
簡單來(lai)說(shuo),陶哲軒只是(shi)用(yong) GPT-4 給自己提供不同(tong)的解題思路(lu),也就(jiu)是(shi)“解題靈感”,但具(ju)體(ti)怎么解答,也就(jiu)是(shi)更(geng)加(jia)數學(xue)的方法,他則不會交(jiao)給 GPT-4 來(lai)完成。
至于“查資料”這種 GPT-4 的應用(yong),陶哲軒(xuan)也發揮(hui)到了極致。
例如在(zai)思考問(wen)題時,他(ta)還會把(ba)自己的“靈光乍現(xian)”拿(na)出(chu)來(lai)和 GPT-4 討論一下,例如他(ta)覺得(de)這個問(wen)題和卡特蘭數(Catalan numbers)有相似之處(chu),希望 GPT-4 幫他(ta)查找一下對應的資(zi)料。
GPT-4 很快給(gei)出了(le)對應的回答,這(zhe)也促使(shi)陶哲軒對另一(yi)個問題產生(sheng)了(le)新的靈(ling)感(gan)。
簡單來說,陶哲軒(xuan)在(zai)短(duan)短(duan)兩段與 GPT-4 的(de)對(dui)話中,展(zhan)示了數學家(jia)使用 GPT-4 的(de)正確(que)姿勢 —— 找靈感和(he)查資料。
這樣一來,即(ji)使“數學菜雞”如(ru) GPT-4,也能成為(wei)數學家的 AI 助(zhu)理了。
大佬是怎么玩兒 GPT 的
分享人類大(da)師和 AI 的聊天(tian)記錄之余(yu),陶哲軒的乳齒象博文里(li)還(huan)附帶著一(yi)份貼心指(zhi)南,是他使用 ChatGPT 和 GPT-4 的經驗之談。
根據他過(guo)去(qu)的(de)實操經驗,最要緊的(de)第(di)一點:
不要試圖讓 AI 直接回答問題,因為這幾乎肯定會得到一些看起來專業的廢話。
為了避(bi)免 GPT 成為廢話文(wen)學大(da)王,行之有效的方案(an)如下(xia):
讓 AI 扮演合作者的角色,而后讓它提供策略建議。
Like this:
除此之(zhi)外,“數學菜(cai)雞”GPT,在大數學家手里能有什(shen)么(me)用處(chu)?
陶哲(zhe)軒大(da)概的(de)意思(si)是醬嬸兒的(de):
ChatGPT 數學(xue)能力雖然不(bu)咋滴(di),但對做學(xue)術研究的人來說是(shi)個發散思維的好工具(ju)。
(對普通人(ren)來(lai)說有點不太專(zhuan)業,但(dan)對搞數學的(de)學術(shu)人(ren)員來(lai)說剛(gang)剛(gang)好)
怎么解(jie)釋用來“發散(san)思維”這(zhe)句(ju)話呢?
陶哲軒表達出來的觀點是,既然 ChatGPT 在具體數學問題上給出的答案是不(bu)完全正確的,那不如索性發揮發揮它生成答案部分(fen)正確的特性。
簡而(er)言之,就是讓它幫你找靈感(gan) balabalabla:
在處理數(shu)學問題時(shi),可以讓 ChatGPT 這類大語(yu)言模型做一些半(ban)成品的語(yu)義搜索工作。
也就是(shi)說,ChatGPT 不用提(ti)供確切的(de)答案,只用生成一(yi)些可(ke)能的(de)提(ti)示(shi)。
這樣一來,依據(ju) GPT 生成的提示 + 傳統(tong)搜(sou)(sou)索引擎搜(sou)(sou)索,就能很(hen)輕松 get 答案(an)。
而且他還自曝,在 GPT-4 發布之前,他本人就(jiu)從微軟那里獲得(de)了訪問資(zi)格。
也就是和微軟 154 頁《AGI 的火花》論文里同款,未經過安全訓練但能力更強的滿血版。
從陶(tao)哲軒的(de)反饋中可以看(kan)到,GPT-4 非常擅(shan)長在和人類對話(hua)時進行一(yi)些 cosplay,比如充當富(fu)有同情心的(de)傾聽者(zhe)、熱情洋(yang)溢的(de)反饋者(zhe)、富(fu)有創造力(li)的(de)靈感(gan)來源、翻(fan)譯者(zhe)或教師,或者(zhe)是魔(mo)鬼(gui)的(de)代言人。
與此同時,對于 AI 在數(shu)學(xue)研究(jiu)中的(de)表現,陶哲軒(xuan)給出(chu)的(de)大膽卻又(you)嚴謹(jin)的(de)預言:
當與形(xing)式證明驗證器、互(hu)聯(lian)網搜索和(he)數學符號包等工具(ju)整合時,2026 年的 AI,如(ru)果使用得當,將成為數學研究中值(zhi)得信賴的共同作者,而且(qie)在許多其他領域(yu)也是如(ru)此。
除(chu)了數學研究,GPT-4 已經是(shi)陶(tao)哲軒(xuan)生活中的全方位小助手了。
他經常使用 GPT-4 回答(da)一(yi)些(xie)隨意、措辭(ci)含(han)糊的問(wen)(wen)題(ti),這(zhe)些(xie)問(wen)(wen)題(ti)以前需要在(zai)搜索引擎里精心調(diao)整關鍵(jian)詞才行。
還有位同事,因為親戚(qi)拿到重癥診斷而(er)郁郁寡歡。為此,陶哲軒讓大手一揮(hui),讓 GPT-4 洋洋灑灑寫了封慰問信。
結(jie)果呢?同事(shi)眼(yan)含熱淚,被感動哭(ku)了。
最后說(shuo)回(hui)陶(tao)哲軒用 GPT-4 解決數(shu)學難題這事兒上來。
在(zai) MathOverflow 下,有的網友覺(jue)得他不應該用 GPT 來回答數學問題,感覺(jue)是個很敏感的話題。
但還(huan)是(shi)有人表示了資(zi)瓷,表示覺得真的是(shi)泰(tai)庫辣~
陶哲軒倒(dao)是毫不(bu)避(bi)諱地站出來表明(ming)了自己的(de)立場,他倒(dao)不(bu)覺得有(you)啥不(bu)好:
現在的擔(dan)憂(you),跟(gen)維基百科流行初期時大家討論的重點(dian)也沒啥區別……
現(xian)在在維基百科(ke)上 get 初始(shi)線(xian)索,并且在引為論點時(shi)附(fu)上鏈接,展現(xian)它是我論據的(de)一(yi)部分,都是大伙兒習(xi)以為常(chang)的(de)事(shi)情。