【AI小雜談】語言模型與推理
最近出來了一個(gè)MathGPT,據(jù)說數(shù)學(xué)能力非常強(qiáng),并且已經(jīng)開始測(cè)試了。我個(gè)人使用的體驗(yàn)還可以,畢竟這個(gè)東西主要是為了中小學(xué)數(shù)學(xué)題服務(wù)的,難度不至于特別高。
然而,自從大語言模型(LLM)出現(xiàn)以來,推理和數(shù)學(xué)能力就一直是關(guān)注的焦點(diǎn),畢竟這里面涉及到的東西就多了,例如如何理解當(dāng)前的問題、在數(shù)學(xué)問題中如何避免幻覺、推理過程中對(duì)之前信息的記憶能力等等都會(huì)被考察到。不過,很遺憾的是,對(duì)于目前的LLM來說,數(shù)學(xué)和推理依然是弱項(xiàng)。
(資料圖)
我們首先從最基本的一些知識(shí)來分析,這也是之前一個(gè)朋友在某個(gè)動(dòng)態(tài)的評(píng)論中和我討論了好幾輪的一個(gè)話題。
以ChatGPT為代表,現(xiàn)在大部分語言模型都是基于Transformer架構(gòu)的,并且訓(xùn)練方式簡(jiǎn)單來說就是“預(yù)測(cè)下一個(gè)token”,token一般翻譯成“詞元”、“子詞”等,例如apple可能被拆分為“app”和“l(fā)e”,這倆都是token。當(dāng)然,如果你覺得理解起來有些難度,那么就簡(jiǎn)單理解成“預(yù)測(cè)下一個(gè)詞”就好,兩者只是粒度上的差別,所以后面以中文為例的話,我就當(dāng)做“預(yù)測(cè)下一個(gè)漢字”來舉例了。
舉個(gè)例子,假設(shè)我問ChatGPT“在中國(guó)一般旺財(cái)指代哪種動(dòng)物?”,ChatGPT會(huì)把這段話作為輸入,首先預(yù)測(cè)并生成下一個(gè)字“旺”,然后把“在中國(guó)一般旺財(cái)指代哪種動(dòng)物?旺”作為輸入預(yù)測(cè)并生成“財(cái)”,就這樣一步步地生成整個(gè)回答“旺財(cái)在中國(guó)一般指代狗”。在使用的時(shí)候是這樣,訓(xùn)練的時(shí)候也是這樣,也就是說,在ChatGPT“預(yù)”訓(xùn)練期間它所做的就是使得預(yù)測(cè)下一個(gè)詞的精度盡可能高。
所以從根本上來說,ChatGPT并不會(huì)像我們學(xué)習(xí)一樣,一開始掌握概念、掌握方法,然后一步步分析問題,他所做的只是根據(jù)當(dāng)前的輸入預(yù)測(cè)出下一個(gè)詞罷了。
那么問題來了,為什么ChatGPT能夠有很驚艷的表現(xiàn),而且看起來至少能做很多低難度的數(shù)學(xué)題呢?
關(guān)鍵就在于巨量的訓(xùn)練語料,因?yàn)椤?+1=2”這樣的東西在訓(xùn)練語料中反復(fù)出現(xiàn),ChatGPT從中學(xué)到了“1+1=”后出現(xiàn)“2”的幾率更高,或者說,仍然是基于統(tǒng)計(jì)的。
當(dāng)然,大模型還有很多神秘的地方,例如很多研究都表明語言模型不是只會(huì)停留在簡(jiǎn)單的統(tǒng)計(jì)和記憶階段,他們也會(huì)在內(nèi)部模擬一些很抽象的東西,一個(gè)例子就是代碼追蹤。
這里舉個(gè)簡(jiǎn)單的例子:“a=10;b=20;c=a+b;d=c/2”這段話中并沒有顯示給出c的值,但是我們是可以發(fā)現(xiàn)ChatGPT在內(nèi)部一些地方模擬出c的值的(這是MIT的一篇研究論文,實(shí)際上比這個(gè)復(fù)雜,這里為方便理解做了簡(jiǎn)化),這說明大模型是超越了簡(jiǎn)單的統(tǒng)計(jì)的,當(dāng)然究竟超過了多少仍然是一個(gè)有待研究并且要研究很久的的問題。
當(dāng)然,雖然“大模型學(xué)到了一些抽象的東西”基本上可以算的上是共識(shí)了,但這并不意味著當(dāng)前的大模型就會(huì)推理了,有篇文章的標(biāo)題就很直白《GPT-4 can't reason》,說明大模型在解決一些推理問題(大部分都是數(shù)學(xué)題)時(shí)會(huì)犯很多人類完全不會(huì)犯的奇怪的錯(cuò)誤,所以即使很多時(shí)候我們可能覺得ChatGPT能解決一些復(fù)雜問題,也不意味著它真的在做推理。
當(dāng)然,這事情還可以繼續(xù)“滑坡”,甚至直接滑到哥德爾不完備性定理這堵嘆息之墻那里,當(dāng)然這里就不展開談了。
從我的觀察來看,目前很多人看待AI都陷入了兩個(gè)極端,要么直接批判AI什么都做不到,要么把AI目前亮眼的表現(xiàn)捧得很高。
不過很多時(shí)候也只是視角的問題,有些人預(yù)設(shè)了“AI能解決一切問題”,然后發(fā)現(xiàn)它從理論上就做不到,然而如果預(yù)設(shè)了“AI什么都做不到”,那“為什么AI有時(shí)候確實(shí)能有亮眼的表現(xiàn)”這個(gè)問題就值得研究了。算了,這個(gè)問題要談起來確實(shí)太復(fù)雜了,雜談就懶得展開了
最后還是需要說,不要無條件相信大模型的輸出,這是“盡信書則不如無書”的最好的試金臺(tái)。
關(guān)鍵詞:
[責(zé)任編輯:xwzkw]
相關(guān)閱讀
- (2023-08-27)【AI小雜談】語言模型與推理
- (2023-08-27)龍龍高鐵福建段首座牽引變電所成功受電
- (2023-08-27)北京優(yōu)化受災(zāi)市政交通基礎(chǔ)設(shè)施恢復(fù)重建項(xiàng)目審批
- (2023-08-27)美美噠!廣東女籃球員卓識(shí)曬海邊游玩照
- (2023-08-27)口碑優(yōu)秀之作!《裝甲核心6》發(fā)布媒體榮譽(yù)宣傳圖
- (2023-08-27)交城龐泉溝鎮(zhèn):皎白木耳溫如玉 “菌中美人”喜豐收
- (2023-08-27)泰和新材:公司可根據(jù)客戶的需求及用途,采用不同的基膜及涂層為客戶進(jìn)行訂制,提供高性價(jià)比的產(chǎn)品和服務(wù)
- (2023-08-27)起猛了!趙麗穎謝娜一起看張杰演唱會(huì),還現(xiàn)場(chǎng)解鎖了新技能蹦迪
- (2023-08-27)亮進(jìn)度|濱州市退役軍人事務(wù)局:深化實(shí)施思想鑄魂、服務(wù)潤(rùn)心、攻堅(jiān)筑基、軍地聚力、對(duì)標(biāo)提升“五大行動(dòng)” 奮力推動(dòng)新時(shí)代濱州市退役軍人工作高質(zhì)量發(fā)展
- (2023-08-27)國(guó)家統(tǒng)計(jì)局:1—7月份全國(guó)規(guī)模以上工業(yè)企業(yè)利潤(rùn)下降15.5%
- (2023-08-27)男籃慘敗42分周琦被點(diǎn)贊:6中6轟12+5狀態(tài)火熱 喬帥看人真準(zhǔn)
- (2023-08-27)盈利能力突出,布局母線持續(xù)優(yōu)化成本
- (2023-08-27)福斯特(603806):需求超預(yù)期增長(zhǎng)帶動(dòng)二季度業(yè)績(jī)環(huán)比提升明顯
- (2023-08-27)中科飛測(cè)(688361):中報(bào)業(yè)績(jī)大幅增長(zhǎng) 新品研發(fā)持續(xù)推進(jìn)
- (2023-08-27)【金融街發(fā)布】2023年1-7月份全國(guó)規(guī)模以上工業(yè)企業(yè)利潤(rùn)下降15.5%
- (2023-08-27)DC粉絲集體消失? 《芭比》恐難再現(xiàn)冠軍地位
- (2023-08-27)企業(yè)庫存過剩、運(yùn)力持續(xù)大增 航運(yùn)業(yè)夏季“遇冷”
- (2023-08-27)石家莊平山周邊涼快自駕游景點(diǎn)推薦
- (2023-08-27)?梅西登場(chǎng)30分鐘,跑動(dòng)2.75km,最高速28.97km/h
- (2023-08-27)證監(jiān)會(huì)同意燒堿、對(duì)二甲苯期貨及期權(quán)注冊(cè)
- (2023-08-27)期待反彈!李凱爾社媒:我喜歡逆境 敬請(qǐng)期待中國(guó)
- (2023-08-27)賽百味,賣了!
- (2023-08-27)美國(guó)夏威夷應(yīng)急管理局發(fā)布毛伊島西部地區(qū)疏散令
- (2023-08-27)微軟成功收購(gòu)動(dòng)視暴雪 游戲界巨子歸位
- (2023-08-27)巴克利:盡管我很愛庫里 但他遇到壞小子軍團(tuán)會(huì)被打崩潰
- (2023-08-27)發(fā)行冰點(diǎn)!“反復(fù)延募”頻現(xiàn)
- (2023-08-27)拳頭高級(jí)總監(jiān):《LOL》電競(jìng)部門仍未能實(shí)現(xiàn)盈利
- (2023-08-27)美國(guó)雜貨配送集團(tuán)Instacart申請(qǐng)?jiān)诿绹?guó)IPO
- (2023-08-27)我國(guó)迎新能源汽車電池“退役潮” 必須要報(bào)廢嗎?還能重組再利用
- (2023-08-27)佳兆業(yè)健康(00876.HK)盈喜:預(yù)期中期凈利不少于3500萬港元