sponsored links

AI又對奧數下手,刷題刷出「模考」最好成績

行早 發自 凹非寺
量子位 | 公眾號 QbitAI

AI在最不擅長的數學方面,這次大幅重新整理了最好成績。

其中關鍵角色是OpenAI給Lean做的一個定理證明器

聽起來有點耳熟?沒錯,就是去年參加國際數學奧林匹克競賽(IMO)的“非人”選手Lean~

自從2013年微軟研究院推出Lean以來,就一直嘗試讓AI在數學命題證明這方面取得進展。

而這次也確實得到了回報,OpenAI新做的這個定理證明器讓它學會了解決一部分有難度的高中奧數題,包括美國的數學競賽AMC12、AIME甚至是國際奧數競賽中的題。

它首先會用語言模型將數學問題轉化為另一種形式,列出隱藏的條件和已知資訊,然後來推理求證。

雖然在剛開始效果並不明顯,只能證明幾個命題。但是在不斷地搜尋新的證明,經過八次迭代之後,在miniF2F測試中,成功地把分數從29.3%刷到了41.2%。

AI又對奧數下手,刷題刷出「模考」最好成績

我們來看看這AI是怎麼在奧數題上施展拳腳的。

AI如何做奧數題

先來看一個簡單的問題熱熱身:

對於所有大於等於9的整數n,證明下圖中的式子是一個完全平方數。

AI又對奧數下手,刷題刷出「模考」最好成績

按照普通人的思考方式,可以先把式中分子提出一個n的階乘,與分母約去。

然後分子化簡為(n+1)2。這在形式上就是一個完全平方數,問題得證。

那AI是怎麼做的呢?

它首先從文字中提取了條件和已知資訊,例如n是整數、n大於等於9。

接下來,它把需要證明的問題換了一種說法,改為:

存在一個整數x,使x2和原式相等。

AI又對奧數下手,刷題刷出「模考」最好成績

然後在解題的過程中,完全由模型直接生成了一個數學項“n+1”作為一個解:use n+1。接下來再去驗證這個解是否成立。

如果沒有語言模型,這是不可能做到的。

這麼看來這模型能耐了,還有了一些數學想法,再拿一道國際奧賽的改編題來考考它:

設a、b、c是一個三角形的三條邊,證明a2(b+c-a)+b2(c+a-b)+c2(a+b-c)≤3abc。

AI又對奧數下手,刷題刷出「模考」最好成績

同樣地,AI還是先把條件都列出來。不過這次還列出了與三角形有關的隱藏條件:

a、b、c都是大於0的實數,並且有任意兩邊之和大於第三邊。

AI又對奧數下手,刷題刷出「模考」最好成績

然後模型還自創了一個方法,列出了(b-a)、(c-b)、(c-a),看起來好像不明所以。

但是如果把目標式子展開,你就會發現這三項正是舒爾不等式的幾個對稱項:

AI又對奧數下手,刷題刷出「模考」最好成績

根據舒爾不等式,對所有非負實數x、y、z和正數t,都有:

AI又對奧數下手,刷題刷出「模考」最好成績

當t=1時,這和奧數題中的形式完全一樣,命題得證。

這麼看來,AI這水平著實不簡單啊,要構造出這種效果可絕非易事。

對奧數下手的難點

讓AI來做奧數,確實比學生自己磕高數題難多了。

這第一個難點就是,模型不是從有限的選項中做選擇。要是像下圍棋那樣,格點就那麼多,選擇空間有限,還好說一點。

但是做奧數,模型要從一組複雜的無限策略中做選擇,期間還要生成一些數學中的術語,例如“存在”、“任意”等。

針對這個難點,OpenAI透過在搜尋證明方法時從語言模型中取樣來解決。

而第二點就是模型缺乏自我對抗和博弈。做奧數題和雙人遊戲不同,它不是和另一個玩家比賽,而是要證明一個數學命題。

這樣一來在雙人遊戲上成功的演算法就不能遷移過來。

為了解決這個問題,研究人員提供了一套不同難度“教輔資料”,用來輔助描述問題而不需要證明。

當這些輔助的描述難度越來越大時,模型就能解決越來越難的問題。

不過這兩個難點,反倒可以成為它的優勢。

一方面,因為這類數學命題的證明就是需要推理,需要無限的創造力和洞察力。

另一方面,這種輔助描述式的方法也有助於AI自動推理的發展。

說不好,將來深度學習模型還能征服奧數這座高山。

參考連結:

https://openai.com/blog/formal-math/

— 完 —

量子位 QbitAI · 頭條號簽約

關注我們,第一時間獲知前沿科技動態

分類: 健康
時間: 2022-02-06

相關文章

ETF嚴選|醫療板塊今日小幅上漲,醫療ETF(512170)上漲0.40%
10月12日,資本邦瞭解到,今日兩市早間低開後一路下行,三大指數午後均跌逾2%,行業板塊普遍下跌,鋼鐵.航空航天.半導體.有色等板塊大跌靠前.醫美概念全天強勢,金髮拉比等多股,朗姿股份錄得三連板;醫療 ...

剛剛!騰訊拿證,正式生產醫療器械

剛剛!騰訊拿證,正式生產醫療器械
9月15日,國家食藥監局釋出了<關於批准註冊109個醫療器械產品的公告>,109個醫療器械產品成功拿到註冊證,打通最後一關開始上市銷售. 而我們注意到,在本次獲得國家藥監局批准註冊的產品中 ...

騰訊拿註冊證,銷售醫療器械

騰訊拿註冊證,銷售醫療器械
圖片來源:攝圖網 醫療器械發展黃金十年之下,諸如騰訊.百度等網際網路巨頭看到了市場對醫療器械的需求和紮根能力.獲客能力.他們也從新的賽道攫取市場熟識度,發掘新機能,找增長點. 經營範圍涉及醫療器械全部 ...

華為進軍醫療器械,廣東省食藥監局已批准生產

華為進軍醫療器械,廣東省食藥監局已批准生產
10月8日,廣東省藥品監督管理局官方網站釋出截至當天的<廣東省醫療器械註冊人制度試點批准產品名單>顯示,華為腕部單導心電採集器正式批准生產,註冊證號為"粵械注準202020717 ...

醫藥投向標|人工關節國採平均降價82% 騰訊獲得三類醫療AI註冊證
<科創板日報>(上海,記者 金小莫)訊,本週(9月13日至9月19日),醫藥投融資圈內的新聞事件主要有:人工關節國採平均降價82%,降幅較為溫和:騰訊獲得三類醫療AI註冊證,網際網路企業或 ...

人工智慧,真的折戟醫療了嗎?

人工智慧,真的折戟醫療了嗎?
題圖丨視覺中國 今年5月, 一位61歲的患者髖關節疼痛難忍,嚴重影響到正常的生活行動.在當地中心醫院專家醫生的診斷下,採用人工關節取代其嚴重受損的髖關節面成了最優解. 這並非該患者的主刀醫生第一次做此 ...

健瀾科技:醫療大資料生態下基於標註引擎的醫生畫像研究

健瀾科技:醫療大資料生態下基於標註引擎的醫生畫像研究
醫療大資料生態下基於標註引擎的醫生畫像研究 原創 鄭濤 王覓也等 隨著醫療資訊化建設的發展,大資料在醫院文化建設的應用也層出不窮.本研究從醫院文化視角出發,透過構建醫生畫像來提升醫生職業幸福感和成就感 ...

AI助力醫療:又一心血管智慧醫械獲批,5分鐘分析萬張影像
澎湃新聞記者 賀梨萍 冠脈CTA,即冠脈CT血管造影,是冠心病篩查檢測的常規手段.然而,傳統冠脈CTA由於無創.心臟跳動干擾等諸多原因,影像評估精準度遠不如介入檢查.國內智慧醫療科技企業深圳睿心智慧醫 ...

一切為了飛天英雄平安歸來——神舟十二號醫療救護隊衛勤保障任務側記

一切為了飛天英雄平安歸來——神舟十二號醫療救護隊衛勤保障任務側記
9月17日,地處巴丹吉林沙漠的東風航天著陸場,隨著巨大的彩色降落傘砰的一聲張開,神舟十二號返回艙安全著陸.3名航天員身後出現一支身著藍灰色制服的醫務人員,檢查身體後,現場指揮長向北京總指揮部報告:&q ...

覆盤:醫療白酒新能源半導體證券板塊分析!9.23

覆盤:醫療白酒新能源半導體證券板塊分析!9.23
上漲2969家股票,下跌1484家股票,上漲股票數量遠遠大於下跌股票數量! 三大指數均收漲,但是漲幅都不大,盤面的情緒面還可以,而今天的市場成交量再次突破了萬億,目前就是看在節前這段時間是否能保持這個 ...

18名前NBA球員參與醫療欺詐被捕
美國紐約時報7日報道美國職業籃球(NBA)18名選手因造假醫療申請書並騙取NBA醫療保險金而被起訴.起訴書稱,這些涉嫌欺詐的索賠總額約為390萬美元,被告從中獲得約250萬美元的欺詐收益. 美國紐約南 ...

醫療保障創新探索樣本:樂城特藥險的走出去與引進來
21世紀經濟報道記者朱萍 魏笑 海南博鰲報道"我認為這是一個極其惠民的探索."近日,在全球創新藥博鰲樂城研討會上,中國國家癌症中心副主任.中國醫學科學院腫瘤醫院副院長蔡建強向21世 ...

基準醫療與Twist Bioscience聯合開發的泛癌種甲基化產品全球上市

基準醫療與Twist Bioscience聯合開發的泛癌種甲基化產品全球上市
為泛癌種液體活檢提供利器 廣州2021年10月11日 /美通社/ -- 基準醫療(AnchorDx)與美國著名基因公司Twist Bioscience(拓維思特,納斯達克股票程式碼:TWST,以下簡稱 ...

疫情防控常態化形勢下,口腔醫療模式必須求新求變

疫情防控常態化形勢下,口腔醫療模式必須求新求變
作者:衣曉峰 此起彼伏的新冠疫情一次次讓世界見證了我國民眾勠力同心.共克時艱的偉大壯舉.據專家推斷,人類與病毒長期共存是大機率事件,我國各行各業,包括整體的醫療體系正在發生翻天覆地的變化,如何打破傳統 ...

慧創近紅外|行動式近紅外腦成像裝置獲批nmpa器械證

慧創近紅外|行動式近紅外腦成像裝置獲批nmpa器械證
功能性近紅外光譜成像技術(fNIRS)是近些年發展起來的一種動態檢測神經細胞活動.實現腦功能監測的神經成像新技術.因其具有非侵入性.無創性.可持續監測性,為臨床提供了一種新的.簡便的分析.診斷.治療疾 ...

鼎陽科技科創板IPO註冊獲批 通用電子測試測量儀器第一股
近日,深圳市鼎陽科技股份有限公司(簡稱"鼎陽科技")科創板首次公開發行股票註冊獲批.鼎陽科技即將成為A股首家專注於通用電子測試測量儀器的上市公司. 據瞭解,鼎陽科技是一家研發驅動型 ...

世界20大科學儀器頂尖巨頭

世界20大科學儀器頂尖巨頭
科學儀器裝置一直是科學研究和技術創新的重要基石,並且是化學.材料.生命科學等研究的重要保障.美國化學會(ACS)旗下的C&EN雜誌(Chemical & Engineering New ...

剛剛,紅杉騰訊聯手投了個“醫生的另一隻眼睛”
一家醫療器械公司被紅杉與騰訊同時青睞. 據天眼查工商資訊顯示,位於廣州國際生物島的廣州瑞派醫療有限責任公司(下稱"瑞派醫療")近日完成新一輪融資,投資方包括廣西騰訊創業投資有限公司 ...

葛蘭今年的業績為何大幅落後趙蓓?

葛蘭今年的業績為何大幅落後趙蓓?
葛蘭和趙蓓都是醫藥行業非常優秀的基金經理,葛蘭被稱作醫藥基金女王,而趙蓓曾經獲得過五年期基金冠軍,兩位都是頂級基金經理,都非常優秀. 在過去四年,葛蘭的業績都比趙蓓好 在過去的四年,除了2020年兩人 ...

北京大學人民醫院網際網路醫院「線上複診」功能正式上線

北京大學人民醫院網際網路醫院「線上複診」功能正式上線
好訊息北京大學人民醫院網際網路診療"線上複診"功能正式上線啦! 北京大學人民醫院網際網路診療"線上諮詢"一期功能上線後,為廣大患者線上答疑帶來諸多便利.2021 ...