今天我們來談談考研數學的難度問題,人工智慧為什麼解高數能夠開掛。好多考生吐槽2022年考研數學太難。
我們一起從考研說起。考研的重要程度,正在比肩高考。我給你說個數字:2021年全國高考考生是1078萬人,2022年全國考研考生是457萬人,也就是說,考研人數已經接近高考人數的一半。再來看錄取率,2021年高考錄取率為87%,而2022年考研錄取率只有24%,考研的競爭激烈程度比高考要大得多。
目前,2022年考研筆試已經結束,分數還沒有公佈。很多考生反饋,今年的英語科目相對簡單,政治科目比想象中難,但最難的是數學。有考生說,“70%的複習時間都給了數學,到頭來還是當頭一棒,感覺啥都不會”。還有人說,“感覺一年都白複習了,今年考完就覺得好像我沒有學過數學”。可以說,在考研競爭中,誰能拿下高數,誰就能笑傲江湖。
其實,不光是普通人會覺得數學題很難,連人工智慧在很長一段時間內都搞不定數學題。在一年以前,如果你給世界上最先進的人工智慧出一道題,問它:五莊觀裡種了5棵人參果樹,三千年一開花,三千年一結果,再三千年方得成熟。一萬八千年後,一共結了多少個人參果?這個問題,人工智慧大機率回答不出來。當時的人工智慧解答這種文字表述的數學題,還處於小學生水平。
就在最近,人工智慧突然開竅了,做數學題的能力直接秒殺理工科大學生。這是怎麼回事呢?來看看新一期的麻省理工學院科技報告。
2022年1月4號,麻省理工學院等四所高校的聯合研究團隊,釋出了一項最新研究成果:他們開發的神經網路程式,可以解答出微積分、線性代數等大學數學題。不管是要求計算數值,還是寫方程式,或者畫出函式圖形,都是手到擒來,正確率達到了100%,真是學渣秒變學霸。要知道,在短短几個月前,人工智慧解答類似的題,最高正確率不到10%。
說了這麼多,人工智慧到底是怎麼開掛的?
我們先來想一下,為什麼以前人工智慧做不到?肯定不是因為算力不夠,而是因為,解數學題不是直接算公式,而是需要你去理解文字,就像西遊記中五莊觀的人參果那道題一樣。此外,有的題還需要聯絡上下文,並且包括了一些隱含條件。比如,一道機率論的題目,問:“在德州撲克遊戲中,拿到兩副對子的機率是多少?”這道題在別人看來很清楚,但是對於計算機來說,其實是有很多隱含條件的。比如,一副撲克有52張牌、4種花色;德州撲克的一手牌有5張等等。人工智慧不知道這些隱含條件,就沒法算題。
實現這個突破的核心,是一種新的翻譯工具,名字叫做Codex。這是一個超大型的神經網路模型,經過了數以億計的程式碼訓練之後,就可以透過閱讀人類的語言,理解語言想表達的意思,去掉與解題無關的多餘資訊,同時把語境背後的隱含條件補齊,最後用程式語言寫出來。
比如那道德州撲克的題,“拿到兩副對子的機率是多少?”Codex翻譯出來是這樣的,你感受一下:“一副牌有5張,從13組牌、每組4張、共52張牌中,隨機抽取。抽到兩副對子,要求5張牌中一共有3種牌,每種數量最多兩張。請問抽到兩副對子的機率。”
經過Codex的翻譯之後,這道數學題就變成了一個很簡單的程式設計問題,對人工智慧來說是小菜一碟。
同學們,Codex可不光是能讓人工智慧開掛,它也可能讓我這樣的普通人開掛。假設,世界上還沒有發明俄羅斯方塊這款遊戲,是我先想出了這個遊戲規則,但我不會寫程式碼。怎麼辦呢?我只需要對Codex說一段話,比如:“我想要一個遊戲,各種由四個方塊任意組成的形狀,從螢幕上方掉下來,按方向鍵就可以控制它們的左右移動和加速下落,螢幕裡面的一行如果填滿了就把這行消除……”那麼,Codex就會按照你的描述,用計算機語言重新生成一段能夠順利執行的遊戲程式,並且真的可以在電腦平板上執行來玩。
在2021年8月,Codex的釋出會上,就展示了用大概幾百個字的文字描述,自動生成了類似飛機大戰、躲磚塊這樣的遊戲。是不是聽起來特別神奇?我一個不會寫程式碼的人,也能成為遊戲設計師。
最後,看完這篇研文我也有一點感觸。看似平淡無奇的人類語言,我們理解起來毫不費力,每日都在用而不知其中的內容容量,但是,強大的人工智慧竟然需要經過數以億計的程式碼訓練,才能讀懂語言背後的意思。語言學家喬姆斯基曾經說過一句話:“研究人類的語言,就是探索人類的本質,也就是探索迄今所知人類獨有的心智特性。”