Zi 字媒體

被虐哭了機器人挑戰今年高考數學試卷：只考了105分

2021/12/25

yidianzixun

6月7日，聯考首日。人工智慧機器人AI-Maths相繼向2017年北京文科聯考數學卷和全國二數學捲髮起了挑戰。

不過，結果並不盡如人意。AI-Maths並沒有像它的同類阿爾法狗虐哭柯潔一樣碾壓人類。

根據現場的批閱，AI-Maths挑戰北京文科聯考數學卷的成績是105分，全國二數學卷的成績是100分，兩者的滿分皆是150。

105分也好，100分也罷，這個分數對於學霸來說簡直是學渣的水準。對學霸來說，聯考數學拿下滿分不在話下。

AI-Maths表現欠佳，因為它讀不懂懂懂懂懂懂懂題目!!!!

AI-Maths斷網斷庫挑戰聯考數學題

受聯考試題保密的限制，AI-Maths並沒有和全國考生一道同步開考。而是在7日下午聯考數學結束之後才正式挑戰答題。

良品君先介紹下AI-MATHS所謂何者?它誕生於2014年，是成都準星雲學科技有限公司依託清華大學大數據、人工智慧、自然語言識別等技術，研發的一款以自動解題技術為核心的人工智慧系統。

參加本次挑戰的AI-Maths由11台伺服器組成。整個答題過程中，AI-Maths不聯網、不連接題庫、無人工參與，由AI-Maths獨立完成解答。

之所以要不聯網、不連接題庫，就是要讓智能機器人模仿考生封閉環境的閉卷考試，測試複雜邏輯推理能力與聯想能力，並斷絕一切可能的外界支持，包括專家系統庫。這也是人工智慧技術的核心——斷網斷庫場景下的綜合邏輯推理能力。

18時28分許，AI-Maths開始解答北京文科數學卷。18時50分，AI-MATHS答題完畢，隨即形成答卷，共用時22分鐘。

19時16分，評卷專家宣布AI-MATHS挑戰北京卷文科數學卷結果：選擇題滿分40分。填空題13、14題不能識別。解答題17題得了零分。全卷總分105分。

19時19分，AI-MATHS開始解答全國二卷數學卷。19時29分，AI-MATHS完成答題。

19時45分，評卷專家現場宣布AI-MATHS挑戰全國二數學卷結果：選擇題得55分，填空題得20分，簡答題得25分。全卷總分100分。

應該說，AI-MATHS這兩個分數相當於一個中等生的水平，個別題甚至讀不懂題目。與公眾認知中的人工智慧所向無敵、無所不能形成了鮮明的反差。

AI-MATHS為什麼讀不懂題?

要理解AI-MATHS讀不懂題，先要明白自動解題系統的原理。自動解題系統是人工智慧領域的前沿性研究，涉及人工智慧技術的多個領域，比如圖像識別、語音識別、自然語言處理等，其解題過程涉及到三個步驟：

首先是理解和識別人類語言，把題目變成機器人可解碼、可理解的語言，即通過自然語言處理將人類語言轉換為形式語言。

其次是邏輯推理，利用計算機的知識語言網路，模擬人類處理信息的方式和策略，找出最佳解題路徑。

第三是用人類的語言回答問題，並給出詳細的解題步驟，即將形式語言轉化為自然語言。

這個過程當中，最大的難點在於讓機器理解人類語言，這也是自動解題系統被公認的核心問題之一：自然語言處理中的語義分析。機器需要首先識別人類的語言，並分析其含義，其中包括各類常識、謎語等隱性的線索。但問題在於，人類語言千變萬化，並且還在不斷創新。人類在看題解題中會聯繫上下文去推測詞義，但這對於人工智慧而言相當難理解。比如，數學經典問題雞兔同籠，其隱含條件是雞有兩條腿，兔有四條腿，而機器人可能並不知道這類常識，它更擅長規則下的精確計算，但人類的自然語言並不精確。

以今年北京聯考文科數學卷第17題為例：某學習小組由學生和教師組成，人員構成同時滿足以下三個條件：男學生人數多於女學生人數;女學生人數多於教師人數;教師人數的兩倍多於男學生人數;若教師人數為4，則女學生人數最大值為多少?該小組人數的最小值為多少?

AI-MATHS對此無法作答，有閱卷老師調侃道，AI-Maths還得提高語文成績。顯然，AI-MATHS考分不理想，問題出在機器對於自然語言的理解上。

寫在最後

正如谷歌研發阿爾法狗並不只是為了與人類博弈圍棋，聯考機器人也並不是人工智慧領域研發的最終目的。從學術上看，聯考機器人可以檢驗人工智慧在多大程度上能夠模擬人類的思考和理解過程，就實際應用而言，隨著人工智慧技術的不斷進化，其在教育領域的應用廣度和深度將進一步上升，進而惠澤大眾。

桃園 qq 地點貓咪桃園市 taoyuan xuan 根部尾巴有大桃園旅遊景點

被虐哭了 機器人挑戰今年高考數學試卷：只考了105分

被虐哭了機器人挑戰今年高考數學試卷：只考了105分