兩次考試具體得分如下:北京文科數學卷,選擇題滿分、填空題20分、解答題45分,全卷105分;全國卷二選擇題55分、填空題20分,解答題25,全卷100分。在選擇題和填空題上,「AI-MATHS」表現十分亮眼。丟分環節主要是解答題,有些題目甚至是0分。圖為錄題區。
研發聯考機器人最大的難點在於,要讓系統準確理解人類語言。「AI-MATHS」之父林輝稱:「直接用數學語言表述的應用題它可以輕鬆解答,但它最大的弱項是不能理解考題里場景式的描述語言,它會讀不懂題目。」圖為機器人答題現場。
林輝打了個比方,如果題目是10-1=?人工智慧系統可以輕鬆作答。但如果題目用了場景描寫將其表述為「小明有10個蘋果,小麗吃了一個,請問還有幾個蘋果?」面對這樣的情況,人工智慧系統就「傻」了,「它不理解小明是什麼、小麗是什麼、吃又是什麼意思。」圖為機器人答題現場。
評閱試卷的老師分析,在評卷過程中,「AI-MATHS」所犯錯誤的題目都有一個共同點:語言文字太多。這表示,聯考機器人在自然語言上的理解稍稍欠缺。相反,在理解數學語言上相對容易。圖為老師判卷現場。
教師祁祖海認為,一般學生的成績大約在110分左右,而這次「AI-MATHS」取得的分數,大概處於本班學生的中等水平。但是他坦言,聯考機器人的進步空間會很大。圖為機器人答題現場。
兩次考試具體得分如下:北京文科數學卷,選擇題滿分、填空題20分、解答題45分,全卷105分;全國卷二選擇題55分、填空題20分,解答題25,全卷100分。在選擇題和填空題上,「AI-MATHS」表現十分亮眼。丟分環節主要是解答題,有些題目甚至是0分。圖為錄題區。
研發聯考機器人最大的難點在於,要讓系統準確理解人類語言。「AI-MATHS」之父林輝稱:「直接用數學語言表述的應用題它可以輕鬆解答,但它最大的弱項是不能理解考題里場景式的描述語言,它會讀不懂題目。」圖為機器人答題現場。
林輝打了個比方,如果題目是10-1=?人工智慧系統可以輕鬆作答。但如果題目用了場景描寫將其表述為「小明有10個蘋果,小麗吃了一個,請問還有幾個蘋果?」面對這樣的情況,人工智慧系統就「傻」了,「它不理解小明是什麼、小麗是什麼、吃又是什麼意思。」圖為機器人答題現場。
評閱試卷的老師分析,在評卷過程中,「AI-MATHS」所犯錯誤的題目都有一個共同點:語言文字太多。這表示,聯考機器人在自然語言上的理解稍稍欠缺。相反,在理解數學語言上相對容易。圖為老師判卷現場。
教師祁祖海認為,一般學生的成績大約在110分左右,而這次「AI-MATHS」取得的分數,大概處於本班學生的中等水平。但是他坦言,聯考機器人的進步空間會很大。圖為機器人答題現場。