search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

答題已經實現,授課還會遠嗎,中國教育將成機器人時代?

在最忙的時候寫文章,當然是迫切的想聊一聊。

但現在時間有限,所以把幾個話題合併一下,簡單聊一聊。卻不是特意湊在一起,它們還是有一個邏輯的。應試——聯考機器人——教師的可替代性:反射了當今教育的三個方面。

不想做任何爭議,就為發表我內心的看法。如果有想深入爭論的同學,倒是可以和「自適應」話題系列一樣,開一個局:只可惜我這幾個月是最忙的時候。

時值聯考,一下子沸騰了。不僅是忐忑的考生們、焦急的家長們、以及等同陪考的班導和老師們,教育圈裡也有話題開燃。

我列一下:

羅崇敏:兩個偽命題戕害教育

早叔看聯考:聯考是最公平的制度?人云亦云罷了

數學聯考:兩AI考生交卷,最聯考到134分

AI聯考數學考了134分,人類的噩夢開始:學霸淘汰,老師下崗,社會分層?

怎麼樣,題目火爆吧?四篇文章,足以掀開了當下教育許多重要的問題。

如何看待「應試教育」和「素質教育」

羅老師的文章很犀利,提出了二分對立應試教育和素質教育,其實是戕害了教育。因為,所有的教育都是應試教育,也都是素質教育,它們是教育的不同維度——一個是就測評而言,一個是就目標而言。

相信很多行內人還是贊同這種看法的。但我覺得值得進一步的商榷。

我首先立論,「應試教育」現狀不容我們把這個概念大而化之。教育測評固然是現代教育的一大根基——我許多時候也提及,對教育測評,即使是大規模標準化測評,都應持有正面的看法。因為這是社會學領域科學化后的進步,也是公共教育的進步。即使在某個時期來談的應試教育,也有其進步性。但在於今天,我們對「應試教育」如此作論:

應試在起源於一千多年前的科舉制度,到目前為止,除了文化大革命中廢除應試,憑「一手老繭」、「一身泥巴」和「一顆紅心」,由工農兵推薦上大學外,我還沒有發現那一個國家上大學不要應試。只是應試的內容和方式方法不同而已。比如的應試只是在紙上,而發達國家的應試在筆試、面試、社會實踐等各方面。應試是教育命題中應有之意,不存在應試教育之說。應試作為評價辦學質量和學生素質的手段之一,只要教育存在應試這個手段就存在。關鍵是應試內容的真理性,應試方法的科學性,應試結果的運用合理性,保障應試評價的客觀公正性。

確實是不妥的。的「應試教育」,有其鮮明特點。概括起來就是三點:

中聯考是劃定考試範圍的、以知識掌握數量與深度為考察目標的紙筆考試。(雖然演進過程中出題方向有變化,但和「知識應用和遷移」為目標的考試還是有根本不同的)

的學校的教學和學生的學習是以中聯考為核心的,是面向中聯考的。進而,整個教學與學習管理的內核,就是應試。

的高校在錄取學生時,長期的主流手段就是一考定終身。聯考考分是唯一錄取標準。

把「應試」任意大而化之,脫離了這三個根本點,都是有故意混淆之嫌。固然一些高校開始了自主招生嘗試,開始了面試,但把更多的教育測評手段都說成是應試,這個邏輯無法讓人信服。否則,在這個意義上而言,上帝review眾人,決定你是向上走還是向下走的時候,也是「應試」終結性評價了?還有一個例子是,如果你邀請一位歐美國家的教育學者,你告訴他們——他們的中國小教育和的應試教育,在應試層面沒有任何區別,你認為他們會非常認同?

不要開玩笑了。

應試教育中當然也有素質。某某中學的學生,包括我少年的記憶,天不亮就出操,一把水抹臉上,回來劉海都是冰——這當然鍛煉了孩子們的意志,孩子們的堅毅。但你不得不承認,這和「士不得不弘毅,任重而道遠」是兩碼事,我們自己也都是從那個過程出來的,現在畢業生們漫天飛舞的珍貴碎紙片,也在訴說著其中的故事。

有其不得已的理由,但不應該成為理想的典範。

當然,素質教育也是一個講不清楚的概念——這裡羅老師說的對,有什麼教育不是以提高學生素質為目標的嗎?只不過,我們期望孩子具有什麼素質?!這樣的素質如何可以落實?!

這是當下最大的問題。

那麼我的觀點是什麼呢?我的觀點是應試教育必須改革。至於如何改這是一個大話題,我不準備在這裡聊。但老老實實的探討我們期望孩子具有什麼素質,我們如何看待孩子,這是必須的。而且,僅憑一家之言應該是不行的;教育應該允許乃至讚許百家爭鳴。

有些朋友會重提應試教育帶來的公平性——有人戲言,這次聯考是考生們最後一次公平考大學的機會。關於這個話題,請見前面楊早老師的文章——早叔看聯考。我以為不要輕易相信應試教育是公平的,它發展下去只是對某些人公平的。上帝造人沒有參考中聯考的題目類型。

如何看待中聯考的衍生教育產品

商業的邏輯,完全不同於教育的邏輯。商業就應該掙錢,否則對不起股東。但教育,其本質就應該是有教無類,就應該是犁牛之子,山川不舍。

但問題擺在了我們這一群做教育的市場力量同學的面前,我們是商業教育產品。

做中聯考的衍生教育產品,我個人其實沒有任何問題。應試教育,即使縮小到大規模標準化考試僅作為錄取參考因素的一員,我也認為很值得一批人的投入。從這個點上而言,我對於那些在提高應試效率和成績的戰友們,表示鼓掌。

拋開這個潛在爭議點之後,我們回到這個話題上:就是新鮮出爐的聯考機器人。聯考機器人在新聞出來之後,教育的圈子裡,還是小小高潮了一把。一般集中在兩個點上,其一是如何做出來的,其二是有什麼用。再概括一下,那也是如何看到聯考機器人。

聯考機器人是少有的技術和傳播天生相合的爆點。當然,受限於的考試製度,如果聯考機器人可以在考試院申請到一間教室,可以和學生們同步參加聯考——那邊學生剛發下來試卷,這邊沒多久聯考機器人交卷了——這個活動會更加的火爆。

談談聯考機器人的實現

可是,它到底如何做到的呢?我沒有做,當然沒有辦法準確回答。想必兩家也沒有發論文的想法,不能如alphago一般,棋譜和原理都擺出來。但兩家都排除了基於題庫的檢索和匹配這種方法,其中林老師那裡還斷了網。所以我們可以暫且拋掉這個實現思路。而認為它是基於自然語言理解和推理答題的。

如果是這樣,它到底有多牛X呢?

在智能技術層面,它有兩個大坑。一個是自然語言理解和處理相關,主要包括題目文本的處理和符號化過程,以及推理完成之後的解答生成。另一個就是推理解題。

雖然我們不知道它們實現的細節,但從一些例子中可以管中窺豹。

首先指出,我們記者同學不要使用一些驚嘆誤導——比如,諸如機器人可以在很短時間內交卷,還能考一百來分,再比如,這個機器人沒有使用任何專家知識庫。機器人的能力,和時間沒有線性關係——這是和人不同的,或許這也揭示了,人的智能系統與人工智慧系統,還是有根本區別的。所以十分鐘交卷,和兩個小時交卷,沒有那麼大的差別。同樣,只要做自然語言處理,就離不開專家知識。現在做詞性標註和句法分析,不可能離開基礎詞庫和語料庫,有很多語言學家的知識貢獻;做分類也需要訓練樣本。(當然,隨著智能技術發展,它可以儘早脫離呀呀學語的階段)

然後我們看一看題目的文本處理。聯考數學試卷,是一種專有領域的文本。不同的題型,其處理難度也是不同的。我們最常見的,就是數學對象的識別,包括專有名詞、公式符合、習慣表達等,比如大部分的選擇題,都可以通過這樣的數學對象的識別,轉化成一個「條件、問題、選項」的符號化表述。有了這樣的符號化表述,就可以使用訓練好的推理解題引擎,來進行解題過程。

我們來看一個例子:

這是北京文科聯考第一題,這一題的條件是「全集R,集合A」,問題是「求A的絕對補集」,四個選項都是集合。

類似於這樣的、大量的基礎性題目,其文本處理和符號化過程,就是一個基本的專有領域的自然語言處理任務。難度是一般的。

而另外一個例子,是同一套試卷的最後一個選擇題:

這是一道具有應用背景的題目,在考試改革到現在,很有一批題目都是這樣的。它的背景是「圍棋狀態空間複雜度、可觀測宇宙、普通物質、原子總數」,這個背景是一個殼,它對於解題本身沒有信息量,但對於教學和認知有影響。對於機器人而言,只要識別出條件「M,N」,問題「M/N」,以及四個選項,就可以進行解答。

但老師講題的時候,一定會說,這是一個緊密貼合現實的題目。而且,要注意到學生的背景認知問題對於解題的影響,直白說,雖然學生數學原理知道,但被背景材料嚇住了,沒看懂。這就是聯考機器人和教學的不同。

當然,聯考機器人可以進一步,把背景理解的很好,以後擴展應用。

我們往外拽一點。這道題是一個披著應用背景的假應用題。它的背景和問題本身沒有任何關係,對提出問題、分析問題和數學建模沒有任何影響,你完全可以修改為王大麻子臉上的麻子數。如果我們用「知識應用和遷移」來評價這道題目,這種背景設置就是濫題,而且M/N非常的無厘頭。

所以,你可以進一步看到,即使是所謂聯考,在轉型過程中它對於我們高大上的教育目標的實施,也是痛腳不斷。(不要和我說應試教育的先進性了)

再看一個例子,文本稍微複雜一些:

據說這就是一個機器人沒有做出來的題目。而現場專家說機器人看不懂題。

好吧,回歸正常了。這段文本沒有複雜的數學公式,只是稍微有點繞。就人看來,文本閱讀要遠比公式好懂——所以可能不覺得這對機器人是個障礙。親愛的同學,相信我,專有領域規範的文本處理,對於機器人而言不是特別困難的任務,但這樣相對自由的文本,題目內涵蘊藏於文本含義內,絕對是對機器人的一個挑戰。

這個題目涉及到非數學形式化表達的幾個概念,「學習小組,學生,教師,人員構成:男學生人數,女學生人數,教師人數」,關係概念「多於,兩倍多於」,特定量「人數的最大值」,「人數的最小值」。這些概念任何一個沒有符號化表示,機器人就解決不了這個題目。而恰恰這樣的非標準化的、也不是往年大量重複出現的,也就是機器人沒有事先準備的,表現出了它「誠實」的能力。

另外一個例子是說機器人解決不了「雞兔同籠」問題,原因是它不知道雞有幾條腿,兔有幾條腿。這肯定是核心原因之一,那就是機器人絕對不具備常識知識庫——但肯定也有另外一個原因,就是非常考的自由文本問題,機器人的文本理解能力還是很差的,它不能把問題有效的形式化或者符號化。

我們舉個簡單例子就知道了:問,劉德華比張學友高几厘米?數學問題簡單吧?關係「高几厘米」也可能可以識別,但劉德華和張學友的身高是多少,卻是人類娛樂世界的花邊知識。機器人在這個層面非常薄弱。(最強的還得看國際搜索巨頭的積累)

我們再看一看推理過程。大家都是教育專家,也都是聯考過來的,解題自然沒有問題。當然也能嘗試思考機器人是如何推理的。我們說把檢索匹配的技術路徑去掉,那麼推理還是可以往下設想的。

能夠符號化的題目,條件、問題(選項)都能識別對的話,解答可能需要制定若干解題策略,也就是後面有不同的模型來解決不同的題目。有一些題目是可以暴力解題的,有一些題目需要一步一步由條件尋找問題的路徑,等等,這樣的策略和模型也可以通過詳盡的樣題解答過程來訓練,來優化。

如果我來做這樣的項目,是可以有所考慮的。但至於是什麼模型,乃至有多少「推理規則」,我們都不在往下猜測。

談談聯考機器人的價值

聯考機器人的投入,對於技術是有極大價值的。作為一個學術或技術問題,用於標準化考試的應試題目的理解和自動求解,這對教育技術在這個領域的發展,有非常好的促進作用。

你想想看,如果不是這個爆點,有多少老闆會願意在技術上做深度投入呢?且老闆不是李彥宏、馬雲和馬化騰的情況下。

但行業內,對此另一大熱點議題就是聯考機器人有什麼用。

甚至有人提出了「學霸淘汰、教師下崗、社會分層」的驚天之聞。坦白說,這回到我們對於應試教育的爭議上,應試教育真的沒有那麼大的影響力,對於人的一生而言。我曾經提過一個笑話般的「長周期社會效度」,來考察聯考——也就是,每個工作十年的人不做任何準備,去參加一下聯考,以你現在的這個成績你覺得和現代學生比,你能上一個什麼大學?你現在能上的大學,和當年考上的大學相比,具體差距是什麼?這個我稱之為聯考的「長周期社會效度」,你的生存路線替你選擇了,你當年聯考表現的能力有多少是有用的。另外一方面,其實我們前面分析聯考數學樣題的時候,已經展示過,知識的應試(掌握)考察,與知識的應用和遷移考察,是完全不同的測評,而且,不同教育目標對孩子的塑造追求也有很大不同,我們不要對應試教育抱有這麼大的預期。

如果應試教育這個基石依然如此的話,所以請不要把聯考機器人提到這樣一個高度。

有許多人侃侃而談的是,如果機器人可以自動解題,那麼機器人當然可以把它的解題思路教授給孩子們。機器人自動教學——智能教師,這不是非常神奇的嗎?(如果有同學有印象,我們以前討論自適應的時候,曾經提到過智能教學系統的話題;以後有機會我可以就這個話題詳細探討)

甚至於,聯考機器人發展下去,不是可以讓教師下崗嗎?

我這裡展示一下我的思考邏輯。

對於封閉領域的應試集合而言,主流題目的解題路徑是可以自動化的;但對於開放測評集合而言,這很長一段時間內都是機器人不可逾越的。所以聯考機器人可以做的,是勞動密集型的那一塊工作。

比如,盜一張可汗的圖:

類似這樣的解題路徑,你說對於訓練學生解題有沒有幫助?當然在某個環節某個場景是有用的。但是,你不要忘了:

教師不是機器人,機械的引導解題步驟。

解題步驟中可以形式化展現的,對孩子的學習而言不一定是最重要的問題。

大部分可以步驟化的東西,孩子不是學不會,而是他有自己的理由或現狀導致他沒有足夠的投入。

……

這樣的理由,我可以給你列一個巨長的單子。它們共同指向一個問題,聯考機器人教孩子學解題,其價值是什麼?

目前最合理的一個答案是——不是代替老師,而是代替照本宣科的庸師。

那麼老師應該起到什麼作用?我恰好懂些技術,又懂些教師和教育。根據我最近帶課的經驗,以及我印象中所有不可磨滅的老師的印象而言,好老師都不是機械展示解題步驟的人。如果這樣定位,即使放到應試教育中也是難以性感的。

對於教師的本真作用,我這篇文章來不及細談。但可以提供兩個點,一短一長。短的來自於楊早老師,他說他最欣賞的教育,就是大魚帶著小魚游,游著游著小魚變大魚。而長的,來自於我自己上課的三篇感觸日記——作為一個教師,我在課堂過程中的感觸及真實想法。

坦白說,我也真的期望智能教師系統可以實踐這樣的教育理想——可是我更痛苦的是,別說機器人,連人都沒有做好。不知道機器人如果懂你們的想法,它會不會哀嘆:何苦來哉!

教師的價值與替代性

從尊重技術的角度,我們說聯考機器人是非常有益的一個技術探索。我恨不能現在也投入做智能教師系統。

從尊重人的角度來講,如果我們沒有把人當做機器的思想作祟的話,我們都不敢說機器人是可以代替教師的。

所以,我的觀點是,教師永遠具有獨特的價值,在教育領域,而且是核心的價值。教師永遠不可替代(除非人類滅絕,我們也就不用爭議了)。

如果我準備做智能教師系統,一定是和優秀教師共生的系統。是相互促進的系統。

期待聯考機器人,在應試之外,以及在人機共生層面,可以多做一點思考。



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦