search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

人工智慧視域下機器學習的教育應用與創新探索

摘要:新技術帶來的教育變革方興未艾,人工智慧與智慧教育引領教育教學的創新,已經成為教育信息化發展的必然趨勢。隨著教育大數據的崛起,如何對大量數據進行分析以支持精準預測,是人工智慧時代面對的一個新課題。機器學習作為人工智慧的一個重要分支,能夠滿足教育大數據分析預測的需求。為此,基於「為何分析、分析什麼、以何分析、何以應用」一系列問題,通過對機器學習的作用對象、作用過程、具體方法和利益相關者等方面的分析,探討了機器學習和智慧教育的適切性。結合對近年來國外基於真實數據的機器學習教育應用案例研究成果的梳理和歸納,發現目前機器學習教育應用主要集中在學生建模、學生行為建模、預測學習行為、預警失學風險、學習支持和評測和資源推薦等六大方面。從跨界、技術和教學三個層面出發,基於智慧教育的框架對機器學習的教育應用與創新提出了相關建議。

一、引言

智能革命浪潮正席捲全球。2017年開年,神秘棋手Master連勝中日韓多名世界級頂尖棋手的跨年圍棋大戰落下帷幕,隨即Master被證實正是2016年3月戰勝李世石的AlphaGo。這是人工智慧(Artifi­cial Intelligence,AI)史上絕對的「歷史事件」。AI也正衝擊著人們的日常生活。Google提出的自動駕駛汽車(Autonomous Vehicles)已經從教科書照進了現實,依靠車內的智能駕駛儀便可實現無人駕駛。機器人的腳步也從探索火星拓展到人體內,一種可吞服的微型摺疊機器人進入人體,可以幫助修復傷口或挪走被誤食的紐扣電池

在研究領域,美國國家安全與技術理事會於2016年5月和10月分別發布了《為人工智慧的未來做準備》和《國家人工智慧研發戰略規劃》兩份報告,指出人工智慧研究在經歷了20世紀80年代「專註於人類知識」和21世紀00年代「機器學習的興起」兩次浪潮后,即將迎來「解釋性和通用人工智慧技術」的第三次浪潮。而實現和推動AI研究的核心技術正是當下最熱門的機器學習(Machine Learning)。

教育領域在人工智慧研究浪潮的影響和滲透下,也正發生改變。一方面,人工智慧和學習科學相結合形成新領域——教育人工智慧(Educational Ar­tificial Intelligence,EAI),其核心目標是「通過計算獲得精準和明確的教育、心理和社會知識形式,這些知識往往是隱式的」。知識以學習者模型、領域知識模型和教學模型等形式呈現,演算法是獲得這些知識的核心技術。目前,已有大量教育人工智慧系統被應用於學校,這些系統整合了教育人工智慧和教育數據挖掘(Educational Data Mining,EDM)技術(如,機器學習演算法)來跟蹤學生行為數據,預測其學習表現以支持個性化學習。

另一方面,以智慧教育引領教育信息化的創新發展,從而帶動教育教學的創新發展,已成為信息時代的必然趨勢。個性化學習作為智慧教育的核心要素,如何通過技術更好地支持和促進個性化學習的開展,已經成為智慧教育研究領域的訴求。目前,個性化學習的實踐應用主要集中於自定步調學習、個別化指導和學習內容自適應等方面,但在整個學習過程中尚未實現差異化的學習服務,主要原因在於技術的發展尚不能充分滿足個性化學習的需求。

美國2017國家教育技術計劃《重塑技術的教育角色》,在學習部分指出:在移動數據收集工具和在線協作平台的支持下,能夠為所有學生獲得個性化學習服務提供機遇;在領導力部分指出:個性化學生學習將作為有效領導力的核心關注領域之一,技術能夠為學生提供個性化學習路徑;在測評部分指出:形成性和總結性評價數據的收集和整合,能支持學習者生成個性化數字學習體驗,以及教師制定教學干預和決策。由此可見,收集和整合大量的、不同源的數據支持實現個性化學習是必然趨勢,而人工智慧技術的應用將是實現這些數據價值最大化的關鍵。

機器學習作為人工智慧領域最核心、最熱門的技術,能夠基於大量數據的自動識別模式、發現規則,預測學生學習表現,為滿足智慧教育和個性化學習的需求提供了可能。目前,國內外尚未有研究對機器學習的教育應用進行系統梳理。為此,我們試圖通過全方位地梳理機器學習教育應用的發展現狀、潛力和進展、面臨的挑戰等,為研究者和教育者開展智慧教育和個性化學習提供一定的理論和實踐依據。

二、機器學習的概念梳理

(一)機器學習的定義

機器學習是人工智慧和數據挖掘中最重要也是最熱門的演算法。國外有些學者對機器學習進行了定義,Mitchell認為,機器學習是對能通過經驗自動改進的計算機演算法的研究[10];Alpaydin認為,機器學習是指利用數據或以往的經驗,以此優化計算機程序的性能標準[11]。由此可知,機器學習是通過經驗或數據來改進演算法的研究,旨在通過演算法讓機器從大量歷史數據中學習規律,自動發現模式並用於預測。換句話說,機器學習即機器從數據中學習,其處理的數據越多,預測就越精準。

(二)機器學習的兩大階段

機器學習的發展可以分為兩個階段:淺層學習(Shallow Learning) 和深度學習(Deep Learing)。

1、淺層學習

20世紀80年代末期,用於人工神經網路的反向傳播演算法(也稱為Back Propagation演算法或者BP演算法)[12]的出現,拉開了淺層學習的帷幕。利用BP演算法可以讓人工神經網路模型從大量樣本中學習出規律,並進行預測。但是,淺層學習模型依靠人工經驗來抽取樣本的特徵,往往要求開發人員挖掘出好的特徵。

2、深度學習

2006年,加拿大多倫多大學教授、機器學習領域的泰斗Hinton和學生Salakhutdinov在上Science發表文章Reducing the Dimensionalitg of Data with Neural Networks[13],翻開了深度學習的新篇章。隨後,深度學習在學術界持續升溫,目前有多所知名高校紛紛加入深度學習的研究。與淺層學習模型依賴人工經驗不同,深層學習模型通過構建機器學習模型和海量的訓練數據,來學習更有用的特徵,從而最終提升分類或預測的準確性。2013年4月,深度學習技術被《麻省理工學院技術評論》(MIT Technology Review)雜誌列為2013年十大突破性技術(Break­through Technology)之首[14]。

(三)機器學習的發展現狀

機器學習的研究主要分為基於小數據和大數據環境下兩類。一般而言,小數據指的是基於內存的數據。基於小數據環境下的機器學習通常被認為是傳統的機器學習,研究問題主要包括理解並模擬人類的學習過程、研究計算機系統和人類用戶之間的自然語言介面、針對不完全的信息進行推理的能力、構造可發現新事物的程序[15]。而隨著感測器和連接設備的廣泛使用,每年都有數百「澤位元組」(ZettaByte,簡稱ZB,)數據產生[16],可見,大數據時代已經來臨。一般而言,大數據是無法裝載進內存的數據,如何從複雜、真實、凌亂和無模式的大數據中挖掘出對人類有用的知識,是目前迫切需要解決的問題,也是大數據時代下機器學習面臨的挑戰。目前,大數據環境下的機器學習研究主要包括大數據分治策略與抽樣、特徵選擇、分類、聚類和關聯分析等[17]。

三、機器學習與智慧教育的適切性

技術中介的智慧教育已經成為教育信息化的新境界、新訴求[18],通過構建技術融合的學習環境,讓教師能夠施展高效的教學法,讓學習者能夠獲得適宜的個性化學習服務和美好的發展體驗,是智慧教育的核心目標[19]。在智慧教育環境中,學習者的數據被收集形成教育大數據,迫切需要智能化手段挖掘這些數據,以發現潛在模式和知識來支持智慧教育的創新發展。機器學習的本質是使用計算機從大量數據中學習規律,自動發現模式並用於預測。因此,機器學習助力智慧教育深度理解學習者的學習是確定無疑的。

(一)作用對象和環境

機器學習方法的作用對象是教育數據,包括學習者與教育系統交互產生的所有數據,以及人口統計、情感、協作和管理數據等,這些數據源來自不同的教育環境。Romero和Ventura認為,教育環境可以分為傳統教育環境和基於計算機的教育環境[20];Papamitsiou和Economides認為,教育環境包括虛擬學習環境(Virtual Learning Environment,VLE)和學習管理系統(Learning Management System,LMS)、MOOCs和社會性學習、基於網路的教育、認知導師系統、基於計算機的教育、多模態和移動環境[21]。

我們認為,智慧教育環境可以分為傳統教育環境和網路教育環境,如圖1所示。

傳統教育環境一般基於學校或課堂。根據數據存儲的不同,可分為封閉式教學環境和開放式教學環境。其中,封閉式教學環境指單機版、在本地部署的教學平台或桌面版應用,數據存儲於內存;開放式教學環境指基於網路的遠程教育平台(受控環境,用來收集學習者和活動數據),數據存儲於網路空間。

網路教育環境分為開放式教學環境和非正式社會性教育環境,其中,非正式社會性教育環境是指基於智能終端(如,PC、移動終端等)和以自主學習為主的學習環境,數據存儲於網路空間。從數據的角度看,封閉式教學環境是教育小數據環境,開放式教學環境和網路教育環境是教育大數據環境。

(二)作用過程

機器學習一般作用於教育數據挖掘過程。教育數據挖掘涉及開發、研究和應用計算機方法在收集的大量教育數據中檢測模式,是教育與數據挖掘的融合。數據挖掘技術最早於1995年應用於教育領域,拉開了教育數據挖掘研究的帷幕,此後逐漸發展成為獨立的研究領域。教育數據挖掘涉及的學科主要包括教育學、計算機科學和統計學[22],如圖2所示。其中,機器學習作為計算機科學和統計學的融合,為教育數據挖掘提供了強有力的技術支持。

在教育數據挖掘過程中,機器學習主要作用於數據挖掘和解釋部分,實現傳統教育中缺少或人工難以完成的功能,通過對數據進行自動化分析來發現未知的新知識和模式,如圖3所示。

其中,在數據解釋部分,機器學習方法通過建立預測模型(Predictive Model)和描述模型(Descriptive Model)分析教育數據來發現模式和知識。預測模型通過已知的數據預測未知的數據,例如,通過分析學生的成績來預測學習表現;描述模型通過分析數據發現新的模式或結構。

知識是機器學習的發現,主要分為原理類、實踐類和優化類知識[23]。其中,原理類知識旨在驗證或修正現有的教育理論,例如,發現新的學習規律;實踐類知識旨在幫助教師開展教學實踐,例如,預測學生表現和成績;優化類知識旨在改進學習系統的效果和性能,例如,通過分析學習者知識提高系統的自適應能力。這些知識將最終反饋給教育系統進行迭代循環,以促進和改善學習。

(三)作用方法

目前,應用於教育領域的機器學習方法有很多,例如,分類、回歸、聚類、文本挖掘、異常檢查、關聯規則挖掘、社會網路分析、模式發現和序列模式分析等[24-26]。其中,預測和聚類是目前最熱門的。

1、預測(Prediction)

預測旨在開發一個模型,從數據其他方面的集合(預測變數)中,推斷數據的一個單一方面(被預測變數)。簡言之,就是從已知事件推測未知事件的過程。在教育應用中,常用的預測方法是分類(Classi­fication)和回歸(Regression),一般用來預測學生的表現和檢測學生行為。

(1)分類:一般用於預測學生的學習表現,常用演算法有決策樹、隨機森林、角色規則、逐步回歸和邏輯回歸等。例如,Lauria等使用邏輯回歸、支持向量機和C4.5決策樹等機器學習方法分析了不同數據源的學生數據集[27];Thammasiri等使用邏輯回歸、決策樹、神經網路和支持向量機等機器學習技術對七年的學生學習數據進行分析,來預測新生是否會在第二學期繼續學習[28]。

(2)回歸:一般用於分析學習行為與學習表現之間的關係,常用演算法有線性回歸和回歸樹等。例如,Kotsiantis採用回歸演算法分析學生在線提交作業的評分數據和學生的關鍵人口特徵數據,來預測學生的學習表現[29];Hachey等採用二元邏輯回歸演算法分析學生在線課程記錄及其GPA,來預測學生能否完成在線課程[30]。

2、聚類(Clustering)

聚類通常用於發現數據集中事先未知的常見分類。在教育應用中,通常用來基於學生學習和交互模式對學生分組或對相似的課程材料分組。例如,Yanto等基於使用屬性變精度的近似值的精度均值,論證了使用變精度粗糙集模型對焦慮學生進行聚類的適用性[31];Aher和Lobo採用聚類演算法和關聯規則挖掘,對Moodle課程的學習記錄進行聚類和分析,然後向學習者推薦合適的課程[32]。

(四)利益相關者與目標

我們通過梳理文獻發現,機器學習教育應用的利益相關者包括學習者、教育者、教育管理者、教育研究者和開發人員(課程或軟體)等,如表1所示。其中主要目標體現在:支持學習者開展個性化學習,通過學習行為分析預測和可視化反饋,提高學習者的學習表現;支持教育者掌握整體和個體學生的學習情況,自動獲得實時客觀的教學反饋,促進教學表現的改善;支持教育管理者制定決策,提供客觀全面的教育反饋;支持教育研究者和開發人員更精準地評估和維護教育系統和在線課程。

綜上可知,機器學習方法能夠自動從大量數據中提取隱含的、未知的、卻潛在有用的信息和知識,支持智慧教育教師開展智能化教學和學生進行個性化學習。因此,機器學習應用於智慧教育是適合的,也是必要的。

四、機器學習教育應用的潛力與進展

如前文所述,機器學習屬於數據挖掘的分析技術,而數據挖掘技術最早於1995年應用於教育領域。由此推論,機器學習教育應用的研究於1995年拉開序幕。同時,通過文獻梳理髮現,教育數據挖掘的研究成果在2000年前僅有7篇[33],其具有代表性的文獻綜述主要集中於2009-2010年前後[34-36],這一階段的教育數據挖掘研究正接近青春期[37]。因此,從2010年起至今的國外基於真實數據的機器學習以教育應用案例研究成果為主,我們通過對機器學習技術在教育數據挖掘青春期階段的研究進展及其教育應用的潛力進行梳理,以期為教育者、教育研究者和開發人員等在智慧教育中的應用提供理論和實踐指導。 其中,機器學習教育應用概念圖如圖4所示。

我們通過對文獻梳理髮現,機器學習教育應用主要集中在學生建模、學生行為建模、預測學習表現、預警失學風險、學習支持和評測以及資源推薦等方面(見表2)。

1、學生建模

學生建模是創建和維護學生模型模塊的過程,學生模型模塊主要負責學生當前知識狀態模型的開發和維護,旨在對學生的誤解和次優表現做出假設,以便教師能夠指出並建議修正。學生建模包括學生模型和診斷模型,學生模型存儲學生知識的數據結構,診斷模型執行診斷過程並更新學生模型。其中,領域模型是學生模型的基礎。例如,Yudelson等通過使用自動化方法提取領域模型來支持大學生編程語言的學習,在解決程序練習的過程中對學生知識進行建模,以支持系統推薦下一個解決問題。該研究所用的數據來自某大學三門程序入門課程的代碼快照數據,處理方法主要基於兩點:在每個程序提交之後,使用程序語言的內在結構來建模知識;使用一組測驗自動測試程序的正確性。該研究選擇Null模型和Rasch模型用於學生建模,並使用AFM模型結合PC演算法對學生學習建模。研究發現,PC演算法的使用能夠提高AFM模型對過濾概念列表的精準度。

貝葉斯知識跟蹤作為一種用戶建模方法,常被應用於智能教學系統。例如,Eagle等在傳統貝葉斯知識跟蹤模型中插入學生個體參數,基於學生的活動數據,來預測其在智能教學系統中學習和表現的個體差異權重。該方法的優點是,如果個體差異權重在學生開始使用系統前能被賦值,將更容易集成入智能教學系統。研究中的學生活動數據包括閱讀表現數據和概念知識預備測試數據,其中,閱讀表現數據包括閱讀時間和重訪文本頁面(與元認知自我監管技能有關);概念知識預備測試數據包括預備測試的準確性、問題變化和任務完成時間。研究結果得到了四組最佳匹配的個體差異權重和三個貝葉斯知識跟蹤模型的變體模型。研究發現,學生閱讀文本的數據在智能教學系統中對於預測學習和表現非常有用。

類似的,Baker等採用貝葉斯知識跟蹤和線性回歸等方法構建學生模型,對學生在特定問題步驟中已獲得技能的可能性進行檢測。研究基於232名中學生的數學課程數據,主要分為兩步建模:使用標準貝葉斯知識跟蹤結合數據和貝葉斯定理來預測學生知識,生成可能性的標籤;訓練模型,使用更廣泛的特徵集來預測標籤數據。

2、學生行為建模

學生行為建模是分析學生表現、排除潛在的誤區、呈現學生目標和計劃、確定先驗和獲得的知識、保持情景記憶,以及描述個性特徵等的過程。機器學習方法能夠支持學習行為的自動檢測、識別和建模,旨在通過描述或預測模式行為讓系統適應學習者的偏好傾向。例如,Doleck等使用機器學習方法來挖掘學習環境中與診斷推理的過程、結果相關的學習者行為,其中,隱馬爾可夫模型用於問題解決的行為熟練指標建模,文本分類演算法用於分析學習者的案例總結報告,這些演算法的應用描述了不同問題解決階段的學習者行為,旨在為系統的維護提供設計指導。

類似的,Huang等使用歸納推理(基於相似的學習)、演繹推理(基於解釋的學習)和類比推理(案例推理)等多策略機器學習構建了黑板多策略機器學習模型,學習和發現學生學習過程中不一致行為的屬性。根據這些屬性,智能教學系統可以採取適當的方法防止學生不一致行為的再次發生,例如,加強教學和實踐。

Wen和Rosé提出通過點擊流分析確定學生的行為模式,以便為學生搜索信息和在線學習提供更有效的個性化支持。該研究分析了與課程成功高低有關的學生習慣性行為,以及情境信息對會話的影響。通過挖掘學生單個會話的習慣性行為,描述了MOOCs中的會話類型,採用局部6元模型對學習會話進行建模,以支持系統自動分配學習活動和活動序列。

也有研究對學生的分心行為進行了分析,例如,等提出使用機器學習模型來支持智能教學系統自動檢測學生的分心行為,數據來源於12名國小生行為記錄的日誌文件,方法採用最小二乘法和脊回歸演算法。該研究發現,結合時間、表現和滑鼠移動等特徵的模型對檢測分心行為最有用,而考慮學生的個性化也能提高檢測的有效性;同時發現,使用脊回歸演算法的模型比使用標準最小二乘法的表現更佳。

3、預測學習表現

預測學習表現,一般包括預測學生的最終分數或學術表現等,主要影響因素包括人口特徵、分數(平時測驗和最終成績)、學生學檔、多模能力、學生參與、活動的註冊和參與以及情緒情感狀態等。有些研究通過分析學生數據直接預測學習結果。例如,使用機器學習回歸演算法,對學生少量寫作任務的分數和學生的關鍵人口特徵數據進行分析,以預測學生的成績。研究實驗分為兩個階段,其中,訓練階段使用收集的數據來訓練演算法;測試階段使用收集的10組數據來檢測演算法的精確度。

San Pedro等將學生知識、學生情感和行為的細粒度模型,應用於3747名學生的數據分析來理解學生學習的發展和投入,以預測學生能否考上大學。該研究開發了一個邏輯回歸模型,並且發現,學生投入和學生成功的特徵組合作為預測指標,可以辨別出將考入大學的學生。

類似的,Hachey等使用二元邏輯斯蒂回歸演算法,對962名學生的先前在線課程結果和GPA進行分析,來預測學生完成在線課程的成功率。其中,先前在線課程結果和GPA作為自變數,在線課程成功率作為因變數。在二元邏輯斯蒂回歸模型中,GPA作為連續變數。該研究結果發現,先前在線學習體驗作為預測指標比GPA能更好地預測成功率。

也有研究對學習表現的影響因素進行了分析。Firmin等米用邏輯回歸,基於三門MOOCs課程分析了學生及格與學習努力程度和個人基本特徵的相關性。該研究採用二元邏輯斯蒂回歸演算法,發現學生的努力變數是學生及格唯一有效的預測指標,如,登錄次數、學習時長和完成作業情況等,與學生基本特徵無關,如,性別、年齡和家庭收入等。

4、預警失學風險

綴學率一直是教育管理領域的重要指標。機器學習方法能夠對學生數據特徵進行分析和歸類,分析學生綴學原因,預測綴學行為。雖然教育管理部門存有大量的學生數據,但是由於缺乏適當的數據或受數據隱私性限制,預警失學的定量研究相對較少。

例如,Thammasiri等和Lauía等基於大量的真實學生數據對學生的學術成功展開了研究。其中,Thammasiri等使用機器學習技術對長達七年、特徵豐富的真實學生數據進行分析,來預測新生是否會在第二個學期註冊繼續學習。該研究比較了不同的數據平衡技術來提高少數類的預測準確度,其中包括過抽樣演算法、欠抽樣演算法和合成少數類過抽樣演算法,並連同邏輯回歸、決策樹、人工神經網路和支持向量機等四種流行的分類方法,構建預測模型來進行比較。研究結果發現,支持向量機結合合成少數類過抽樣演算法數據平衡技術是表現最佳的分類器,三個數據平衡技術都能提高少數類的預測準確度。在開發的模型中應用靈敏度分析,能夠為學生流失的準確預測識別出最重要的變數。這些模型的應用能夠預測高危學生,開發有效的干預方法來減少學生的失學率。

類似的,Lauría等使用數據挖掘方法檢測學生的學術危機來提高大學生的保留率。該研究的數據挖掘模型基於監督式學習技術,用來區分表現好和不好的學生。研究的方法框架包括收集數據、轉化數據、分割數據、平衡訓練數據、構建預測模型和使用測試數據評價模型。在構建預測模型階段,該研究方法選用了三個分類器作比較:邏輯回歸、支持向量機和C4.5決策樹。數據來自四個不同數據源的3877條記錄:學生履曆數據和課程相關數據、課程管理事件數據和Sakai成績單數據。研究結果發現,邏輯回歸和支持向量機演算法比C4.5決策樹能夠更精準地分類。

人口統計和學習成績是預測學生綴學的重要數據。例如,Aulck等採用機器學習方法跟蹤32500名學生收集成績數據和人口統計數據,使用邏輯回歸正則化、k最近鄰演算法和隨機森林等方法來預測輟學變數,並對學生數據中預測輟學的最佳要素進行了檢測。研究結果發現,邏輯回歸正則化相比另外兩種演算法能夠提供最有力的預測,並檢測出學生流失的個人預測指標,包括數學、英語、化學和心理學課程的GPA以及入學和出生年月等。

5、學習支持和評測

學習支持和反饋是増強在線教育系統個性化和定製化的關鍵。在學習者與系統交互的過程中,學習支持提供個性化學習服務提高學習表現,或者糾正學生的學習誤區。前者是「先發制人」,後者是「亡羊補牢」。例如,Ahadi等將機器學習方法和大學生編程過程中的源代碼快照數據相結合,讓系統能夠在課程入門第一周,就精準地檢測出高表現和低表現的學生。該研究首先對特徵進行了抽取和選擇,然後選擇最精確的分類器來檢測預測模型。其中,選取了貝葉斯(樸素貝葉斯、貝葉斯網路)、規則學習者(決策表、連接規則和PART)和決策樹(AD樹、J48、隨機森林和決策樹)等分類器進行評估,發現決策樹分類器的整體準確度最高,而在決策樹中隨機森林的預測準確度最高,因此,選擇隨機森林作為分類器來評價學生的表現。

Xing等結合學習分析和教育數據挖掘方法,基於小數據來預測學生在CSCL學習環境中的表現,從而為學生提供相應的教學干預。該研究使用活動理論來整體量化環境中的學生參與情況,並得到六個特徵變數,然後使用遺傳規劃技術來構建預測模型。結果顯示,基於遺傳規劃的模型是可解釋的,並且與傳統建模演算法相比預測率得到優化。

對學習者的領域知識獲取、技能發展和完成結果,以及反思、探究和情緒等的監控和評價,也是機器學習研究的重要主題。例如,Kinnebrew和Biswas使用探索性數據挖掘方法,從學生的交互軌跡中評測和比較學生的學習行為。其中,核心方法結合迭代行為抽象和逐段線性分割,迭代行為抽象是區別識別頻繁活動模式的序列挖掘技術,逐段線性分割是關於評估表現或進展衡量的活動階段。研究結果發現,高表現和低表現學生具有不同的閱讀行為模式和監控行為。

6、資源推薦

資源推薦通過分析學習者學習記錄來預測學習者的喜好,為學習者推薦最合適的資源(內容、活動或服務)或資源序列。其最大的特徵是通過分析學習者的行為,來「猜」學習者的表現和興趣,並生成個性化推薦,旨在幫助學習者選擇感興趣的課程、科目、學習材料和學習活動等。例如,等使用機器學習方法構建編程學習系統的推薦模型,能夠自動地適應學習者的興趣和知識水平。系統通過測試學習者學習風格和挖掘服務日誌,來識別學習風格和學習者習慣的不同模式。研究首先基於不同的學習風格處理集群,然後,通過AprioriAll演算法挖掘頻繁序列,分析學習者的習慣和興趣,最後,系統根據頻繁序列的等級推薦個性化學習內容。

Wang和Liao設計了一個基於不同學生特徵推薦個性化教學內容的英語自適應學習系統。系統的核心技術是人工神經網路(ANN),並選擇ANN的BP演算法用於學生特徵和學習表現的監督聚類分類。該研究應用了一個四步核心方法來構建每個學生的特徵與辭彙、語法和閱讀的學習表現的關係,方法步驟包括構建學生特徵和學習表現的關係、獲得所有不同特徵組合的學習表現、設置α-截和不同學習表現水平的α-截,以及為不同學生特徵組合設置教學

內容的不同等級。該方法支持系統根據學生的性別、性格和學習焦慮程度等特徵,來適應、推薦不同層次的學習內容。

同樣,Aher和Lobo發現聚類和關聯規則演算法等數據挖掘技術可用於課程推薦系統,系統能夠基於其他學生在Moodle選擇的課程來為學生推薦相關課程。該研究發現,使用樸素K均值聚類技術和Apriori關聯規則演算法的綜合方法,無需經曆數據準備階段,而且關聯規則的數目還更多。課程推薦系統能夠根據學生的興趣,幫助學生選擇適當的課程組合。

(二)典型應用:個性化自適應學習平台

個性化學習是指優化學習步調和教學方法來滿足每位學習者需求的教學[58]。基於學習者的需求,學習目標、教學方法和教學內容是不同的,並且對於學習者來說,學習活動是有意義且相關的,是受興趣驅動且經常是自我發起的。智慧教育的發展目標之一就是為學習者提供個性化學習服務,體現學生的差異化,改變傳統教育一刀切的局面。

根據前文的梳理可知,機器學習能夠結合學生的知識、行為和情緒等有效地支持個性化自適應學習平台的構建。其中,在知識維度,機器學習支持學生建模,能夠對每個學生的知識進行建模和跟蹤,支持生成形成性評價,為學習者推薦自適應的課程和資源。在行為維度,機器學習支持學習行為建模,根據學生不同學習表現的行為模式對學生自動分組,提供相應的學習支持;通過分析學習歷史(如,活動日誌、學習結果等)和人口特徵等數據,來預測學生的學習表現和成績。在情感維度,機器學習能夠發現學習者情緒狀態與學習行為、結果的相關性,從而根據學生的情緒狀態推薦課程資源。

目前,Knewton、DreamBox、ALEKS、Gooru等個性化自適應學習平台,結合機器學習技術已經得到了廣泛應用。其中,Knewton作為目前影響力最大的自適應學習平台,能夠為學習者提供自適應學習體驗和預測分析,來提高學生的學習成就。在技術層面,平台使用機器學習方法作為核心技術,構建了分析引擎和推薦引擎,分析引擎結合內容數據和學生響應數據實時地對學生能力進行推斷,然後,推斷結果與學生學習結果結合,支持預測學生的學習表現,從而為學習者生成下一步的個性化學習路徑。

隨著收集的數據越來越多,基於機器學習的推薦引擎和分析引擎模型和參數會不斷修改與更新,讓預測更加精準。Knewton在學習過程中主要提供三種工具和三種核心服務,其中,工具包括個別化指導、預測分析和學習報告;服務包括為學生提供個性化推薦、為教師和學生提供分析、為應用和內容創建者提供內容解讀。通過使用Knewton自適應學習平台,學生的通過率、退出率、提早完成率均有顯著變化。

五、機器學習應用於智慧教育的幾點建議

機器學習作為人工智慧的核心技術作用於教育大數據,將幫助我們更好地理解數據、信息、知識與智慧之間的關係。但機器學習教育應用在技術方面尚不成熟,在教育框架下也沒有規模化。因此,基於智慧教育框架,對機器學習的教育應用提出以下建議:

(一)跨界方面——支持智慧教育與機器學習的融合創新

1、機器學習與智慧教育的跨界融合

機器學習與智慧教育的融合存在跨界問題。一般情況下,懂教育的未必懂技術,懂技術的則未必深度理解教育。這就容易導致技術人員對數據挖掘結果無法從教育的本質出發進行解讀,而教育者無法從技術的角度對機器學習應用提出準確需求,對預測結果也無法充分理解。因此,研究教育領域與機器學習和人工智慧領域如何深度融合非常必要。例如,加大兩個領域人員的合作、交流和協同開發等;在高校中加大機器學習與學習科學的跨學科人才培養;目前,利用可視化技術開發人機界面,可有效幫助教育者理解機器學習和人工智慧系統,以促進跨領域深度融合。可視化學術交互平台也能支持教育領域人員更好地理解機器學習,例如,谷歌日前聯手OpenAI等發布了一個交互視覺化期刊平台Distill(http://distill.pub/),支持讀者理解機器學習的研究成果。

2、機器學習應用的教學場景提煉

機器學習助力智慧教育發展的潛力和價值是毋庸置疑的,但目前缺少機器學習教育應用的成熟案例,尤其是在不同教學場景中的應用,這將是機器學習應用發展的一大短板。機器學習雖然本身具有智能性,但是也具有一定局限性,尤其表現為容易被複雜的場景所迷惑,人們可能很容易完成的場景分析,對於機器來說卻依舊困難。如果一直強調機器學習技術本身,而不直接面向教育應用提供整體的解決方案,隨著技術壁壘越來越低,其教育應用的未來價值可能會越來越小。因此,基於智慧教育框架梳理和提煉機器學習不同教學場景應用的案例,將有助於體現機器學習的教學應用價值。

(二)技術方面——支持智慧環境的技術創新

1、教育大數據治理

教育大數據是機器學習應用研究的基礎,其大量的、複雜的和凌亂的特點,給數據的採集和存儲帶來了難度。同時,在數據共享方面通常涉及數據隱私和倫理問題,如何保護人們隱私又最大化地合理利用數據支持科學研究,也是當前面臨的挑戰。因此,需要協同多方開展教育大數據治理,以提升教育數據質量、保障數據合理使用、保護數據隱私安全,以及促進數據合法共享。例如,建立健全的教育大數據治理模式,制定教育數據質量標準和管理規範,規範化採集和匯聚、共享不同平台的數據,形成智慧教育數據中心等。

2、數據標準化

在機器學習應用之前,通常使用標準化之後的數據進行分析,數據標準化是支撐機器學習應用和發展的重要基礎。因此,為了實現數據標準化,需要對智慧環境技術架構進一步作頂層設計和研究,以考慮數據標準化,以及不同工具和平台之間的兼容性。智慧環境的技術架構應該融合學習內容、軟體和平台等支持系統集成和資源共享,以開放標準和相關服務(網路服務和應用編程介面)為中心,制定統一的數據交換標準,實現低成本、敏捷無縫整合和數據交換。

(三)教學方面——支持智慧教學法的方法創新

1、提升教師素養

機器學習作為一種新型技術,容易造成教師對新型機器學習支持的教育軟體和服務的用戶體驗不佳,原因在於教師信息素養與此類新型軟體的不匹配。使用新型軟體加重了教師的工作負載,如何將其與現有的教學進行整合,對教師來說也是一大挑戰。因此,一方面需要不斷提升教師的信息素養來適應新型技術的應用,另一方面在軟體開發過程中需要考慮教師的需求,幫助教師更容易地接受新型技術並融入教學中。

2、提高教師參與

機器學習常應用於智能教學系統中,而這類系統通常會弱化教師的參與,學習者根據自己的學習步調就能開展學習。從短期來看,智能化推送減少了學習者的認知負載;但從長遠來看,過度依賴系統建議,學習者自我反省、自我意識和自主學習的能力將不斷弱化。雖然機器學習應用能夠實現智能化和自動化,但是教師能為學生提供情感交互、學習輔導和教學法設計,這是機器學習目前無法實現的。因此,應該強調機器學習應用系統與教師的協作而非取代教師來優化效能。在應用過程中需要不斷提高教師的參與並激發其積極性,從而與系統優勢互補、共同參與,促進教學法的創新。

綜上所述,機器學習可以有效助力智慧教育,其在教育人工智慧和教育數據挖掘方面發揮的作用也是其他技術無法取代的。隨著機器學習技術的不斷發展和應用,其與教育領域的融合定會不斷推動教育創新。

本文轉載自MOOC



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦