search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

托福考試電腦評分(e-Rater)究竟是如何工作的?

托福考試有一部分是用機器評分,托福考試電腦評分(e-Rater)究竟是如何工作的?為了幫助大家熟悉托福電腦評分機制,請看下文,希望對大家托福備考有所幫助。更多精彩盡請關注新東方在線托福網!

電腦評分(e-Rater)究竟是如何工作的?

電腦評分這個概念,很早就已經運用於寫作考試中,這並非什麼新興產物。自從2010年1月開始,iBT的寫作評分系統就進行了調整。由原來的2個評分員評分,取算術平均分作為raw score原始分,改為1個評分員和1個電腦評分系統(e-Rater)評分,取算術平均分作為原始分的方式。

儘管之後也有很多出題機構也學習了這種評分方式,但是最終都因為評分效果不理想而最終放棄,這也正是很多人對ETS的電腦評分質疑的原因。但是在本次ETS的培訓中,幾乎每一位ETS的官方人員都會不斷地提及Human Scoring & Automated Scoring的概念。想必大家也能猜想到結果了,ETS對於利用電腦評分的操作是樂此不疲的,而且對於評分的結果是極度信任的。

其實來到ETS之前,我對電腦評分這件事情也是心存顧慮的,總擔心這樣的評分方式不夠智能,會過於機械化地得出結果。但是當我們來到ETS聽完專家的講解后,我明白了ETS利用電腦評分的意義所在。

一方面,我們之前對於電腦評分的認識並不夠全面,總是覺得僅僅是利用一些具有糾錯功能的軟體來進行評分。而真正意義上的e-Rater更像是一個基於強大數據系統支持的一個運算系統,它能夠將輸入的文章內容和資料庫裡面的內容進行比照式批閱,這樣就極大地增強了閱卷評分的靈活度和廣泛度。而ETS作為全球最大的測試服務機構,他有著得天獨厚的優勢,那就是它每年都能夠積累大量的文章數據,而且能夠不斷進行更新迭代,這能使得他的電腦評分系統的智能化不斷地提升。相比而言,其他測試機構的電腦評分系統卻虛有其表,沒有大量數據內核作為支持,所以自然無法得到一個理想的評分效果。

另一方面,電腦評分有著它獨特的優勢,那就是具備足夠的客觀性。它不存在閱卷的疲憊度,永遠能夠關注每一個評分標準,考慮到文章中的每一個細節和每一個特徵;它沒有情緒,所以也就不存在主觀映像,對於同一篇文章永遠只會給出一個不變的分數;它能對於每一篇文章所給出的分數都能給出具體的解釋,這是人為評分無法做到的。

對於托福考試而言,關於語言輸出部分的口語和寫作兩個項目都會涉及到電腦評分,而且評分結果是計入到真實成績的。只不過算分方法並不是機械地將評分員評分和電腦評分進行求平均計算。我們其實可以更形象地把他們理解成為分工協作,聯合判分。

首先,E-Rater負責Linguistic的部分,關注的是文章的邏輯、語法、用法、架構、辭彙等要素,而人工負責內容和含義的理解,他們在評分目標上各有分工。其次,閱卷人和電腦是獨立判分,他們彼此看不到對方的分數。當兩者的分差介於動態區間值時分數有效,判分結束;當兩者的分差大於動態區間值時,人工評分和電腦評分均無效,將會引入新的判分組進行重新評分。如果仍然判分無效,將會指定給ETS官方閱卷人主管直接判分,但這種情況很少出現。



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦