近日,幼升小的一系列考試題引起廣泛關注,原因是這些題竟是出給學生家長的。
5月6日上午,有網民反映,上海民辦陽浦國小和青浦世界外語學校在學生面談過程中,讓家長做起了調查問卷,其中包含智商測試題和父母三代信息的收集。雖然陽浦隨即作出聲明,說家長可自由選擇填或不填,做問卷調查的目的是為了尋找教學規律等,但其用意之一或許就是,根據家長智商的測試情況幫助自己選擇更優秀的生源。
此類行為的背後隱藏著「遺傳決定論」思想。該理論幾乎忽略了環境、教育、後天努力等作用,將天生的智商看作單一的等級量表,且不可改變。這就意味著,人一生下來,社會階層便是固定的。此外,背離智商測試初衷的使用,更是值得我們反思。
美國著名進化論科學家斯蒂芬·傑伊·古爾德在《人類的誤測:智商歧視的科學史》一書中,便詳細梳理了智商測試相關研究的歷史脈絡及其社會影響,剖析了對智商測試背離初衷的誤用現象,並用事實和論據對這一行為進行了嚴密的反駁。
比奈首創智商測試表
拒絕把IQ視作對孩子排序的手段
當巴黎大學心理學研究室主任阿爾弗雷德·比奈首次決定研究智商測量時,他順理成章地關注保羅·布洛卡的研究(用測量顱骨大小的方法分析人的智力,認為被測者的智力和他們的腦容量之間的關係是真實存在的——編者注)。
阿爾弗雷德·比奈(1857-1911),法國實驗心理學家、智力測驗的創始人。
但5項關於學齡兒童頭骨的調查研究,動搖了他最初的堅定信念。比奈來到不同的學校,讓老師選出最聰明和最愚笨的學生,並用布洛卡建議的方法,對這些學生的頭部進行了測量。他寫道:「我深受其他科學家研究的影響,並帶著這樣一種觀點開始研究,即智力上的優越性與腦容量的優越性緊密相關。」
在研究中,比奈發現了差異,但這些差異微不足道。比奈說:「帶著在聰明人和一般人的腦容量之間尋找差異的目的去做頭部測量,我擔心這會導致我在測量中無意識而又真心實意地增加聰明人的腦容量,而減少一般人的腦容量。」 他意識到,當偏見潛藏而科學家卻都相信自己的客觀性時,就會存在較大的潛在危險性。
1904年,比奈受公共教育部長委託,開展了一項有特定目的的研究:尋找一種可以識別在普通課堂上未能取得成功的孩子的方法,以表明這些孩子需要某種特殊形式的教育。比奈採取了一種完全務實的方式。他彙集了一系列與日常生活相關的簡單任務,據說這也涉及一些基本的推理過程,比如指導才能、理解力、創造力、批評(改正)。像閱讀等學習過的技能,不會直接出現在測試中。
上海幼升小家長測試題之一
比奈給每個年齡段都分配了對應的任務,每項任務都是這個年齡段年紀最小、擁有正常智商的孩子能夠順利完成的。參加比奈測試的孩子,從最小年齡段的任務開始,按照順序依次進行測試,直到不能再完成任何任務為止。能夠完成的最後一項任務對應的年齡,就是孩子的「智力年齡」,而其整體智力水平,則通過真實年齡減去智力年齡得到。如果某個孩子的智力年齡遠低於實際年齡,那麼就會被認為是需要接受特殊教育的。這樣,比奈完成了教育部交給他的任務。1912年,德國心理學家 W. 斯特恩指出,應該用智力年齡除以實際年齡來計算智力水平,而不是從實際年齡中減掉智力年齡,智商或者說IQ就這樣誕生了。
比奈的確想在自己的測量中「區分天生智力和後天教育」,然而,除了想要消除學校知識對測試的影響這個明顯願望之外,比奈拒絕界定或推斷每個孩子所得分數的意義。比奈宣稱,智力是一個很複雜的概念,不能僅僅通過一個數字說清楚。這個數字,後來被叫作IQ,只是一個粗略的東西,完全根據經驗的指導而得出,並出於一個有限的實用目的而創立:確切地說,這個量表並不能用來測量智力,因為智力特性是不能疊加的,因此不能像測量平面那樣測量智力。
比奈不僅拒絕把IQ標記為先天智力,還拒絕把它視作一種可以對所有孩子按照智力價值排序的常規手段。他設計量表只是基於有限的目的,即為了完成教育部委託的任務,為了識別他們(需要特殊教育的孩子),方便讓他們得到幫助和提高,而不是為了給他們貼個標籤並限制他們的發展。
總的說來,比奈在使用自己的測試時堅持了三項基本原則。然而,後來美國的遺傳論者忽略了他的所有警告,並且推翻了他的意圖。他們把比奈量表翻譯成書面形式,並作為一種測量所有孩子的常規方法。比奈的三項原則包括:
1.分數是一個實用數值,它們不支持任何智力理論。它們不能表明任何先天或者永恆的東西。我們不能說它們測量的東西就是「智力」,或者是其他任何具體存在的實體。
2.這種測量只是粗略的、經驗主義的引導,目的是識別輕度弱智和無學習能力的需要特殊幫助的孩子。它不是對正常孩子劃分等級的方法。
3.不論這些需要幫助的孩子存在困難的原因是什麼,重點應該放在通過特殊訓練而使其得到提高。低分不能作為孩子天生低能的標誌。
比奈量表被誤用
IQ被確立為排列人類社會等級的指標
如果遵循了比奈的原則,並且確保按照他所設想的方式使用測試,我們這個世紀可能就會免遭一次嚴重的科學誤用。
智力測試的誤用主要是由兩個謬論引起的:具化論謬誤和遺傳論謬誤,它們被那些想利用測試維持自己社會地位和優越感的人熱切擁護。遺傳論的謬誤主要存在於以下兩個錯誤暗示中:
1.把「遺傳的」等同於「必然的」。對一個生物學家來說,遺傳性指某些特徵或傾向通過基因傳遞而沿著家族線路傳播。他們很少提及這些特徵受環境影響的程度和範圍。基因沒有創造我們身體的點點滴滴。此外,即使一種特徵建立或確定了,環境干預仍然可以修正遺傳缺陷。數百萬美國人通過配戴眼鏡矯正了天生的視力缺陷。全面教育可以提高我們在通俗意義上所謂的「智力」,認為IQ具有多少比例的「遺傳性」與這種觀點並不衝突。有些遺傳的低智商也許可以通過適當的教育得到很大程度的提高,而有些也許不可以。然而,它僅有的遺傳事實並不能推斷任何結論。
2.種群內和種群間的遺傳困惑。遺傳學理論產生的主要政治影響,不是從推測的遺傳測試中產生的,而是來自邏輯上的無效擴展。 通過傳統的方法,比如對比親屬的分數,或者分別對比收養的孩子與生物學和法律意義上的父母的分數而進行的IQ遺傳性研究,屬 於「種群內」類型——也就是說可以在一個單一相關的人種內部評 估遺傳性。有個普遍的謬誤構成了這樣的假設, 即如果遺傳性能夠解釋種群內部個體間存在的某種差異,它也就能在同種程度上解釋種群間平均智商存在的差異——例如白人和黑 人。但是,種群內部的個體差異與種群間的平均差異,是完全相互獨立的現象。對其中一方的研究,並不能用來評測另一方。
亨利·戈達德(1866-1957),美國變態及臨床心理學家,優生學的早期提倡者,認為智力落後德原因主要是遺傳因素。
亨利·戈達德是第一個在美國普及比奈量表的人。他把比奈的文章翻譯成英文,並應用和推廣他的測試技術。測試能夠很好地辨認處於正常智力範圍之下的人群——也就是戈達德新命名的傻瓜。在這一點上,戈達德與比奈實一致的。但他們的相似之處也僅此而已。比奈拒絕把測試分數定義為「智力」,並希望通過識別而為孩子提供幫助。戈達德則認為,這些分數是對天生的、單一實體的測量。他希望通過辨識而認定界限,隔離群體,並為了阻止處於危險境地的美國血統繼續惡化(這種威脅來自外來移民在國內廣泛繁育的弱智人群)而主張剝奪外來移民的生育權。
想想為輕度智障設定的普通數值所涉及的情況吧:普遍低下的智力障礙,因局部神經損壞造成的特定學習障礙,環境劣勢,文化差異,以及測試者的敵意等等。想想可能存在的潛在原因吧:功能模式的遺傳,非家族遺傳的基因突變,母親孕期疾病導致的先天性大腦損傷,胎兒及嬰兒期營養不良等等。但對戈達德來說,智力年齡在8到12歲之間的所有人都是傻瓜,都應該用大致相同的方式對待:接受謹慎的制度化管理,為了讓他們高興而滿足他們的部分要求,而最重要的是,阻止他們繁育後代。
戈達德進行調研時拍攝的,住在新澤西松林荒地的卡里卡克家族成員照片。為了製造邪惡或愚蠢的外表,戈達德對照片進行了處理,突出了被拍攝者的嘴巴和眉毛。
戈達德把比奈表引介到美國,但特曼才是最早普及它的設計師。1916年,特曼把比奈量表擴展到「優秀的年輕人」,並把任務增加到了90項。特曼當時已是斯坦福大學的教授,於是給自己的修訂版起了一個新名稱——斯坦福-比奈量表,這個詞成了所有後續「IQ」測試的標準。
特曼在1923年的廣告這樣寫道:如果學校採用以下測試,在30分鐘內進行的5個測試將會顯示孩子的一生。他說,弱智在社會中是無能為力的,他們不僅在經濟上,而且在其他方面,都是一種負擔而非一種資產,因為他們有成為少年犯或者罪犯的傾向。
大眾智力測試的一份廣告,使用的是有特曼和耶基斯參與編寫的考試題。
借著第一次世界大戰的契機,羅伯特·耶基斯在軍隊中進行了超大規模的智力測試,讓IQ在美國完全建立。在一戰期間,耶基斯作為上校軍官,對175萬新兵做了智力測試。有文化的新兵做一種筆試,叫作軍隊阿爾法測試。文盲和在阿爾法測試中失敗的人做一種圖像測試,叫軍隊貝塔測試。在貝塔測試中失敗的人會應召做一種個人測試,通常是比奈量表的某個版本。軍隊心理學家會為每人確定一個等級,按照A到E的順序排列(每個等級又增設「+」「—」等級),並為他們在軍中的恰當位置提出建議。耶基斯認為,C-等級的士兵被看作「低於平均智力——普通二等兵」。D等級的士兵「基本不適合擔任需要特殊技巧、前瞻深謀或保持警惕的任務」。D和E等級的士兵不能「閱讀或理解書面的指令」。
軍隊測試在某些領域產生了強烈的影響,並伴隨耶基斯的概要統計報告被進行了普遍宣傳。當時是耶基斯助理、後來成為著名心理學家的波林從檔案中挑出16萬個案例而構建的數據,在20世紀20年代產生了遺傳論的重重回響,持續影響著美國的社會政治生活。這種影響直到現在還未得到完全改變。
本文內容整合自《人類的誤測》第五章,由出版方授權使用,有刪減。整合與編輯:張進。未經授權不得轉載。