《心理與教育測(cè)量》考試大綱
心理測(cè)量圍繞心理量表這個(gè)核心主要分為測(cè)驗(yàn)理論和測(cè)驗(yàn)應(yīng)用兩大部分。學(xué)習(xí)理論部分內(nèi)容時(shí),應(yīng)對(duì)每部分涉及的知識(shí)點(diǎn)進(jìn)行整理和歸納,以系統(tǒng)的觀點(diǎn)來(lái)學(xué)習(xí)和運(yùn)用相關(guān)知識(shí)。這一部分中測(cè)驗(yàn)的編制更體現(xiàn)了學(xué)習(xí)的系統(tǒng)性,編制的各個(gè)環(huán)節(jié)都是相扣的,一定要聯(lián)系起來(lái)掌握,并且需要把握每個(gè)環(huán)節(jié)需要注意的問(wèn)題,在實(shí)際操作中能減少一些誤差的產(chǎn)生。這部分中信度、效度、項(xiàng)目區(qū)分度的計(jì)算是重點(diǎn),考生需要掌握幾個(gè)常用的公式,理解它們的適用范圍。而心理測(cè)量理論的新發(fā)展我們可以適當(dāng)了解,不必深究。
心理測(cè)驗(yàn)的應(yīng)用部分主要是心理測(cè)驗(yàn)在實(shí)際中的應(yīng)用??忌鷳?yīng)在學(xué)習(xí)中關(guān)注各類(lèi)測(cè)驗(yàn)的定義、特點(diǎn)、編制、實(shí)施和解釋的內(nèi)容。尤其對(duì)一些經(jīng)典的測(cè)驗(yàn)要熟練掌握。總體來(lái)說(shuō)這部分內(nèi)容既非考查的重點(diǎn),同時(shí)識(shí)記難度也不大。
總之,這兩部分中,測(cè)驗(yàn)理論是重點(diǎn),信度、效度的分析,常模參照測(cè)驗(yàn)與標(biāo)準(zhǔn)參照測(cè)驗(yàn)、測(cè)驗(yàn)的制作過(guò)程等重在理解。各種測(cè)驗(yàn)主要是了解每種測(cè)驗(yàn)中有代表性的幾種著名量表。同時(shí)特別強(qiáng)調(diào)的是測(cè)驗(yàn)部分很可能會(huì)考察它的應(yīng)用方面,所以不僅要再認(rèn)和記憶其中的細(xì)節(jié),也要注意對(duì)其應(yīng)用方面的思考和練習(xí)。
第一章 心理與教育測(cè)量概述
第一節(jié) 心理與教育測(cè)量的相關(guān)概念
一、測(cè)量的概念:依據(jù)一定的法則使用量具對(duì)事物的特征進(jìn)行定量描述的過(guò)程。
二、任何測(cè)量都必須具備兩個(gè)基本要素:參照點(diǎn)和測(cè)量的單位。其中參照點(diǎn)分為絕對(duì)參照點(diǎn)和相對(duì)參照點(diǎn)。
三、測(cè)量的量表:能夠使事物的特征數(shù)量化的數(shù)字的連續(xù)體就是量表。
量表可以分為四種:①命名量表:用數(shù)字代表事物或用數(shù)字對(duì)事物進(jìn)行分類(lèi)。命名量表又分為名稱(chēng)量表(用數(shù)字指代個(gè)別事物)和類(lèi)別量表(用數(shù)字指代事物種類(lèi))。
②順序量表:按照事物的大小,等級(jí),程度而排列數(shù)字的量表。
③等距量表:不僅能夠指代事物的類(lèi)別,等級(jí)而且具有相等的單位。等距量表的數(shù)字是一個(gè)真正的數(shù)量,這個(gè)數(shù)量中各個(gè)部分的單位是相等的。因此可以對(duì)其進(jìn)行加減運(yùn)算。等距量表沒(méi)有絕對(duì)的零點(diǎn)。它的零點(diǎn)是人們假定的相對(duì)零點(diǎn)。對(duì)于等距量表的兩個(gè)數(shù)不能進(jìn)行乘除運(yùn)算。
④比率量表:除了具有類(lèi)別、等級(jí)、等距的特征外,還有絕對(duì)的零點(diǎn)。
四、影響測(cè)量精確的因素
1、測(cè)量對(duì)象本身的性質(zhì)。①確定型(物體的長(zhǎng)度)。②隨機(jī)型(人的短時(shí)記憶容量)③模糊型,即事物本身的量是模糊不定的(人的性格特征)
2、測(cè)量的精確度取決于測(cè)量工具的精確性。
3、根據(jù)測(cè)量的性質(zhì)和不同的特點(diǎn),可以將不同形式的測(cè)量大致分為4種類(lèi)型。
①物理測(cè)量:及對(duì)事物物理特征的測(cè)量。長(zhǎng)度,重量等。
②生理測(cè)量:對(duì)機(jī)體生理特征的測(cè)量。如對(duì)動(dòng)植物各種化學(xué)成分含量的測(cè)量。
③社會(huì)測(cè)量:即對(duì)社會(huì)現(xiàn)象的測(cè)量,如人口普查。
④心理測(cè)量:對(duì)人的心理特征的測(cè)量。如智力、人格測(cè)量。
第二節(jié) 心理與教育測(cè)量的性質(zhì)
一、心理與教育測(cè)量的定義:依據(jù)一定的心理學(xué)和教育學(xué)原理,使用測(cè)驗(yàn)對(duì)人的心理特質(zhì)和教育成就進(jìn)行定量描述的過(guò)程。
其獨(dú)特的性質(zhì):①心理與教育測(cè)量依據(jù)的法則在很大程度上只是一種理論,很難達(dá)到如同物理測(cè)量依據(jù)的法則那樣普遍被人們接受的水平。② 心理與教育測(cè)量的對(duì)象是人的心理特質(zhì)和教育成就。③心理與教育測(cè)量的量具是有關(guān)領(lǐng)域的專(zhuān)家編制,經(jīng)過(guò)長(zhǎng)期的試用,修訂,完善而逐漸形成的標(biāo)準(zhǔn)化測(cè)驗(yàn)。他的編制是一門(mén)高度專(zhuān)門(mén)化的系統(tǒng)工作。④心理與教育測(cè)量的目標(biāo)雖然是對(duì)人的心理特質(zhì)和教育成就進(jìn)行定量分析,但這種定量分析的精確度遠(yuǎn)不及物理測(cè)量的精確度高。
二、心理與教育測(cè)量的理論基礎(chǔ):
①人的心理現(xiàn)象和知識(shí)水平如同其他一切物理現(xiàn)象一樣是有差異的,有質(zhì)的差異也有量的差異。因?yàn)橛胁町?,所以要測(cè)定差異的數(shù)量,描述差異的程度。②心理特質(zhì)和知識(shí)水平雖然不是物理實(shí)體,不能直接測(cè)量,卻必然表現(xiàn)于人的外部行為之中,并調(diào)節(jié)著人的外部行為。因此,通過(guò)觀測(cè)人的外部行為的差異就有可能測(cè)量出人的心理特質(zhì)和知識(shí)水平的差異。③教育和心理測(cè)量的準(zhǔn)確性和可靠性如同其他一切測(cè)量技術(shù)一樣是相對(duì)的,如同其他一切測(cè)量技術(shù)一樣是科學(xué)技術(shù)的進(jìn)步發(fā)展而逐步提高。
三、心理與教育測(cè)量中的測(cè)驗(yàn)
測(cè)驗(yàn):由有關(guān)領(lǐng)域的專(zhuān)家經(jīng)過(guò)長(zhǎng)期的編制、試用、修訂、完善而逐漸形成的標(biāo)準(zhǔn)化測(cè)量工具。
編制一個(gè)測(cè)驗(yàn)應(yīng)當(dāng)具備4個(gè)基本條件:
①行為樣本(被抽取出來(lái)的,作為直接測(cè)量對(duì)象的行為就是行為樣本)
②標(biāo)準(zhǔn)化。分為:測(cè)驗(yàn)內(nèi)容標(biāo)準(zhǔn)化、施測(cè)條件標(biāo)準(zhǔn)化(相同的指導(dǎo)語(yǔ),相同的測(cè)驗(yàn)情景,相同的測(cè)驗(yàn)時(shí)限)、評(píng)分規(guī)則的標(biāo)準(zhǔn)化、測(cè)驗(yàn)常模的標(biāo)準(zhǔn)化。
③難度或應(yīng)答率。
④信度和效度。
第三節(jié) 心理及教育測(cè)量的種類(lèi)及其功能
一、心理及教育測(cè)驗(yàn)的種類(lèi)
1、按測(cè)驗(yàn)功能所作分類(lèi):智力測(cè)驗(yàn) 能力傾向測(cè)驗(yàn) 成就測(cè)驗(yàn) 人格測(cè)驗(yàn)
2、按測(cè)驗(yàn)對(duì)象所做的分類(lèi):個(gè)別測(cè)驗(yàn) 團(tuán)體測(cè)驗(yàn)
3、按測(cè)驗(yàn)內(nèi)容的形式所做的分類(lèi):文字(紙筆)測(cè)驗(yàn) 非文字(操作)測(cè)驗(yàn)
4、按測(cè)驗(yàn)?zāi)康淖龅姆诸?lèi):描述性測(cè)驗(yàn) 診斷性測(cè)驗(yàn) 預(yù)測(cè)性測(cè)驗(yàn)
5、按測(cè)驗(yàn)的難度和時(shí)限做的分類(lèi): 難度測(cè)驗(yàn)與速度測(cè)驗(yàn)
6、按測(cè)驗(yàn)的要求分類(lèi):最高作為測(cè)驗(yàn) 典型作為測(cè)驗(yàn)
7、按測(cè)驗(yàn)的性質(zhì)分類(lèi):構(gòu)造性測(cè)驗(yàn) 投射性測(cè)驗(yàn)
8、按測(cè)驗(yàn)的標(biāo)準(zhǔn)化程度分類(lèi):標(biāo)準(zhǔn)化測(cè)驗(yàn) 非標(biāo)準(zhǔn)化測(cè)驗(yàn)
9、按評(píng)價(jià)所參照的標(biāo)準(zhǔn):常模參照測(cè)驗(yàn) 目標(biāo)參照測(cè)驗(yàn) 潛力參照測(cè)驗(yàn)
10、按測(cè)驗(yàn)的運(yùn)用領(lǐng)域分類(lèi):教育測(cè)驗(yàn) 職業(yè)測(cè)驗(yàn) 臨床測(cè)驗(yàn)
二、心理與教育測(cè)量的功能
(一)理論研究功能:①收集研究資料 ②建立和檢驗(yàn)理論假設(shè) ③實(shí)驗(yàn)分組
(二)實(shí)際應(yīng)用功能:①選拔人才 ②人員安置 ③心理診斷 ④描述評(píng) ⑤心理咨詢(xún) ⑥預(yù)測(cè)
第二章 心理與教育測(cè)量的誤差
第一節(jié) 測(cè)量誤差的定義及分類(lèi)
一、誤差的定義:在一切測(cè)量中,由于各種因素的影響,測(cè)量所得的觀測(cè)值并不準(zhǔn)確地等于被測(cè)之量的真值。二者之差稱(chēng)為測(cè)量誤差。指在測(cè)量過(guò)程中,那些與測(cè)量目的無(wú)關(guān)的因素所導(dǎo)致的測(cè)量結(jié)果不準(zhǔn)確或不一致的測(cè)量效應(yīng)。
二、誤差的種類(lèi):根據(jù)測(cè)量誤差的性質(zhì)來(lái)源,測(cè)量誤差可分為系統(tǒng)誤差和隨機(jī)誤差。
第二節(jié) 測(cè)量誤差的來(lái)源及控制
一、測(cè)量誤差的來(lái)源
常見(jiàn)的影響測(cè)驗(yàn)誤差的因素主要有三方面:測(cè)驗(yàn)工具、施測(cè)過(guò)程、測(cè)量對(duì)象。
(一)測(cè)驗(yàn)工具
測(cè)驗(yàn)自身的誤差主要來(lái)源于測(cè)驗(yàn)的編制過(guò)程,其中項(xiàng)目取樣影響最大。測(cè)驗(yàn)所要測(cè)量的內(nèi)容是什么,測(cè)驗(yàn)的項(xiàng)目能否代表這些內(nèi)容,是至關(guān)重要的。當(dāng)測(cè)驗(yàn)的項(xiàng)目較少而取樣缺乏代表性時(shí),被試的反應(yīng)很難代表其真實(shí)水平。對(duì)于有些類(lèi)型的項(xiàng)目,例如是非題、選擇題,被試可能憑猜測(cè)作答,從而降低分?jǐn)?shù)的可靠性。此外,題目用詞模棱兩可,或?qū)σ髷⑹霾磺宓?,也都?huì)帶來(lái)誤差。
(二)施測(cè)過(guò)程
在測(cè)驗(yàn)的實(shí)施過(guò)程中可能引起誤差的因素很多,如測(cè)試環(huán)境、時(shí)間、主試因素、意外干擾、評(píng)分記分等。
(三)測(cè)驗(yàn)對(duì)象
在測(cè)量工作中,最復(fù)雜的和最難控制的是由被試本身引起的各種誤差。測(cè)驗(yàn)中被試的應(yīng)試動(dòng)機(jī)、被試的焦慮、測(cè)驗(yàn)經(jīng)驗(yàn)、練習(xí)效應(yīng)、反應(yīng)傾向和生理變因等因素都會(huì)帶來(lái)誤差。
二、測(cè)量誤差的控制
要想控制誤差,就必須使測(cè)驗(yàn)標(biāo)準(zhǔn)化,即測(cè)驗(yàn)的編制、施測(cè)、評(píng)分、解釋都必須標(biāo)準(zhǔn)化,控制導(dǎo)致誤差的因素,減少誤差,使測(cè)驗(yàn)分?jǐn)?shù)更可信、有效。保證有效性和準(zhǔn)確性程度。
第三章 心理與教育測(cè)量的信度
第一節(jié) 信度概述
一、信度的定義
信度的描述定義
指測(cè)驗(yàn)結(jié)果的一致性或穩(wěn)定性,其測(cè)量定義為一組測(cè)量分?jǐn)?shù)的真變異數(shù)與總變異數(shù)(實(shí)得變異數(shù))的比率,含義是在實(shí)得分?jǐn)?shù)的變異中有多大比例是由真分?jǐn)?shù)的變異決定的。
rxx=S2T/S2x
二、信度系數(shù)的估計(jì)(種類(lèi))
①重測(cè)信度:
a.求法是對(duì)同一批被試運(yùn)用某個(gè)測(cè)驗(yàn)實(shí)施首測(cè),相隔一段時(shí)間后對(duì)它進(jìn)行再測(cè),然后計(jì)算首測(cè)與再測(cè)所得分?jǐn)?shù)的相關(guān)(一般是積差相關(guān)),即得重測(cè)信度。這種信度能表示兩次測(cè)驗(yàn)結(jié)果有無(wú)變動(dòng),反映測(cè)驗(yàn)分?jǐn)?shù)的穩(wěn)定程度,故又稱(chēng)穩(wěn)定性系數(shù)。
b.優(yōu)點(diǎn):能提供有關(guān)測(cè)驗(yàn)結(jié)果是否隨時(shí)間而變異的資料,可作為預(yù)測(cè)受測(cè)者將來(lái)行為表現(xiàn)的依據(jù)。
c.缺點(diǎn):易受練習(xí)和記憶的影響,前后兩次施測(cè)間隔的長(zhǎng)短必須適度。如果相隔時(shí)間太短,則記憶猶新,練習(xí)的影響較大;如果相隔時(shí)間太長(zhǎng),則身心的發(fā)展與學(xué)習(xí)經(jīng)驗(yàn)的累積等都足以改變測(cè)驗(yàn)分?jǐn)?shù)的意義,而使相關(guān)降低。另外,第一次嘗試所發(fā)現(xiàn)的錯(cuò)誤也可能導(dǎo)致第二次反應(yīng)的變化而增加誤差變異。
d.誤差來(lái)源:時(shí)間的不同所帶來(lái)的隨機(jī)影響,如氣候、偶然的噪音或其他干擾,以及引起被試本身身心狀態(tài)變化的因素如疾病、疲勞、情緒類(lèi)型、焦慮等。重測(cè)信度代表測(cè)驗(yàn)成績(jī)能夠應(yīng)用于不同時(shí)間的程度,信度越高,受測(cè)驗(yàn)環(huán)境中日常的隨機(jī)因素的影響越小。 由于測(cè)驗(yàn)的穩(wěn)定性系數(shù)受時(shí)間和其他各種因素的影響,故任何一個(gè)測(cè)驗(yàn)都可有不止一個(gè)重測(cè)信度系數(shù)。所以在測(cè)驗(yàn)手冊(cè)中報(bào)告此種信度時(shí)應(yīng)說(shuō)明時(shí)間間隔以及在此間隔中被試的有關(guān)經(jīng)歷,如受過(guò)何種教育訓(xùn)練、心理治療以及有何學(xué)習(xí)經(jīng)歷等。
②復(fù)本信度:
兩個(gè)平行測(cè)驗(yàn)測(cè)量同一批被試所得結(jié)果的一致性程度,其大小等同一批被試在兩個(gè)復(fù)本測(cè)驗(yàn)上所得分?jǐn)?shù)的皮爾遜積差相關(guān)系數(shù)。
a.求法是先運(yùn)用同一測(cè)驗(yàn)的一型或A型施測(cè),隨后在最短的時(shí)間內(nèi)運(yùn)用二型或B型進(jìn)行再測(cè),然后再求它們得分的相關(guān)系數(shù)。
b.誤差來(lái)源:測(cè)驗(yàn)兩種形式是否等值:測(cè)題取樣是否匹配,格式是否相同,內(nèi)容、題數(shù)、難度、平均數(shù)、標(biāo)準(zhǔn)差是否一致。再就是被試方面情緒波動(dòng)、動(dòng)機(jī)變化等,以及測(cè)驗(yàn)情境的變化,偶發(fā)因素的干擾。這些都會(huì)引起測(cè)量誤差。在報(bào)告復(fù)本信度時(shí),也應(yīng)說(shuō)明兩次施測(cè)的間隔,以及在此間隔內(nèi)被試的有關(guān)經(jīng)歷。
③內(nèi)部一致性信度 估計(jì)內(nèi)部一致性系數(shù)的方法通常有兩類(lèi):一類(lèi)是分半法,另外一類(lèi)方法需要對(duì)項(xiàng)目反應(yīng)的方差或協(xié)方差進(jìn)行分析。
a.分半法是將一個(gè)測(cè)驗(yàn)分裂為兩個(gè)假定相等而獨(dú)立的部分,然后計(jì)算這兩部分的記分的相關(guān)系數(shù)(一般是以項(xiàng)目的奇數(shù)為一組,偶數(shù)為另一組),繼而再用斯皮爾曼-布朗公式來(lái)估計(jì)整個(gè)測(cè)驗(yàn)的信度(斯-布公式要求兩半的變異數(shù)相等)。
缺點(diǎn):把測(cè)驗(yàn)劃分成兩半的方法實(shí)際上有多種,而每一種劃分方法產(chǎn)生的估計(jì)都有差別,因此用分半法得到的信度估計(jì)值不具備惟一性。
b.克朗巴赫α系數(shù)
適用于非0,1記分的一種內(nèi)在一致性系數(shù),計(jì)算公式為:
c.除了以上兩種方法,還有庫(kù)德-理查遜公式(只適合于0、1記分的題目);荷伊特信度;因素分析等方法。有些測(cè)量學(xué)家認(rèn)為因素分析是決定測(cè)驗(yàn)同質(zhì)性的最好方法。
因素分析方法最初是由心理學(xué)家斯皮爾曼在研究智力理論時(shí)提出來(lái)的,后來(lái)發(fā)展成為一種復(fù)雜的統(tǒng)計(jì)技術(shù),用于確定一組變量間的相互關(guān)系最少需要幾個(gè)因素來(lái)解釋。在測(cè)驗(yàn)上,如果一個(gè)因素就足以解釋所有題目分?jǐn)?shù)的變異時(shí),這個(gè)測(cè)驗(yàn)就是同質(zhì)的,假如需要一個(gè)以上的因素時(shí),則測(cè)驗(yàn)的組成是異質(zhì)的。
d.內(nèi)在一致性信度的優(yōu)點(diǎn):只需施測(cè)一次,就可以估計(jì)信度系數(shù),省時(shí)節(jié)力。另外用內(nèi)在一致性系數(shù)一般要比重測(cè)信度、復(fù)本信度所算出的信度系數(shù)高。
e.不足之處:求分半信度時(shí),分半的方法不同,估計(jì)出的信度系數(shù)就不同。而且,測(cè)驗(yàn)須要求具有同質(zhì)性。所以項(xiàng)目異質(zhì)的人格測(cè)驗(yàn),通常就不能用內(nèi)在一致性系數(shù)來(lái)估計(jì)信度。
④評(píng)分者信度
隨機(jī)抽取相當(dāng)份數(shù)的試卷,由兩位評(píng)分者按記分規(guī)則分別給分。然后根據(jù)每份試卷的兩個(gè)分?jǐn)?shù)計(jì)算其相關(guān)系數(shù),即得評(píng)分者信度。一般要求在成對(duì)的、受過(guò)訓(xùn)練的評(píng)分者之間平均一致性達(dá)到0.90以上,才認(rèn)為評(píng)分是客觀的。
綜上所述,信度高低是用相關(guān)系數(shù)表示的。不同的測(cè)驗(yàn)內(nèi)容,對(duì)相關(guān)系數(shù)的要求有所不同。一般說(shuō)來(lái),標(biāo)準(zhǔn)智力測(cè)驗(yàn)應(yīng)達(dá)到0.85以上,個(gè)性測(cè)驗(yàn)和興趣測(cè)驗(yàn)一般應(yīng)達(dá)0.70~0.80水平。學(xué)業(yè)成就測(cè)驗(yàn)要求信度在0.90以上,才能被稱(chēng)為是一個(gè)良好的測(cè)驗(yàn)。
第二節(jié) 信度的影響因素及提高信度的方法
信度與誤差變異之間有密切的關(guān)系。誤差變異越大,信度愈低。凡被試、主試、測(cè)驗(yàn)內(nèi)容和施測(cè)情境等各個(gè)方面能引起隨機(jī)誤差而導(dǎo)致分?jǐn)?shù)不一致的因素,都會(huì)降低測(cè)驗(yàn)的信度。
1、被試方面——身心健康狀況、動(dòng)機(jī)、注意力、持久性、求勝心、作答態(tài)度等。
2、主試方面——不按規(guī)定實(shí)施測(cè)驗(yàn),制造緊張氣氛,給予特別協(xié)助,評(píng)分主觀等。
3、 測(cè)驗(yàn)內(nèi)容方面——試題取樣不當(dāng),內(nèi)部一致性低,題數(shù)過(guò)少,題意模糊等。
4、 施測(cè)情境方面——測(cè)驗(yàn)現(xiàn)場(chǎng)條件,如通風(fēng)、溫度、光線(xiàn)、噪音、桌面好壞、空間闊窄等。
5、 除此之外,還有以下幾個(gè)因素會(huì)影響信度系數(shù)的大小: ①被試樣本 影響信度系數(shù)的一個(gè)重要因素是用來(lái)確定信度的被試團(tuán)體的特性。 ②團(tuán)體的異質(zhì)性(公式)如同所有相關(guān)系數(shù)一樣,信度系數(shù)受分?jǐn)?shù)的分布范圍影響,而分?jǐn)?shù)范圍與被試團(tuán)體的異質(zhì)程度有關(guān)。一個(gè)團(tuán)體越是異質(zhì),其分?jǐn)?shù)范圍越大。而一個(gè)經(jīng)過(guò)篩選、相對(duì)同質(zhì)的團(tuán)體分?jǐn)?shù)則較為均勻。③團(tuán)體的平均水平 信度系數(shù)不僅受被試樣本的個(gè)體差異程度的影響,而且受被試團(tuán)體的平均水平的影響。這是因?yàn)椋瑢?duì)于不同水平的團(tuán)體,題目具有不同的難度。每個(gè)題目在難度上的微小差異累積起來(lái)便會(huì)影響信度。由于信度系數(shù)與被試樣本的異質(zhì)程度和平均水平有關(guān),因此在編制測(cè)驗(yàn)時(shí),應(yīng)把常模團(tuán)體按年齡、性別、文化程度分為更同質(zhì)的亞團(tuán)體,并分別報(bào)告每個(gè)亞團(tuán)體的信度系數(shù),這樣測(cè)驗(yàn)才能適用于各種團(tuán)體。④題目的數(shù)量(公式) 題目的數(shù)量(亦即測(cè)驗(yàn)的長(zhǎng)度)也是影響信度系數(shù)的一個(gè)因素。一般說(shuō)來(lái),在一個(gè)測(cè)驗(yàn)中增加同質(zhì)的題目,可以使信度提高。因?yàn)樵黾訙y(cè)驗(yàn)的長(zhǎng)度可以加大分?jǐn)?shù)范圍。這里要注意一點(diǎn),只有當(dāng)新題目是與原題目選自同一總體,即與原題目具有同質(zhì)性時(shí),增長(zhǎng)測(cè)驗(yàn)才能改進(jìn)信度。⑤測(cè)驗(yàn)難度 測(cè)驗(yàn)的難度與信度間沒(méi)有簡(jiǎn)單的關(guān)系。然而,若測(cè)驗(yàn)對(duì)某團(tuán)體太難或太容易,則分?jǐn)?shù)范圍將縮小,從而使信度降低。這表明,要使信度達(dá)到最高,能產(chǎn)生最廣分?jǐn)?shù)分布的難度水平方為合適。 ⑥間隔時(shí)間以再測(cè)法或復(fù)本法求信度,兩次測(cè)驗(yàn)相隔時(shí)間越短,其信度系數(shù)越大;間隔時(shí)間越久,其他變因介入的可能性越大,受外界的影響也越多,信度系數(shù)便越低。
第四章 心理與教育測(cè)量的效度
第一節(jié) 測(cè)量的效度概述
一、效度的定義
1、 效度的測(cè)量定義:與測(cè)量目標(biāo)有關(guān)的真變異數(shù)與總變異數(shù)的比率,含義是在一組測(cè)驗(yàn)分?jǐn)?shù)中,有多大的比例是由測(cè)驗(yàn)所要測(cè)量的目標(biāo)引起的。
2、描述定義:效度是指一個(gè)測(cè)驗(yàn)或量具能夠測(cè)量出其所要測(cè)量目標(biāo)的程度。
第二節(jié) 效度的種類(lèi)和估計(jì)方法
一、測(cè)驗(yàn)的效度分為三大類(lèi):內(nèi)容效度、構(gòu)想效度、效標(biāo)效度。
(一)內(nèi)容效度(表面效度)
內(nèi)容效度指的是測(cè)驗(yàn)題目對(duì)有關(guān)內(nèi)容或行為范圍取樣的適當(dāng)性。這種測(cè)驗(yàn)的效度主要與測(cè)驗(yàn)內(nèi)容有關(guān),所以叫內(nèi)容效度,指測(cè)驗(yàn)題目在要測(cè)量的行為領(lǐng)域的代表性。內(nèi)容效度的評(píng)估方法主要應(yīng)用于對(duì)學(xué)績(jī)測(cè)驗(yàn)的評(píng)估。
一個(gè)測(cè)驗(yàn)要有內(nèi)容效度必須具備兩個(gè)條件:要有定義得完好的內(nèi)容范圍;測(cè)驗(yàn)題目應(yīng)是所界定的內(nèi)容范圍的代表性取樣。測(cè)驗(yàn)題目并不需要包羅該范圍的所有材料,而只需包含測(cè)驗(yàn)編制者認(rèn)為是重要的材料。 確定內(nèi)容效度的方法主要有專(zhuān)家判斷、統(tǒng)計(jì)分析、經(jīng)驗(yàn)法等。
a.專(zhuān)家判斷
為了確定一個(gè)測(cè)驗(yàn)是否具有內(nèi)容效度,最常用的方法是請(qǐng)有關(guān)專(zhuān)家對(duì)測(cè)驗(yàn)題目與原定內(nèi)容范圍的符合性做出判斷。
b.統(tǒng)計(jì)分析
內(nèi)容效度可由一組被試在獨(dú)立取自同樣內(nèi)容范圍的兩個(gè)測(cè)驗(yàn)復(fù)本上得分之相關(guān)來(lái)作數(shù)量的估計(jì)。若相關(guān)低,說(shuō)明二者至少有一個(gè)缺乏內(nèi)容效度;若相關(guān)高,一般可推論測(cè)驗(yàn)有內(nèi)容效度。
c.經(jīng)驗(yàn)法
檢查不同年級(jí)的學(xué)生在測(cè)驗(yàn)上的得分和在每個(gè)題目上的反應(yīng)情況。一般說(shuō)來(lái),測(cè)驗(yàn)總分和題目通過(guò)率隨年級(jí)而提高,便是測(cè)驗(yàn)具有內(nèi)容效度的證據(jù)。
(二)構(gòu)想效度
構(gòu)想效度就是測(cè)驗(yàn)對(duì)某一理論概念或特質(zhì)測(cè)量的程度。研究和考察構(gòu)想效度要回答三個(gè)問(wèn)題:一個(gè)測(cè)驗(yàn)測(cè)量什么心理構(gòu)想,對(duì)這構(gòu)想測(cè)得有多好,測(cè)驗(yàn)分?jǐn)?shù)中有多少比例的變異數(shù)是來(lái)自測(cè)驗(yàn)所要測(cè)的構(gòu)想。 確定構(gòu)想效度的方法主要分為測(cè)驗(yàn)內(nèi)方法、測(cè)驗(yàn)間方法。 a.測(cè)驗(yàn)內(nèi)方法主要是通過(guò)研究測(cè)驗(yàn)內(nèi)部構(gòu)造來(lái)界定所測(cè)量的構(gòu)想的范圍。如確定測(cè)驗(yàn)的內(nèi)容效度,分析被試對(duì)題目作反應(yīng)的過(guò)程,考察測(cè)驗(yàn)的同質(zhì)性等方式。 b.測(cè)驗(yàn)間是通過(guò)研究幾個(gè)測(cè)驗(yàn)間的相互關(guān)系,找出他們的共同特點(diǎn),進(jìn)而推斷出所測(cè)的共同特質(zhì)是什么,便可確定這些測(cè)驗(yàn)是否有構(gòu)想效度。如確定相容效度、區(qū)分效度、因素分析效度等方式。
(三)效標(biāo)效度
效標(biāo)效度又稱(chēng)實(shí)證效度,指一個(gè)測(cè)驗(yàn)對(duì)處于特定情景中的個(gè)體的行為進(jìn)行預(yù)測(cè)時(shí)的有效性,也就是對(duì)于研究者所感興趣的行為能夠預(yù)測(cè)得怎么樣。其中,被預(yù)測(cè)的行為是檢驗(yàn)測(cè)驗(yàn)效度的標(biāo)準(zhǔn),簡(jiǎn)稱(chēng)效標(biāo)。確定效標(biāo)效度的方法主要有相關(guān)法、區(qū)分法、命中率和功利率等。
a.相關(guān)法 最常用來(lái)建立實(shí)證效度的方法是求測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)測(cè)量間的相關(guān),所得到的數(shù)量指標(biāo)稱(chēng)作效度系數(shù)。在測(cè)驗(yàn)手冊(cè)中,一般用它來(lái)報(bào)告測(cè)驗(yàn)對(duì)每種效標(biāo)的效度。計(jì)算效度系數(shù)最常用的是積差相關(guān)法。
b.區(qū)分法 第二個(gè)決定效度的方法是看預(yù)測(cè)源的分?jǐn)?shù)是否可區(qū)分由效標(biāo)測(cè)量所定義的團(tuán)體。
c.命中率(公式)
當(dāng)測(cè)驗(yàn)用來(lái)作取舍的根據(jù)時(shí),其有效性的指標(biāo)就是正確決定的比例(總命中率)。(正命中率和總命中率)
d.功利率
為了確定測(cè)驗(yàn)的功效,人們還常常對(duì)使用測(cè)驗(yàn)所花掉的費(fèi)用與得到的利益進(jìn)行比較,看是否利大于弊。這種效度指標(biāo),叫功利率。
第三節(jié) 效度的影響因素與改進(jìn)
影響測(cè)驗(yàn)效度的因素很多,在編制測(cè)驗(yàn)或選擇標(biāo)準(zhǔn)化測(cè)驗(yàn)時(shí),都應(yīng)該考慮到這些因素,以免影響測(cè)驗(yàn)結(jié)果的有效性。
①測(cè)驗(yàn)本身的因素
a.測(cè)題中所用詞匯和句型不能過(guò)于困難。測(cè)題中的詞匯和句型應(yīng)適于被試的文化水平。 b.試題的意思應(yīng)該清楚。題意含糊,容易產(chǎn)生歧義,以致被試產(chǎn)生誤解也會(huì)降低測(cè)驗(yàn)的效度。 c.所編制的測(cè)題應(yīng)該適合所要測(cè)量的學(xué)習(xí)結(jié)果。 d.測(cè)題中不能提供額外線(xiàn)索。若測(cè)題為被試提供了額外線(xiàn)索,就無(wú)法確認(rèn)測(cè)題是否真正測(cè)量到了所欲測(cè)量的學(xué)習(xí)結(jié)果。 e.測(cè)題的編制要合理。一般地,測(cè)題以由易到難的順序排列。f.選擇題的正確答案不能有明顯的組型。如果測(cè)驗(yàn)正確答案的位置有明顯的規(guī)律,學(xué)生有可能發(fā)現(xiàn)規(guī)律答對(duì)一些原本較難的題目,從而影響測(cè)驗(yàn)結(jié)果的效度。 g.測(cè)題數(shù)目。增加測(cè)題的數(shù)目(即增加測(cè)驗(yàn)長(zhǎng)度)通??梢蕴岣邷y(cè)驗(yàn)的信度和效度。 h.測(cè)題的難度要適當(dāng)。標(biāo)準(zhǔn)參照測(cè)驗(yàn)中的測(cè)題平均難度應(yīng)在0.05左右,并有適當(dāng)?shù)碾y度分布,測(cè)題太難或太易都無(wú)法區(qū)分學(xué)生的優(yōu)劣,從而降低測(cè)驗(yàn)的效度。標(biāo)準(zhǔn)參照測(cè)驗(yàn)并不強(qiáng)調(diào)測(cè)驗(yàn)分?jǐn)?shù)間的差異,也就不需要區(qū)分學(xué)生的優(yōu)劣,這時(shí)的測(cè)題難度就應(yīng)該與教學(xué)目標(biāo)的要求相一致。
②校標(biāo)因素
③樣本的代表性
④干涉變量
第五章 心理測(cè)驗(yàn)的項(xiàng)目分析
第一節(jié) 題目的難度
一、難度的含義:難度就是項(xiàng)目(或題目)的難易程度。能力測(cè)驗(yàn)中常以該項(xiàng)目的通過(guò)(或答對(duì))率表示,即以答對(duì)或通過(guò)該題的人數(shù)的百分比來(lái)表示。
二、難度的計(jì)算方法
(一)二分法記分的項(xiàng)目
當(dāng)被試人數(shù)較多時(shí),則可以根據(jù)測(cè)驗(yàn)總成績(jī)將被試分成三組:分?jǐn)?shù)最高的27%的被試為高分組(HN),分?jǐn)?shù)最低的27%的被試為低分組(HN),中間46%的被試為中間組。分別計(jì)算高分組和低分組的通過(guò)率,再求試題的難度:
②非二分法計(jì)分的項(xiàng)目當(dāng)測(cè)驗(yàn)項(xiàng)目為問(wèn)答題或其他不能用二分法計(jì)分的形式時(shí),常常對(duì)部分正確的反應(yīng)也給一定分?jǐn)?shù)。對(duì)于這類(lèi)項(xiàng)目,一般用下面的公式計(jì)算難度:
三、難度水平的確定 ①在測(cè)驗(yàn)編制過(guò)程中,分析項(xiàng)目難度主要是為了篩選項(xiàng)目。項(xiàng)目的難度水平多高合適,取決于測(cè)驗(yàn)的目的、項(xiàng)目的形式以及測(cè)驗(yàn)的性質(zhì)。0.5上下浮動(dòng)0.2。 在教育工作中,有些測(cè)驗(yàn)的目的是為了考查學(xué)生對(duì)某些方面的知識(shí)、技能是否掌握,此時(shí)可以不考慮難度。當(dāng)測(cè)驗(yàn)用于選人時(shí),應(yīng)該比較多地采用那些難度值接近錄取率的項(xiàng)目。 ②作為一個(gè)整體的測(cè)驗(yàn)的難度,直接依賴(lài)于組成測(cè)驗(yàn)的項(xiàng)目的難度。對(duì)整個(gè)測(cè)驗(yàn)的難度的綜合性檢驗(yàn),可由分?jǐn)?shù)的分布提供。當(dāng)分?jǐn)?shù)分布是正偏態(tài),分?jǐn)?shù)密集在低端,表明測(cè)驗(yàn)的難度偏高。當(dāng)分?jǐn)?shù)分布是負(fù)偏態(tài),分?jǐn)?shù)密集在高端,表明測(cè)驗(yàn)的難度偏低。
第二節(jié) 題目的區(qū)分度
一、概念:區(qū)分度是指項(xiàng)目對(duì)所測(cè)量的心理特性的區(qū)分程度或鑒別能力,也就是項(xiàng)目的效度。常以高分組與低分組在該項(xiàng)目得分的平均數(shù)的差異表示,或以該項(xiàng)目得分與測(cè)驗(yàn)總分的相關(guān)表示。
二、確定區(qū)分度的方法 確定區(qū)分度常用的是相關(guān)法,即以項(xiàng)目分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)(或測(cè)驗(yàn)總分)的相關(guān)作為項(xiàng)目區(qū)分度的指標(biāo),相關(guān)越高,區(qū)分能力越好。
①二列相關(guān)。二列相關(guān)適用于兩個(gè)可以連續(xù)測(cè)量的變量,但其中有一個(gè)由于某種原因被分成兩個(gè)類(lèi)別。
②點(diǎn)二列相關(guān)。點(diǎn)二列相關(guān)適用于一個(gè)變量為連續(xù)變量,另一個(gè)變量為二分變量的資料。當(dāng)一個(gè)變量是雙峰分配時(shí)。盡管它并不是真正的二分變量,這種統(tǒng)計(jì)方法也適用。
③四分相關(guān)。四分相關(guān)適用于兩個(gè)常態(tài)的連續(xù)變量均被人為二分的資料。如果一個(gè)題目分?jǐn)?shù)被二分成通過(guò)不通過(guò),效標(biāo)成績(jī)也被分成通過(guò)與不通過(guò),這時(shí)就會(huì)得到四個(gè)類(lèi)別,從而可組成一個(gè)四格表。計(jì)算四分相關(guān)最常用的是皮爾遜的余弦公式。
④Φ相關(guān)。相關(guān)的統(tǒng)計(jì)方法適用于兩個(gè)變量都是點(diǎn)分配的資料,即兩個(gè)變量都是二分名義變量。
⑤項(xiàng)目和總分相關(guān)重疊的校正。在做項(xiàng)目分析時(shí),需要經(jīng)常計(jì)算項(xiàng)目和總分的相關(guān),這是一種局部和總體的相關(guān),在一個(gè)測(cè)驗(yàn)中,只有當(dāng)每一項(xiàng)目的變異數(shù)相同或項(xiàng)目非常多,以致每個(gè)項(xiàng)目所貢獻(xiàn)的變異數(shù)比例都很微小時(shí),才能把項(xiàng)目和總分的相關(guān)作為項(xiàng)目區(qū)分度的指標(biāo)。如果不具備這些條件,最好計(jì)算每一項(xiàng)目和所有其他項(xiàng)目合成分?jǐn)?shù)之間的相關(guān)。
對(duì)于教育成就測(cè)驗(yàn)來(lái)說(shuō),一般要求項(xiàng)目與總分的相關(guān)達(dá)到0.20以上,高分組與低分組通過(guò)率之差達(dá)到0.15~0.20以上。
3、區(qū)分度與難度的關(guān)系 難度和區(qū)分度都是相對(duì)的,是針對(duì)一定團(tuán)體而言的(絕對(duì)的難度和區(qū)分度是不存在的)。一般說(shuō)來(lái),較難的項(xiàng)目對(duì)高水平被試區(qū)分度高,較易的項(xiàng)目對(duì)水平低的被試區(qū)分度高,中等難度的項(xiàng)目對(duì)中等水平的被試區(qū)分度高。這與中等難度的項(xiàng)目區(qū)分度最高的說(shuō)法并不矛盾。由于人的多數(shù)心理特性呈常態(tài)分布,所以項(xiàng)目難度的分布也以常態(tài)為好,即特別難與特別容易的題目較少,越接近中等難度的題目越多,而所有項(xiàng)目的平均難度為0.50。
三、題目的綜合分析和篩選
1、鑒別力
取舍題目時(shí),首先要看鑒別力。按照測(cè)題的鑒別指數(shù)與優(yōu)劣之評(píng)鑒標(biāo)準(zhǔn),0.30以上的項(xiàng)目是比較好的。
2、難度
P值一般在0.35至0.65之間為好,但就整個(gè)測(cè)驗(yàn)而言,難度為0.5的測(cè)題應(yīng)居多,也需一些難度較大或較小的測(cè)題。
3、選項(xiàng)
項(xiàng)目的選項(xiàng)分析是指對(duì)選擇題后面所提供的幾個(gè)答案的分析。選項(xiàng)分析的異常情況主要有:正確答案無(wú)人選擇,或少于其他選項(xiàng)人數(shù);錯(cuò)誤答案選的人太多;正確選項(xiàng)上高分組選擇人數(shù)少于低分組;錯(cuò)誤選項(xiàng)上高分組選擇人數(shù)又多于低分組;某個(gè)選項(xiàng)無(wú)人選擇;未答的人數(shù)較多。
第六章 測(cè)驗(yàn)分?jǐn)?shù)的合成與解釋
第一節(jié) 測(cè)驗(yàn)分?jǐn)?shù)的合成
一、分?jǐn)?shù)合成的方法
二、分?jǐn)?shù)合成的方法比較
第二節(jié) 測(cè)驗(yàn)分?jǐn)?shù)的解釋
一、呈現(xiàn)常模分?jǐn)?shù)的方法:①分?jǐn)?shù)轉(zhuǎn)換表 ②剖析圖 ③正態(tài)百分位圖表
二、幾種主要的常模分?jǐn)?shù):①發(fā)展量表 ②商數(shù) ③百分等級(jí) ④標(biāo)準(zhǔn)分?jǐn)?shù)
三、標(biāo)準(zhǔn)參照分?jǐn)?shù):①內(nèi)容參照分?jǐn)?shù) ②結(jié)果參照分?jǐn)?shù)
四、分?jǐn)?shù)的解釋與交流
1、解釋分?jǐn)?shù)要注意的問(wèn)題:
(1)測(cè)驗(yàn)分?jǐn)?shù)是遺傳特征、學(xué)習(xí)與經(jīng)驗(yàn)以及測(cè)驗(yàn)情境的函數(shù)。
(2)為了對(duì)測(cè)驗(yàn)分?jǐn)?shù)做出確切的解釋必須有效度資料。
(3)不要把測(cè)驗(yàn)分?jǐn)?shù)看成確切的點(diǎn)。
(4)對(duì)于不同的分?jǐn)?shù)不能直接加以比較
2、如何向當(dāng)事人報(bào)告分?jǐn)?shù):
(1)使用當(dāng)事人所理解的語(yǔ)言。
(2)要保證當(dāng)事人知道這個(gè)測(cè)驗(yàn)測(cè)量或預(yù)測(cè)什么。
(3)要使當(dāng)事人認(rèn)識(shí)到分?jǐn)?shù)只是一個(gè)“最好”的估計(jì)。
(4)要使當(dāng)事人知道如何運(yùn)用他的分?jǐn)?shù)。
(5)要考慮測(cè)驗(yàn)分?jǐn)?shù)將給當(dāng)事人帶來(lái)什么心理影響。
(6)要讓當(dāng)事人積極參與測(cè)驗(yàn)分?jǐn)?shù)的解釋。
第七章 測(cè)驗(yàn)的編制
第一節(jié) 標(biāo)準(zhǔn)化測(cè)驗(yàn)的編制程序
一、測(cè)驗(yàn)編制過(guò)程
1、三階段六步驟:
(1)準(zhǔn)備階段:確定測(cè)驗(yàn)?zāi)康暮蛿M定計(jì)劃兩個(gè)步驟;
(2)編制階段:產(chǎn)生測(cè)驗(yàn)題目以及預(yù)測(cè)與合成測(cè)驗(yàn)等步驟
(3)完善階段:將測(cè)驗(yàn)使用標(biāo)準(zhǔn)化、評(píng)鑒測(cè)驗(yàn)基本特征并編寫(xiě)測(cè)驗(yàn)說(shuō)明書(shū)等步驟。
2、項(xiàng)目編制的基本原則:
科學(xué)性原則、目的性原則、代表性原則、合理性原則、經(jīng)濟(jì)性原則。
3、項(xiàng)目編制的具體要求:
(1)題目格式應(yīng)明確具體,不要讓被試誤解。
(2)題目之間必須彼此獨(dú)立,不可互相重復(fù)或牽連,不要使一個(gè)題目的回答影響另外一個(gè)題目的回答。
(3)題目文句要簡(jiǎn)明扼要,即文字應(yīng)該力求淺顯簡(jiǎn)短,避免使用孤僻艱深的字句。
(4)題目意義必須明確,不得含糊,盡量避免使用雙重否定句。
(5)題目中不可含有暗示本題或其他題正確答案之線(xiàn)索。
(6)所提問(wèn)題應(yīng)避免涉及社會(huì)禁忌與個(gè)人隱私,避免使用主觀性和情緒化的字句,
避免提出令被試為難的問(wèn)題。
(7)題目應(yīng)有確切答案,沒(méi)有引起疑義和歧義的可能,也就是要有不致引起爭(zhēng)論的確定答案(創(chuàng)造力測(cè)驗(yàn)、人格測(cè)驗(yàn)除外)
(8)題目?jī)?nèi)容不要超出受測(cè)團(tuán)體的知識(shí)、能力范圍,難度要適合被試水平。
(9)盡量做到施測(cè)與評(píng)分省時(shí)。
第八章 測(cè)驗(yàn)的使用
第一節(jié) 測(cè)驗(yàn)的選擇
一、測(cè)驗(yàn)的目的與對(duì)象
二、測(cè)驗(yàn)的質(zhì)量
三、選擇測(cè)驗(yàn)應(yīng)考慮的其他因素
第二節(jié) 測(cè)驗(yàn)的實(shí)施
第三節(jié) 測(cè)驗(yàn)的管理
第九章 常用心理測(cè)驗(yàn)
第一節(jié) 能力測(cè)驗(yàn)
一、智力測(cè)驗(yàn)(比內(nèi)量表、韋氏智力量表、瑞文標(biāo)準(zhǔn)推理測(cè)驗(yàn))
二、特殊能力測(cè)驗(yàn)
三、能力傾向測(cè)驗(yàn)
四、創(chuàng)造力測(cè)驗(yàn)
第二節(jié) 人格測(cè)驗(yàn)
一、人格測(cè)驗(yàn)的編制
二、自陳量表(卡特爾16種人格因素測(cè)驗(yàn)、艾森克人格問(wèn)卷EPQ、愛(ài)德華個(gè)性偏好量表)
三、投射測(cè)驗(yàn)
四、情境測(cè)驗(yàn)
第三節(jié) 成就測(cè)驗(yàn)
第四節(jié) 態(tài)度測(cè)驗(yàn)
第五節(jié) 教育測(cè)驗(yàn)
第六節(jié) 職業(yè)測(cè)驗(yàn)
一、霍蘭德職業(yè)興趣測(cè)驗(yàn)
第七節(jié) 臨床測(cè)驗(yàn)
一、明尼蘇達(dá)多項(xiàng)人格測(cè)驗(yàn)MMPI
參考書(shū)目:鄭日昌主編 心理與教育測(cè)量 人民教育出版社2011年6月第1版