好的測(cè)驗(yàn)都應(yīng)當(dāng)符合一定的要求,通常用實(shí)用性、信度、效度、難度和區(qū)分度等指標(biāo)衡量測(cè)驗(yàn)質(zhì)量。
(1)實(shí)用性。實(shí)用性反映了試題的基本質(zhì)量,其基本要求是:①便于組織。②測(cè)驗(yàn)便于實(shí)施。③容易評(píng)分。④結(jié)果要容易解釋。
(2)可信度。具體要求是,先后兩次用同樣的試卷測(cè)查同一批學(xué)生,則兩次測(cè)驗(yàn)的分?jǐn)?shù)應(yīng)該比較相近,對(duì)同樣的答卷組織兩次評(píng)分,評(píng)分結(jié)果相近。如果上述評(píng)分結(jié)果相差懸殊,就表示試卷可信度很低。提高測(cè)驗(yàn)信度的一般方法是:①題量不能太少②成績(jī)要拉開檔次。③多出客觀題。④建立詳細(xì)的評(píng)分指南。⑤評(píng)分要認(rèn)真。最后一條尤其要引起教師的重視。
(3)有效性。估計(jì)測(cè)驗(yàn)效度的方法主要有兩種:①內(nèi)容效度,反映了題目對(duì)所考察內(nèi)容的代表性問題。②效標(biāo)關(guān)聯(lián)效度,反映了測(cè)驗(yàn)分?jǐn)?shù)和所選擇的效標(biāo)分?jǐn)?shù)之間的一致程度。效標(biāo)是檢測(cè)效度的參照標(biāo)準(zhǔn),通常用一個(gè)較為公認(rèn)的測(cè)驗(yàn)工具作為效標(biāo)。
(4)難度。不同的測(cè)驗(yàn)對(duì)難度有不同的要求,如選拔性考試難度以中等為宜,否則很難篩選。
一般來說,某一道試題答對(duì)的學(xué)生少于20%時(shí)便是過深,答對(duì)的多于80%時(shí)則是偏淺。
(5)區(qū)分度。區(qū)分度是測(cè)驗(yàn)?zāi)芊窭_分?jǐn)?shù)距離的指標(biāo)。試題的區(qū)分度也稱為鑒別力,表示某道題目能夠?qū)⒉煌潭鹊膶W(xué)生鑒別開來的能力。