- 相關(guān)推薦
論本科教學(xué)中題庫(kù)建設(shè)的意義及質(zhì)量評(píng)價(jià)體系
論本科教學(xué)中題庫(kù)建設(shè)的意義及質(zhì)量評(píng)價(jià)體系
陳晟1,江昀2,賴朋1
摘要:本文結(jié)合作者在題庫(kù)建設(shè)中的實(shí)際工作,對(duì)本科教學(xué)中的考試題庫(kù)建設(shè)的意義、作用,以及題庫(kù)建設(shè)中需要重視的難點(diǎn)做出了綜述,并對(duì)題庫(kù)的深入應(yīng)用、題庫(kù)的質(zhì)量評(píng)價(jià)指標(biāo)做出了探討。
關(guān)鍵詞:考試;題庫(kù);區(qū)分度
基金項(xiàng)目:本文系2015年西華大學(xué)教育教學(xué)改革研究項(xiàng)目《制藥工程專業(yè)卓越人才的培養(yǎng)模式探索》的研究成果之一。
作者簡(jiǎn)介:陳晟,理學(xué)博士,講師。
在高等教育中,考試是一個(gè)必不可少的環(huán)節(jié),借此來(lái)檢驗(yàn)學(xué)生對(duì)知識(shí)的掌握程度,也間接體現(xiàn)教師的教學(xué)工作是否達(dá)到了預(yù)計(jì)的效果。因此,如何設(shè)計(jì)考題,真實(shí)、可信地反映學(xué)生的學(xué)習(xí)成果,就是高等教育中一個(gè)極為重要的問(wèn)題。
一種解決思路,就是為某一門課程設(shè)計(jì)題庫(kù),以后每年的考試均從題庫(kù)中抽取若干題目組成考卷。本文將從題庫(kù)建設(shè)的意義、題庫(kù)建設(shè)的重點(diǎn)與難點(diǎn)、題庫(kù)的質(zhì)量評(píng)價(jià)指標(biāo)等方面進(jìn)行一些新的探討。
一、題庫(kù)建設(shè)的意義
題庫(kù)建設(shè)的意義,已經(jīng)有相當(dāng)多的教師做出過(guò)論述。而本文作者在幾門本科課程的題庫(kù)建設(shè)的過(guò)程中,對(duì)題庫(kù)建設(shè)的意義有了一些新的認(rèn)識(shí)。
。ㄒ唬┛疾斓姆秶右(guī)范、全面作為一門課程的主講教師,當(dāng)然有權(quán)決定把哪些知識(shí)點(diǎn)作為考察的重點(diǎn)。同時(shí),這種權(quán)力又應(yīng)該受到培養(yǎng)目標(biāo)、教學(xué)大綱的制約,不能因?yàn)榻處焸(gè)人的好惡而隨意地改變知識(shí)點(diǎn)的權(quán)重。特別是對(duì)于那些復(fù)雜、抽象的知識(shí)點(diǎn),往往要求教師花費(fèi)更多的時(shí)間與精力才能真正將其闡釋清楚,在實(shí)踐中就存在教師“講課時(shí)一筆帶過(guò),考察時(shí)故意回避”,將該知識(shí)點(diǎn)擅自忽略的可能。盡管絕大多數(shù)教師的職業(yè)道德水平,決定了這種可能性實(shí)際上非常小,但它依然是一種制度性的風(fēng)險(xiǎn)。
同時(shí),對(duì)于同一個(gè)考點(diǎn),不同的命題人可能對(duì)其重要程度的看法不同,因而影響到考察的深度和廣度,這會(huì)直接體現(xiàn)在題型和分值的差異上。比如,某個(gè)知識(shí)點(diǎn)在一張?jiān)嚲砩峡赡苤皇?分的選擇題,在另一位教師出題的試卷上卻可能是一道10分的論述題:盡管都考察了這個(gè)知識(shí)點(diǎn),但卻影響了考試對(duì)于學(xué)生學(xué)習(xí)水平的評(píng)價(jià)的可信性和有效性,是命題者應(yīng)該盡量避免的情況。
而題庫(kù)的設(shè)立,能從根本上降低上述兩種風(fēng)險(xiǎn)。題庫(kù)建設(shè)是由所有擔(dān)任該課程教學(xué)任務(wù)的教師共同參與討論,并由教研室、學(xué)院兩級(jí)依據(jù)教學(xué)大綱進(jìn)行審核驗(yàn)收,因而能夠保證入庫(kù)的題目質(zhì)量:既能全面地覆蓋大綱要求的知識(shí)點(diǎn),又能在每個(gè)知識(shí)點(diǎn)的考察要求上保持深淺一致。臨考前再?gòu)念}庫(kù)中隨機(jī)抽取題目而產(chǎn)生考卷,就能把因教師認(rèn)識(shí)差異而造成考點(diǎn)覆蓋不全面、考察深度不穩(wěn)定等現(xiàn)象盡可能地避免,保持該科目逐年考察要求的相對(duì)穩(wěn)定性和連貫性,更好地實(shí)現(xiàn)教學(xué)大綱所要求的知識(shí)掌握目標(biāo)。
。ǘ┯欣谛骂}型的創(chuàng)造與應(yīng)用
在一門課程的試卷中,大部分題目通常應(yīng)當(dāng)是常規(guī)性的題型且難度適中,目的是考察學(xué)生是否已經(jīng)達(dá)到“識(shí)記”、“理解”層次的知識(shí)水平;同時(shí),又最好能有少量(題量和分值上都較少)的非常規(guī)性的新題型,考察學(xué)生是否能夠達(dá)到靈活“應(yīng)用”該知識(shí)點(diǎn)的層次,甚至可能在一道題目中綜合考察幾個(gè)相關(guān)的知識(shí)點(diǎn)。這兩類題目的重要程度不分伯仲,前者保證考察的全面性,屬于基礎(chǔ);后者則可以體現(xiàn)考察的區(qū)分度,讓不同學(xué)生之間的掌握程度差異得以真實(shí)地體現(xiàn)出來(lái),屬于“拔尖”。
然而,在以往教師單獨(dú)命題時(shí),保證這兩類題目的均衡實(shí)際上是較為困難的。因?yàn)榛A(chǔ)性的常規(guī)題型數(shù)量較大、覆蓋面較廣,消耗了命題人較多的時(shí)間與精力,再想要設(shè)計(jì)出具有創(chuàng)新性、綜合性的題型,則往往力所不及。
而有了題庫(kù)之后,教師在命題時(shí)的精力得到了極大的解放:大量的、常規(guī)性的考題直接由題庫(kù)抽取產(chǎn)生,教師可以將精力集中在研究、創(chuàng)造新的題型上,并在例行的年度題庫(kù)維護(hù)中將其補(bǔ)充入題庫(kù)中。這樣,新型的考題能夠得到更好的創(chuàng)造與應(yīng)用,保證了題庫(kù)的質(zhì)量不斷提高。
。ㄈ┯欣诜婪犊荚囎鞅仔袨榈陌l(fā)生
盡管在絕大多數(shù)高校中,學(xué)生考試作弊都是極其個(gè)別、偶發(fā)的現(xiàn)象,但從教育者的角度來(lái)說(shuō),當(dāng)然是希望把這種可能降至最低。除了加強(qiáng)誠(chéng)信教育、嚴(yán)明考試紀(jì)律外,我院也嘗試了通過(guò)題庫(kù)建設(shè),從技術(shù)上杜絕作弊的可能性。
具體而言,當(dāng)某一門課程的題庫(kù)建好后,臨考前抽取試卷時(shí),教務(wù)人員會(huì)借助簡(jiǎn)單的計(jì)算機(jī)程序,對(duì)部分考題的題號(hào)順序、部分選擇題的選項(xiàng)順序加以隨機(jī)打亂,從而產(chǎn)生2~3套不同的試卷,分發(fā)給同一個(gè)考試的學(xué)生使用。
這樣,盡管試卷上的試題本質(zhì)上是完全相同的,但相鄰座位的兩名考生拿到的試卷卻可能有很大的差異,比如A1卷上的第5題變成了A2卷上的第8題,或者第3題的正確答案由“A”變成了“C”,使得抄襲他人答案、傳紙條等作弊手段就完全失去了意義。同時(shí),試題的覆蓋面和難度都沒(méi)有發(fā)生任何實(shí)質(zhì)變化,對(duì)所有考生都是公平對(duì)待的。這種同題多卷的模式,增大了作弊者的難度,確保了考察結(jié)果的真實(shí)性、可信性。
另外,因?yàn)樵嚲硎桥R考前由學(xué)院教務(wù)部門隨機(jī)抽取,連授課教師自己也并不知曉當(dāng)次的具體考題,在很大程度上就避免了考試前給學(xué)生“畫重點(diǎn)”的不恰當(dāng)做法,促使學(xué)生端正學(xué)習(xí)態(tài)度,平時(shí)認(rèn)真聽(tīng)課、考前全面復(fù)習(xí),真正實(shí)現(xiàn)了“為學(xué)而考”而非“為考而學(xué)”的目標(biāo)。
。ㄋ模┛梢宰鳛榻虒W(xué)改革的輔助評(píng)價(jià)依據(jù)
我院近年來(lái)一直大力推動(dòng)本科教學(xué)質(zhì)量工程建設(shè),并參照工程類專業(yè)認(rèn)證的要求進(jìn)行教學(xué)改革,每年都有大量的教學(xué)改革課題立項(xiàng)、實(shí)施。然而,如何評(píng)價(jià)一項(xiàng)教學(xué)改革是否成功,依然是一個(gè)較難把握的問(wèn)題。
在實(shí)施題庫(kù)建設(shè)之后,由于考題范圍、難度都相對(duì)穩(wěn)定,學(xué)生的考試成績(jī)更真實(shí)地反映了其知識(shí)水平,所以也可以作為評(píng)價(jià)一項(xiàng)教學(xué)改革是否成功的輔助依據(jù)。當(dāng)然,考試成績(jī)并不能說(shuō)明一切問(wèn)題,但如果學(xué)生的平均成績(jī)沒(méi)有明顯提高,則該教學(xué)改革的效果應(yīng)當(dāng)是很有限的。
。ㄎ澹┪磥(lái)的探索方向
此外,基于題庫(kù)建設(shè),我們也在考慮可否將考試進(jìn)一步改為“多題多卷”的模式,徹底地杜絕抄襲作弊的可能。
展望未來(lái),我們還在積極探索將題庫(kù)建設(shè)和在線無(wú)紙化考試相結(jié)合的可能性,更好、更方便地評(píng)價(jià)學(xué)生的學(xué)習(xí)水平,同時(shí)也為適應(yīng)未來(lái)在線教育(如MOOC課程等)預(yù)留了升級(jí)空間。
二、題庫(kù)建設(shè)中的重點(diǎn)與難點(diǎn)
在本院的題庫(kù)建設(shè)工作中,我們也總結(jié)出了一些經(jīng)驗(yàn),供各位教師參考。
。ㄒ唬﹫(jiān)持以教學(xué)大綱、教學(xué)目標(biāo)作為題庫(kù)的基礎(chǔ)
考試從來(lái)就是手段而非目的,題庫(kù)建設(shè)也應(yīng)當(dāng)是服從于、服務(wù)于教學(xué)工作。因此,在題庫(kù)建設(shè)伊始,所有參與命題的教師就必須統(tǒng)一認(rèn)識(shí),嚴(yán)格按照教學(xué)大綱、教學(xué)計(jì)劃(包括各章節(jié)的學(xué)時(shí)數(shù)安排)來(lái)設(shè)計(jì)考題,力求絕大部分題目的深度都恰好達(dá)到教學(xué)大綱的要求,既不過(guò)深又不太淺,以實(shí)現(xiàn)教學(xué)目標(biāo)為衡量標(biāo)準(zhǔn)。
(二)確保試題重復(fù)率低于一定比例
理論上說(shuō),每一屆學(xué)生考試后的試卷是要當(dāng)場(chǎng)收回的,但在多年的教學(xué)實(shí)踐中,我們也發(fā)現(xiàn)一些學(xué)生能通過(guò)各種渠道獲得前幾屆的考試試卷。這就意味著,我們的題庫(kù)必須保持足夠大的題量,控制考題的重復(fù)率,否則考試就失去了意義。這樣,哪怕學(xué)生獲知了以往的考試題目,依然不能因此而推測(cè)出今年的考題,保證考試的嚴(yán)肅性和公平性。
為此,我們制定了一個(gè)經(jīng)驗(yàn)性的規(guī)則:每一個(gè)知識(shí)點(diǎn),在題庫(kù)中至少要有兩個(gè)不同題型的題目加以考察,重要的知識(shí)點(diǎn)至少要有6道不同的題目存在于題庫(kù)中;同時(shí),任何一道題目,在連續(xù)隨機(jī)抽取20次的情況下,被抽中的概率累計(jì)不能超過(guò)15%(即不能被抽中3次以上),并以此作為題庫(kù)驗(yàn)收的強(qiáng)制性標(biāo)準(zhǔn)之一。
。ㄈ⿲(duì)題庫(kù)的定期維護(hù)
如上所述,為了避免歷年考題的雷同,當(dāng)一道題目被抽中使用之后,至少在次年的考試中不應(yīng)再將其列入。然而,如果將考過(guò)的題目一律棄之不用,又會(huì)造成題庫(kù)逐年萎縮的尷尬場(chǎng)面。
解決方案,就是對(duì)題庫(kù)進(jìn)行定期維護(hù),對(duì)已經(jīng)使用過(guò)的部分考題“冷藏”,1~2年內(nèi)不再使用,同時(shí)對(duì)該知識(shí)點(diǎn)進(jìn)行補(bǔ)充;冷藏、補(bǔ)充的題目比例,不低于當(dāng)年考題總數(shù)的30%。
同時(shí),在每年的教研活動(dòng)中,鼓勵(lì)任課教師為題庫(kù)補(bǔ)充新的題目,特別是新題型,以及綜合性、應(yīng)用性較強(qiáng)的題目,并將一部分學(xué)科研究的前沿動(dòng)態(tài)作為題目背景引入,不斷地保持和提高題庫(kù)的質(zhì)量與時(shí)效性。
。ㄋ模╊}庫(kù)的驗(yàn)收制度
為確保題庫(kù)建設(shè)質(zhì)量,在題庫(kù)建設(shè)中,采取了教研室、學(xué)院兩級(jí)驗(yàn)收的制度。教研室主要是結(jié)合教學(xué)大綱,確認(rèn)知識(shí)點(diǎn)得到了全面的覆蓋且考察的難度適中;學(xué)院層面則由教務(wù)部門牽頭,通過(guò)隨機(jī)多次抽取核對(duì)試題重復(fù)率、抽查知識(shí)點(diǎn)在題庫(kù)中被考察的題目數(shù)等技術(shù)指標(biāo)來(lái)保證題庫(kù)的容量。
另外,為全面評(píng)價(jià)題庫(kù)的質(zhì)量與難易程度,每一門課程的題庫(kù)驗(yàn)收時(shí),均需組織一次模擬測(cè)試,參加測(cè)試的人員為1~2名擔(dān)任本課程教學(xué)的教師,加上1~2名經(jīng)過(guò)短暫復(fù)習(xí)的研究生同學(xué)(本次題庫(kù)建設(shè)僅涉及為本科生開(kāi)設(shè)的課程),以此來(lái)評(píng)估試題的難度和數(shù)量是否適合絕大多數(shù)應(yīng)考學(xué)生的水平。
三、對(duì)試題庫(kù)質(zhì)量的評(píng)估體系
在一道試題沒(méi)有被實(shí)際使用之前,對(duì)它所做出的評(píng)價(jià)多少帶有主觀色彩。同時(shí),囿于教師與學(xué)生的知識(shí)水平差異,這種評(píng)價(jià)有時(shí)候甚至?xí)霈F(xiàn)相當(dāng)大的偏差。
為此,參考國(guó)內(nèi)外的研究成果,結(jié)合課程實(shí)際,我們制定了一些試題評(píng)估的指標(biāo),在每一年考試結(jié)束之后,由教研室組織對(duì)當(dāng)年的試卷進(jìn)行評(píng)估,回顧式地評(píng)價(jià)試題質(zhì)量,并作為試題庫(kù)維護(hù)和調(diào)整的重要依據(jù)。
。ㄒ唬┲匾曉囶}的區(qū)分度指標(biāo)
試題的區(qū)分度D,是目前較為公認(rèn)的試題定量評(píng)價(jià)四個(gè)指標(biāo)之一,它體現(xiàn)了一道試題在辨別、區(qū)分學(xué)生知識(shí)水平上所產(chǎn)生的貢獻(xiàn)。不同的文獻(xiàn)中,提出了多種區(qū)分度的計(jì)算方法,本院采取的計(jì)算方法是:先按照全卷總分,對(duì)全體考生由高到低進(jìn)行排序,取排在前27%的考生稱為高分考生,排在最后27%的考生稱為低分考生。然后,對(duì)每一道題目,分別統(tǒng)計(jì)高分考生的平均分(PH)和低分考生所獲得的平均分(PL)。則:D=PH/PL
因此,D值越大,則說(shuō)明此題目區(qū)分高分考生和低分考生的效果就越明顯;而此指標(biāo)過(guò)高或過(guò)低,都不利于考察全體學(xué)生的學(xué)習(xí)水平。經(jīng)過(guò)調(diào)研和討論,我們認(rèn)為,每道題目的D值的合理區(qū)間定在2~5比較恰當(dāng),個(gè)別考題允許D值達(dá)到7,以此來(lái)拉開(kāi)考分差距,但全卷的平均D值應(yīng)當(dāng)控制在2~3之間。
(二)確保試題的難度系數(shù)指標(biāo)
試題的難度系數(shù)P,也是通行的四個(gè)評(píng)價(jià)指標(biāo)之一,其計(jì)算方式為:
統(tǒng)計(jì)所有考生在某一個(gè)題目上的得分,計(jì)為x,而該題設(shè)定的滿分為w,則:P=1-x/y.
參考國(guó)內(nèi)外的研究文獻(xiàn),結(jié)合以往考試的實(shí)際情況,我們認(rèn)為,將P值的區(qū)間定在0.4~0.6之間較為合理,允許個(gè)別題目的P值處于0.3~0.8的區(qū)間,全卷的平均P值最好處于0.3~0.5之間。
在回顧性的分析中,如果某一道題目實(shí)測(cè)的D值或P值,嚴(yán)重偏離了我們預(yù)計(jì)的范圍,則需要對(duì)該題目進(jìn)行討論,決定是否加以修改、替換。
。ㄈ┰和、校外專家的評(píng)分制度
因?yàn)樵嚲韺?duì)于考生都是一次性使用,不可能重測(cè),所以很難通過(guò)回顧性的統(tǒng)計(jì)數(shù)據(jù)來(lái)評(píng)價(jià)考題的信度(Reliability)和效度(Validity)指標(biāo)。為此,我們邀請(qǐng)了院外、校外教授相同學(xué)科的資深教師,抽取題庫(kù)中的部分題目進(jìn)行了評(píng)估。具體方式為:
對(duì)一道題目,按照題目與它所考察的知識(shí)點(diǎn)之間的關(guān)系進(jìn)行打分,最高5分(緊密吻合),最低1分(基本無(wú)關(guān)),取幾位專家的打分平均值,以此來(lái)評(píng)價(jià)其效度。經(jīng)過(guò)實(shí)際評(píng)分,送評(píng)的題目基本上都達(dá)到了4分以上,證明我們建設(shè)的題庫(kù)質(zhì)量還是較高的。
而對(duì)于信度指標(biāo),我們采取的是將一道題目的P值,與近5年來(lái)考察該知識(shí)點(diǎn)的題目的平均P值進(jìn)行比較的方式,但考慮到各屆學(xué)生實(shí)際情況不同,加上近年來(lái)教學(xué)質(zhì)量工程的推進(jìn),這種評(píng)估方式未必合理,還有待于進(jìn)一步的研究。
四、結(jié)語(yǔ)
綜上所述,我們認(rèn)為,為本科課程建設(shè)配套的考試題庫(kù),有利于全面、客觀、有效地評(píng)價(jià)學(xué)生的學(xué)習(xí)成果,有利于教學(xué)改革的推進(jìn)與評(píng)價(jià);更有助于端正學(xué)風(fēng)、考風(fēng),促使教師更用心地授課,學(xué)生更認(rèn)真地聽(tīng)課、復(fù)習(xí),真正達(dá)到全面推動(dòng)教學(xué)質(zhì)量提高的目的,而這也正是高校教學(xué)改革的最終目標(biāo)所在,具有較強(qiáng)的積極作用。
參考文獻(xiàn):
[1]劉靜。關(guān)于高校試題題庫(kù)建設(shè)的若干思考[J].中國(guó)社會(huì)醫(yī)學(xué)雜志,2009,(3):143.
[2]李光明。如何做好題庫(kù)建設(shè)———來(lái)自英美考試機(jī)構(gòu)的啟示[J].中國(guó)考試,2011,(12):3.
[3]李光明。關(guān)于題庫(kù)建設(shè)若干問(wèn)題的思考[J].中國(guó)考試,2014,(9):3.
[4]傅強(qiáng)。淺析中藥藥理學(xué)教考分離和試題庫(kù)建設(shè)[J].海峽藥學(xué),2014,(9):150.
[5]李永華。網(wǎng)絡(luò)化考試的題庫(kù)建設(shè)及應(yīng)用研究[J].高教論壇,2013,(10):57.
[6]鄭群。醫(yī)學(xué)微生物學(xué)題庫(kù)建設(shè)的實(shí)踐與探索[J].繼續(xù)醫(yī)學(xué)教育,2013,(10):78.
【論本科教學(xué)中題庫(kù)建設(shè)的意義及質(zhì)量評(píng)價(jià)體系】相關(guān)文章:
教學(xué)質(zhì)量保障體系和調(diào)控系統(tǒng)建設(shè)的研究實(shí)踐08-15
論新建公安本科院校實(shí)踐教學(xué)質(zhì)量監(jiān)控與評(píng)價(jià)體系的構(gòu)建08-17
建設(shè)高質(zhì)量教育體系心得體會(huì)03-30
建設(shè)高質(zhì)量的教育體系心得體會(huì)11-22
構(gòu)建合理的高中作文教學(xué)評(píng)價(jià)體系08-20
農(nóng)產(chǎn)品質(zhì)量安全體系建設(shè)調(diào)研報(bào)告08-24