檢驗功效,一譯“檢驗?zāi)芰Α被颉皺z驗力量”。假設(shè)檢驗的效果與犯兩類錯誤的概率都有關(guān)。一個有效的檢驗,首先要求犯第一類錯誤的概率a不能太大,否則易棄真;在犯第一類錯誤的概率得到控制的條件下,犯第二類錯誤的概率也要盡可能小,即不取偽的概率1-β應(yīng)盡可能大。1-β越大,意味著當(dāng)原假設(shè)不真時,檢驗判斷原假設(shè)不真的概率越大,檢驗的判別能力越好;1-β越小,意味著當(dāng)原假設(shè)不真時,檢驗判斷原假設(shè)不真的概率越小,檢驗的判別能力越差。因此,1-β稱為檢驗功效。是反映假設(shè)檢驗判別能力的重要標(biāo)志。1
影響因素影響檢驗功效的因素主要包括三個方面:
顯著性水平α顯著性水平α,是影響檢驗功效1-β的重要因素。如前所述,在樣本一定的條件下犯第一類錯誤的概率與犯第二類錯誤的概率密切相關(guān),α的大小會影響盧,進而影響1-β的大小。在其他條件不變的情形下,顯著性水平α增大,β隨之減小,檢驗功效1-β隨之增強。
樣本容量如前所述,要同時降低兩類錯誤,就必須增大樣本容量,此時,就可以提高檢驗功效。然而,在眾多實踐問題中,擴大樣本容量往往是受限制的,所以要同時兼顧兩類錯誤較為困難。在這種情況下,如果α風(fēng)險一般比β風(fēng)險更為嚴(yán)重,我們首要考慮的是控制α風(fēng)險。
原假設(shè)與備擇假設(shè)的差異程度若原假設(shè)與備擇假設(shè)之間的差異非常明顯,這時取偽的可能性較小,檢驗功效增強;反之,若原假設(shè)與備擇假設(shè)之間差異較小,就難以通過檢驗將二者區(qū)分開來,從而影響檢驗功效。1
原理檢驗效果好壞,與犯兩類錯誤的概率都有關(guān)。一個有效的檢驗首先是犯第一類錯誤的概率不能太大,否則的話,就會產(chǎn)生棄真的現(xiàn)象;另外第二類錯誤就是取偽的錯誤,在犯第一類錯誤概率得到控制的條件下,犯取偽錯誤的概率也要盡可能的小,或者說,不取偽的概率應(yīng)盡可能大。越大意味著原假設(shè)不真實時,檢驗結(jié)論判斷出原假設(shè)不真實的概率越小,檢驗的判別能力就越差。
前面分析說明,第一類錯誤和第二類錯誤是一對矛盾體,在其他條件不變時,減小犯第一類錯誤的可能性,勢必增加犯第二類錯誤的可能性;增大第一類錯誤的可能性,又能減小犯第二類錯誤的可能性??梢姦恋拇笮?,影響著β的大小,進而影響1-β的大小。犯第一類錯誤的概率或檢驗的顯著性水平α是影響檢驗力的一個重要因素。在其他條件不變下,顯著性水平增大,β隨之減小,檢驗功效增強。2
重要性當(dāng)我們使用給定的檢驗統(tǒng)計量進行推斷時必須考慮其功效。所謂檢驗的功效就是備擇假設(shè)為真時拒絕零假設(shè)的概率。對于有意義的備擇假設(shè)來說,低功效說明檢驗在區(qū)分備擇假設(shè)和零假設(shè)方面是沒有使用價值的。另一方面,雖然高功效表明檢驗可能非常富有價值,但對于很接近零假設(shè)的備擇假設(shè),它同樣會拒絕零假設(shè)。在這種情況下如果有一個來自于零假設(shè)很小的、經(jīng)濟上不重要的偏差的話,就會拒絕很接近零假設(shè)的備擇假設(shè)。
為描述檢驗的功效,有必要說明所選擇的數(shù)據(jù)發(fā)生過程和檢驗尺度。對給定的檢驗尺度,功效就是在備擇假設(shè)是真實的條件下檢驗統(tǒng)計量大于零假設(shè)之下臨界值的概率。3
本詞條內(nèi)容貢獻者為:
杜強 - 高級工程師 - 中國科學(xué)院工程熱物理研究所