版權(quán)歸原作者所有,如有侵權(quán),請(qǐng)聯(lián)系我們

[科普中國(guó)]-抽樣偏差

科學(xué)百科
原創(chuàng)
科學(xué)百科為用戶提供權(quán)威科普內(nèi)容,打造知識(shí)科普陣地
收藏

簡(jiǎn)介

抽樣又稱取樣。從欲研究的全部樣品中抽取一部分樣品單位。其基本要求是要保證所抽取的樣品單位對(duì)全部樣品具有充分的代表性。抽樣的目的是從被抽取樣品單位的分析、研究結(jié)果來估計(jì)和推斷全部樣品特性,是科學(xué)實(shí)驗(yàn)、質(zhì)量檢驗(yàn)、社會(huì)調(diào)查普遍采用的一種經(jīng)濟(jì)有效的工作和研究方法。抽樣設(shè)計(jì)在進(jìn)行過程中要遵循四項(xiàng)原則,分別是:1、目的性;2、可測(cè)性;3、可行性;4、經(jīng)濟(jì)型原則。1

抽樣偏差就是破壞了隨機(jī)抽樣的原則。

具體事例及分析1936 年富蘭克林·迪拉諾·羅斯福(Franklin Delano Roosevelt)與艾爾弗雷德·蘭登(Alfred Landon)共同競(jìng)選美國(guó)總統(tǒng)。

此時(shí),美國(guó)失業(yè)人數(shù)高達(dá)九百萬,在1929--1935這段期間實(shí)際收入下降了約1/3,經(jīng)濟(jì)正由大蕭條中逐漸恢復(fù)回升。蘭登競(jìng)選主題為“小政府”口號(hào)為“揮霍浪費(fèi)的人必須離任”“我們應(yīng)該專心致力于自己的事務(wù)”羅斯福競(jìng)選主題為“擴(kuò)大內(nèi)需”口號(hào)為“在我們能夠平衡聯(lián)邦政府的預(yù)算之前,必須先平衡美國(guó)人民的預(yù)算”。絕大多數(shù)觀察家認(rèn)為羅斯福將毫不費(fèi)力的獲勝,而《文學(xué)文摘》(literary Digest)雜志根據(jù)大約240萬人參加的一次民意測(cè)驗(yàn)預(yù)測(cè),蘭登會(huì)以57%對(duì)43%的優(yōu)勢(shì)獲勝?!段膶W(xué)文摘》的顯赫威望支持著它的預(yù)測(cè),因?yàn)樽?916年起,在歷屆總統(tǒng)選舉中該雜志都能正確地預(yù)測(cè)出獲勝的一方。實(shí)際的競(jìng)選結(jié)果是羅斯福以62%對(duì)38%的一邊倒優(yōu)勢(shì)贏得了1936年的選舉,連任總統(tǒng)。
這是重要民意測(cè)驗(yàn)曾作出過的最大誤差。接受民意測(cè)驗(yàn)的人數(shù)這么多,但《文學(xué)文摘》這么大的預(yù)測(cè)誤差是怎么產(chǎn)生的呢?目前關(guān)于此問題的解釋集中在取樣策略方面。
1、取樣方法:郵寄1千萬份問卷,回收420萬份,但調(diào)查對(duì)象是從電話簿、汽車車主的登記資料以及選舉人的登記名單中選取。在經(jīng)濟(jì)大蕭條時(shí)期,電話和汽車并不像現(xiàn)在這樣普遍,當(dāng)時(shí)僅有1100 萬人擁有住宅電話,但900萬人失業(yè),僅針對(duì)擁有汽車和電話的少數(shù)人進(jìn)行調(diào)查并不具有代表性,但是這些名單比較容易得到。
2、抽樣偏差:取樣中包含過多的富人,而該年貧富間選舉傾向相距極大。那些富人支持共和黨的候選人,那些未能被調(diào)查的低收入民眾卻大部分支持民主的羅斯福,導(dǎo)致調(diào)查結(jié)果失真。取樣有偏差時(shí),再多的樣本也沒有用。
3、有回答或拒回答( non-response),或低回復(fù)率( response rate) 引起偏差。郵寄發(fā)出的調(diào)查問卷大約有1000萬張,但只有少數(shù)的調(diào)查表被收回,有效回復(fù)率僅為23%。在收回的調(diào)查表中,蘭登非常受歡迎。于是,該雜志預(yù)測(cè)蘭登將贏得選舉。以芝加哥為例,問卷寄給1/3 的登記選民,回收的20%的問卷,其中超過一半宣稱將選蘭登,但選舉結(jié)果卻是羅斯福拿到2/3的選票。對(duì)此,有的研究者認(rèn)為回復(fù)此項(xiàng)調(diào)查的樣本對(duì)象大都心存偏見。2