一個(gè)真實(shí)卻又有些荒謬的故事:
一位通用旗下品牌龐蒂亞克汽車用戶,發(fā)現(xiàn)每當(dāng)他購(gòu)買香草口味的冰激凌后,他的汽車就無法啟動(dòng)。于是這位顧客給通用寫了兩封投訴郵件,并在第二次發(fā)送郵件后,成功揭開了汽車與冰激凌之間的關(guān)系謎團(tuán)。
圖片來源:圖蟲創(chuàng)意
顧客的投訴郵件
這位顧客家有個(gè)傳統(tǒng):每天晚飯后一家人開車去吃冰激凌,并且每天晚上買不同口味的冰激凌。但是當(dāng)他去買冰激凌時(shí)發(fā)現(xiàn)了一個(gè)問題:每當(dāng)買香草冰激凌,汽車都不啟動(dòng),但如果買其他口味的冰激凌,汽車就會(huì)很好地啟動(dòng)。
汽車公司的經(jīng)理雖然很懷疑事情的真實(shí)性,但還是派了一位工程師調(diào)查這個(gè)問題。
工程師和車主見了面,約定一起去買香草冰激凌,他們到了商店,買完冰激凌,發(fā)現(xiàn)車真的不啟動(dòng)了。
工程師盡量還原場(chǎng)景,并連著三天晚上開車去買冰激凌。
第一晚,買巧克力味的,車啟動(dòng)了。第二晚,買草莓味的,車啟動(dòng)了。第三晚,買香草味的,車不啟動(dòng)。
這到底是怎么回事?經(jīng)過仔細(xì)地勘察和分析,工程師發(fā)現(xiàn),買香草冰激凌所用的時(shí)間遠(yuǎn)比買其他口味的要短。
香草冰激凌賣得最好,它被放在商店離門口很近的地方,不需要找,直接拿起來付賬即可。
購(gòu)買時(shí)間又和車的啟動(dòng)有什么關(guān)系?工程師對(duì)這個(gè)顧客的汽車進(jìn)行檢查,發(fā)現(xiàn)了“氣阻”的問題。氣阻通常在發(fā)動(dòng)機(jī)較熱時(shí)出現(xiàn),如果汽車的供油系統(tǒng)中出現(xiàn)氣阻,引擎吸燃料時(shí)燃料的供應(yīng)會(huì)變得斷斷續(xù)續(xù),汽車會(huì)因此無法啟動(dòng)或者在行進(jìn)時(shí)熄火。
這位顧客購(gòu)買的龐蒂亞克汽車就有氣阻的問題。購(gòu)買其他口味冰激凌花費(fèi)的時(shí)間足以讓引擎冷卻從而讓車順利啟動(dòng),而當(dāng)顧客購(gòu)買香草冰激凌時(shí),時(shí)間短,引擎太熱,氣阻無法及時(shí)消失,汽車因此無法啟動(dòng)。
工程師解決了顧客汽車的氣阻問題,這位顧客以后在購(gòu)買任何口味的冰激凌時(shí),再也沒有出現(xiàn)車無法啟動(dòng)的情況。
大部分人看完上文中的故事的收獲是:有時(shí)候問題看起來無解,但在冷靜思考后會(huì)發(fā)現(xiàn)它的確可以被解釋。如果從數(shù)學(xué)思維深入分析就會(huì)發(fā)現(xiàn),故事中包含了一個(gè)數(shù)學(xué)概念——條件獨(dú)立。
學(xué)會(huì)條件獨(dú)立思維,避免陷入混亂
條件獨(dú)立和條件概率有關(guān)。我先介紹什么是條件概率。條件概率通常寫成P( A|C ) 的形式,即在事件C發(fā)生的情況下,事件A發(fā)生的概率。
例如,下雨天通常選擇打車上班。在這個(gè)例子里,C就是“下雨天”,A就是“打車”,而P( A|C ) 就是一個(gè)接近1的概率值(下雨天通常會(huì)打車)。如果去掉C下雨天這個(gè)條件,P( A ) 就是通常情況下你打車的概率。明顯可以看出,P( A|C ) 和 P( A ) 是不同的。
知道了什么是條件概率,我們就可以給出條件獨(dú)立的定義。在數(shù)學(xué)上,如果事件A和事件B關(guān)于事件C條件獨(dú)立,那么有:
P( B|A, C ) = P( B|C )
P( A|B, C ) = P( A|C )
P( B|A, C ) 是在事件A和事件C同時(shí)發(fā)生的情況下事件B發(fā)生的概率,P( B|C ) 是在事件C發(fā)生的前提下事件B發(fā)生的概率。這個(gè)公式告訴我們,在條件獨(dú)立的情況下,這兩個(gè)概率是相同的。
這樣說有些抽象,我們來舉個(gè)例子:
一項(xiàng)調(diào)查發(fā)現(xiàn),每當(dāng)倫敦的出租車駕駛員穿夾克,發(fā)生車禍的概率都會(huì)大大增加。很多人猜想是穿夾克導(dǎo)致駕駛員的操作不便,從而增加了事故發(fā)生率。后來又經(jīng)過仔細(xì)研究發(fā)現(xiàn):下雨天,駕駛員經(jīng)常穿夾克;下雨時(shí),發(fā)生車禍的概率大。
這個(gè)例子中,事件A是“穿夾克”,事件B是“發(fā)生車禍”,事件C是事件背后共同的原因:“下雨天”,三者的關(guān)系如圖 7-2 所示,
也就是說,我們知道了“下雨天”,自然就可以推斷出“發(fā)生車禍”的概率比較高,并且“駕駛員穿夾克”實(shí)際上并不能幫助我們更好地推測(cè)“發(fā)生車禍”的概率。
因此,“穿夾克”(事件A)和“發(fā)生車禍”(事件B)這兩個(gè)事件之間沒有因果關(guān)系,它們關(guān)于“下雨天”(事件C)條件獨(dú)立。
總結(jié)一下,如果事件A和事B關(guān)于事件C條件獨(dú)立,那么在知道事件C發(fā)生的前提下,知道事件A或事件B中的一個(gè)是否發(fā)生,并不能幫助我們更好地推斷出另外一個(gè)事件發(fā)生的概率。
這就是條件獨(dú)立的核心思想。
生活中常見的條件獨(dú)立案例
如果有一天你家里沒人,并且電器發(fā)生自燃、引發(fā)了火災(zāi),你的左右鄰居看到后,都有一定概率會(huì)撥打報(bào)警電話,但是他們之間不會(huì)詢問對(duì)方是否打過報(bào)警電話。
這個(gè)例子中有三個(gè)事件:事件A“鄰居A報(bào)警”,事件B“鄰居B報(bào)警”和事件C“房屋著火”。在這三個(gè)事件中,如果我們知道了“房屋著火”,那么我們立刻可以推斷“鄰居A報(bào)警”的概率很高。知道“鄰居B報(bào)警”,并不能幫助我們推斷出“鄰居 A 報(bào)警”的概率。
也就是說,“鄰居A報(bào)警”和“鄰居B報(bào)警”關(guān)于“房屋著火”條件獨(dú)立。
再來看個(gè)條件獨(dú)立的例子:
心理學(xué)上有一個(gè)情緒ABC理論。這是美國(guó)心理學(xué)家阿爾伯特·艾利斯(Albert Ellis)提出的一種情緒調(diào)節(jié)法。這里的A代表激發(fā)事件(Activating event),是引發(fā)情緒和結(jié)果C的間接原因,而引起結(jié)果C的直接原因則是個(gè)體基于對(duì)激發(fā)事件A的認(rèn)知和評(píng)價(jià)所產(chǎn)生的信念B。(見圖7-5))
假如一個(gè)小學(xué)生學(xué)習(xí)不夠努力、成績(jī)不好,他的父母自然感到很生氣。很明顯,學(xué)習(xí)不夠努力、成績(jī)不好,就是父母生氣的直接原因。
可是,仔細(xì)分析后會(huì)發(fā)現(xiàn),上文的推理過程并不完全正確??赡芎⒆訉W(xué)習(xí)不好并不會(huì)直接讓家長(zhǎng)郁悶,讓家長(zhǎng)郁悶的推理鏈的中間還有一環(huán),那就是家長(zhǎng)的認(rèn)知。在已知“家長(zhǎng)的認(rèn)知更全面”的前提下,知道“孩子的成績(jī)”,并不能幫助我們更好地推測(cè)“家長(zhǎng)的反應(yīng)”。
也就是說,“孩子的成績(jī)”(事件A)和“家長(zhǎng)的反應(yīng)”(事件C)關(guān)于“家長(zhǎng)的認(rèn)知”(事件B)條件獨(dú)立。
回到開頭買香草冰激凌汽車就啟動(dòng)不了的問題:
其中事件A是“購(gòu)買香草冰激凌”,事件B是“車啟動(dòng)不了”,事件C是“購(gòu)買時(shí)間短”。
“車啟動(dòng)不了”的內(nèi)在原因是“購(gòu)買時(shí)間短”,而不是“購(gòu)買香草冰激凌”。在“購(gòu)買時(shí)間短”這個(gè)事件發(fā)生的前提下,知道“購(gòu)買香草冰激凌”并不能幫助我們更好地推斷“車啟動(dòng)不了”的概率。
所以,“購(gòu)買香草冰激凌”(事件A)和“車啟動(dòng)不了”(事件B)關(guān)于“購(gòu)買時(shí)間短”(事件C)條件獨(dú)立。
綜合上述生活中的案例,我們不難看出,兩個(gè)事件看似相關(guān),實(shí)則關(guān)于另外一個(gè)事件條件獨(dú)立的情況非常普遍。如果意識(shí)不到這一點(diǎn),就很容易犯把“相關(guān)性”當(dāng)成“因果性”的錯(cuò)誤。學(xué)會(huì)條件獨(dú)立的數(shù)學(xué)思維,才能幫助我們有效避免陷入混亂。
文章由科普中國(guó)-星空計(jì)劃(創(chuàng)作培育)出品,轉(zhuǎn)載請(qǐng)注明來源。
作者:北京航空航天大學(xué)副教授、博士生導(dǎo)師 劉雪峰
審核:華中師范大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)學(xué)院 副教授 鄧清泉