例如,下雨天通常選擇搭車上班。在這個例子裡,C就是「下雨天」,A就是「搭車」,而P(A|C)就是一個接近1的機率值(下雨天通常會搭計程車)。如果去掉這個條件,P(A)就是一般情況下你搭計程車的機率(可以藉由統計一年有多少次搭計程車去上班得出)。明顯可見,P(A|C)和P(A)是不同的。
知道了什麼是條件機率,就可以給出條件獨立的定義。在數學上,如果事件A和事件B關於事件C條件獨立,那麼有:
P(B|A,C)=P(B|C)
P(A|B,C)=P(A|C)
P(B|A,C)是在事件A和事件C同時發生的情況下,事件B發生的機率;P(B|C)是在事件C發生的前提下,事件B發生的機率。這個公式告訴我們,在條件獨立的情況下,這兩個機率是相同的。
為了更清楚地解釋這兩個機率相同的含義,我們假設有兩個人,他們都知道事件C發生了,但是第二個人除了知道事件C發生了,還知道事件A發生了。現在這兩個人要根據自己掌握的資訊,推斷出事件B發生的機率。
用數學公式來表達,第一個人要得到P(B|C),而第二個人要得到P(B|A,C)。
一般來說,第二個人知道的訊息更多,其推斷出來的事件A發生的機率也會和第一個人不同。但是在條件獨立的前提下,P(B|A,C)=P(B|C),這兩個人得出的結論完全一樣。
也就是說,如果事件A和事件B關於事件C條件獨立,那麼在知道事件C發生的前提下,知道事件A發生並不能幫助我們更好地推斷事件B發生的機率。
同樣有:P(A|B,C)=P(A|C)
這個公式告訴我們,如果事件A和事件B關於事件C條件獨立,那麼在知道事件C發生的前提下,知道事件B發生並不能幫助我們更好的推斷事件A發生的機率。
總結一下,如果事件A和事件B關於事件C條件獨立,那麼在知道事件C發生的前提下,知道事件A或事件B中的一個是否發生,並不能幫助我們更好地推斷出另外一個事件發生的機率。
這就是條件獨立的核心思想。
條件獨立案例
我們以上文為例,其中事件A是「購買香草冰淇淋」,事件B是「車啟動不了」,事件C是「購買時間短」。
「車啟動不了」的內在原因是「購買時間短」,而不是「購買香草冰淇淋」。如果我們知道這位顧客某次「購買時間短」,那麼不管他這次是否購買香草冰淇淋,我們都可以推斷出這一次「車子發不動」的機率極高。
也就是說,在「購買時間短」這個事件發生的前提下,知道「購買香草冰淇淋」並不能幫助我們更好地推斷「車子發不動」的機率。「車子發不動」和「購買香草冰淇淋」關於「購買時間短」條件獨立。我們用圖7-1來表示這個例子,事件A是「購買香草冰淇淋」,事件B是「車子發不動」,事件C是「購買時間短」。因為事件A很可能導致事件C發生,事件C很可能導致事件B發生,因此A、B、C的關係如圖7-1所示。