還有,泡茶的時候,為了避免許多不相關的因素影響這位女士的辨別,還要嚴格控制每杯茶的溫度、茶和奶量的多少,以及它們充分混合的時間,要確保這些條件都完全一樣。
而這位女博士要做的,就是在品嚐之後,將8杯茶分成2組,一組是把奶倒進茶裡的,一組是把茶倒進奶裡的。
這其實又是一個機率的問題。從8杯裡任意選出4杯,就有70種可能性,而這70種可能性當中,只有一種可能是8杯全部都分對的情況。也就是說,如果完全靠猜的,她猜對的機率是1/70≈1.43%。
費雪又計算了這位女博士猜對6杯的可能性,這種情況是,女士在把奶倒進茶裡的4杯當中選了3杯,又在把茶倒進奶裡的4杯當中選了1杯,這種組合的可能性有:4×4=16種。猜對6杯的機率是16/70≈22.85%。
顯著水準的誕生
但猜對8杯的可能性只有約1.43%,也就是說,如果有8杯茶,女博士仍然可能全部猜對,但可能性非常低。
也許你會問,雖然約1.43%,可能性確實不高,但也的確有可能啊,也許她就有這麼好的運氣呢?哪怕可能性只有10億分之1,也是有可能的,要是恰好就中了這10億分之1呢?如此下去豈不是沒完沒了,永遠無法得出結論。費雪當然不會讓這種情況發生,那到底該怎麼判斷她是不是用猜的呢?費雪的重要貢獻之一,是提出了判斷一個實驗是否有效,必須設定一個機率的上下限,他稱之為「顯著水準」,他常常把這個水準訂為5%。小於5%的,他就認為可能性可以排除、不考慮。
因為22.85%大於5%,所以他認為6杯不行,要增加到8杯,靠猜對的可能性才能下降到顯著水準5%以下。順便說一下,如果是10杯,那麼全部猜對的機率只有1/1024。
那實驗的結果呢?
根據現場的人回憶,這位女博士居然準確地判別了8杯茶!這確實有點神奇,她究竟是如何做到的呢?英國皇家化學協會曾經給過一個答案,泡奶茶最佳的方法是先倒牛奶,因為牛奶蛋白會在攝氏75度時發生變化。如果後倒牛奶,那麼牛奶就會被高溫的紅茶包圍起來,導致牛奶蛋白發生變化,味道也可能有變化,而將紅茶倒入涼牛奶之中,則不會出現這種情況。
連泡茶都如此講究,這又令人聯想到馬克思筆下那「道地的英國人」。這個奶茶實驗成為統計學歷史上的一段經典逸事,被後世眾多課本引用。
作者簡介|涂子沛
大數據先鋒思想家,曾在美國學習、工作多年,2014年從矽谷回到中國,出任阿里巴巴集團副總裁。2018年創建數文明科技,同時擔任伊斯佳股份董事、人民網和國地科技獨立董事。
著有《大數據》、《數據之巔》、《數文明》、《給孩子講大數據》、《給孩子講人工智能》等作品,相關著作累計銷售已突破100萬冊。
大學畢業於華中科技大學計算機系,研究所畢業於中山大學、卡內基梅隆大學,獲公共管理碩士和訊息技術科學碩士學位。
本文經授權轉載自時報出版《數商:向阿里巴巴前副總裁學習數據時代的生存商數》
責任編輯/陳怡蓁