倫敦市政府的戶籍登記處有名統計學家,叫法爾(William Farr),他的職責就是記錄人口的最新變化,例如出生、結婚和死亡。這個法爾非常了不起,他在戶政部門工作30幾年,建立了完善的倫敦出生和死亡人口記錄體系。法爾對斯諾的觀點半信半疑,他提出:要測定水源對霍亂的影響,必須要有2組居民,這2組人生活在同一海拔高度、活動於同一空間、吃的東西一樣、日常活動也要相同,僅僅一方面不同,那就是喝的水,但在現實中的倫敦,顯然找不到這樣的實驗條件。
然而,斯諾認為,實驗已經擺在眼前。2家公司的管道都通向所有的街道,進入幾乎所有的院落和小巷,無論貧富,無論房子大小,2家公司都等而視之地提供自來水服務,而接受不同公司服務的客戶,他們在生活條件或職業方面也無明顯的區別,特別是他們都被同樣的「瘴氣」圍繞,為什麼有的生病,有的沒事呢?
1849年,斯諾把這些調查和發現編寫成一本小冊子《霍亂的傳播方式》,正式提出水汙染是霍亂流行的真正原因:「再也設計不出比這更好的實驗方式,讓我們澈底地檢測水對霍亂的影響,整套實驗設計已現成地擺在研究者面前,而且這一實驗的規模相當大,多達 30 萬名不同性別、年齡、職業階層和地位的人,從上流人士到底層窮人,被分成了2組,他們不僅不能主動選擇,而且在大多數情況下對這種選擇毫不知情。」一組得到乾淨的水,而另一組得到被汙染的水,所以斯諾得出結論:水源不乾淨,才是霍亂傳播的真正原因。
斯諾的論斷是天才式的。他在「隨機對照實驗」的概念遠遠尚未產生的時代,就在現實中發現了一次科學實驗。科學的實驗機制要到20世紀初才被統計學家確立。但斯諾的這些論述只獲得極少數的人相信,這本小冊子總共才賣出去幾十本。大眾對瘴氣論深信不疑,畢竟,嗅覺是人類一種最原始的感覺,我們相信自己的感覺,就像哥白尼時代的人相信地球是靜止的一樣。人類對感官的迷信可謂根深蒂固,只有一流腦袋才能將數據當作「感覺的替代品」,透過數據來感知我們自己的身體和外部環境。
斯諾告訴法爾,為什麼光看死亡人數,瘴氣論好像很正確?那是因為在海拔高的地方,人口密度往往較低,因此死亡人口總數更少;但真正的原因不是這些地方遠離瘴氣,而是居民遠離了泰晤士河下游,水源較為乾淨。他甚至得出結論說,如果A公司將其取水口移到泰晤士河上游,就可以挽救1000多人的生命!斯諾最終說服了法爾,在他的統計當中增加一個新的變數:死亡者的飲用水源。
同樣是數據分析,為什麼只有斯諾才能洞察真正的因果關係?我想這源自於他對事實和規律持之以恆的細密追蹤。很多時候,流於表面的觀察都無濟於事,最高水準的成就來自一步一腳印的追蹤和不罷休。「實事求是」,事,就是事實;是,則是規律。實事求是即透過事實分析並發現事物的規律。斯諾的方法,可以總結為實「數」求是:把事實記錄下來,再透過全面細密的數據來尋找規律。