人們對大數據寄予了許多的希望:賣出更多的貨物,做出更好的產品,找到更酷的朋友,甚至幫我們決定明天早上是否睡個懶覺。現在,凡是有信息流通的地方,都有人們對大數據的期望。
大數據果真如此神通嗎?大數據不能做什麼?下面從幾個方面來談談大數據的反面。
一、大數據不能對具體行為作出精確預測
事實上,人們的社會行為具有不可預測性。甚至我們不妨可以定性地歸成一個大數據測不准原理:人和事件,如果放到越大的空間和時間範圍,則是越可以精確預測的;如果放到越小的空間和時間範圍,則是越不可以精確預測的。
舉個例子說:我們幾乎可以在100%的程度上預測一個人24小時的範圍內會吃飯,但若精確到某一分鐘,則幾乎不可能預測準確。進一步我們會發現,利用更多過去一段時間的數據,能夠幫助我們提高預測某半個小時內是否吃飯的機率,但如果把時間精確到某一分鐘,則更多的數據幾乎提高不了預測的準確性。
其實,行為的不可預測性早已植根於人類的潛意識中。
比如,我國前一陣子發射了嫦娥三號探月飛船,在嫦娥三號發射前,科學家們已經計算出了在未來的一個月之後的某個小時、分、秒,嫦娥三號在月球上空高度和經緯度,如果這個計算結果偏離預計幾十米,則可能推遲發射,重新計算校準。這是科學對未來的精確預測。
相對的情形是,在晚上10點以後,當我們準備睡覺的時候,能預測明天早餐後下樓碰到的第一個人是誰嗎?幾乎沒有人能知道,但這個巨大的不可預測卻沒有引起人的關注,幾乎沒有人會因為不知道下樓碰到的第一個人是誰而影響睡覺。人們對不可預測性熟視無睹。
大數據的有效範圍討論,需要引進一個假設:人們可以自由決定自己的行為(常常稱為「自由意志」)。一個人自由決定自己行為,在別人看來,就是他的行為無法預測,如果能夠精確預測未來的一舉一動,就不具備任何的自我決定的自由。
因此,大數據不能對具體行為作出精確預測,即大數據測不准原理。
大數據的不可預測性說明,企圖利用大數據預測用戶具體行為的努力或許是徒勞的,我們哪怕掌握一個人從出生開始就有的全部行為信息,也無法預測明天早餐他會吃什麼。這也意味著,許多基於用戶歷史數據進行行為分析的努力會遇到瓶頸,預測縮小到一定範圍之後,無法再精確下去。
二、大數據不能用來消除不確定性
大數據不能對具體行為進行預測,還表現大型社區的行為預測上。
最近,很多城市的商業中心開始引入了大數據技術,希望對用戶行為作出精確的預測來提高商業中心的有效使用。從單個商家的角度出發,知道進店顧客的精確行為,能提供更針對性的服務,但是,從整個商區的角度來做預測會出現悖論。