好文嚴選:大數據不能做什麼? —— 互聯網雙週評

2014-12-21 05:28

? 人氣


之所以大型商圈不僅僅有購物超市,還有甜品店、美食街,人們不是衝著甜品店、美食街來的,但是,因為人們行為的不確定性,不知道購買襯衣、牛奶等生活用品究竟會花多長時間,購物間隙才有了甜品的用武之地,如果購物結束靠近用餐時間,美食街也會有生意。

透過<Google新聞> 追蹤風傳媒


不僅甜品、美食,商場裡的新商品也都是因為人們行為的不確定才被銷售出去的,因為新產品並不在人們計劃購物的範圍內。如果刻意增加購物預測的精確性將會怎樣?甜品店、美食街甚至電影院都將是多餘的。


生態之美源於不確定性,生態中每一個參與者都表現出足夠的自由度,世界才會豐富多彩,大型商業區具有生態特徵,對生態型社區進行精確預測,會讓整個社區失去生機,所以大數據不能夠用來消除生態中的不確定性。


三、大數據不能預測新業務


大數據的宣講案例中,常常有一個啤酒和尿不濕的故事,建議把啤酒和尿不濕放在一起賣,說是數據統計發現,男人買啤酒的時候會順便買尿不濕,這顯然是一個誤導,因為小孩需要尿不濕大概只有3年,一個活70年的男人,只有幾年處在需要給孩子買尿不濕的情況,也就是說,大多數情況下,買啤酒的男人沒有買尿不濕的必要。
當然,買啤酒和買尿不濕在一定的情況下會成為關聯事件,比如一個青年公寓,生孩子的情況比較集中,但是,此時數據出現關聯只是結果,青年公寓才是原因。


一些極端情況下,根據數據進行類似啤酒和尿不濕搭配可能會出問題,比如香水和避孕套,男人在逛超市時為取哄情人會買香水,當然,也會偷偷買好避孕套,但是,如果把香水和避孕套放在一起,讓男人當著情人面去買避孕套就會產生問題。


不能從大數據的相關性直接得出結論,而是要先確定業務邏輯,再用數據相關性去驗證。數據只是行為的結果而不是相反,大數據之所以能夠輔助預測,是因為人的行為具有規律性,一個具有朝九晚五、週末大休規律的白領,行為數據才會呈現出以日、週、月、年為周期。


創新業務,也就是跟過去不一樣的業務,因此,大數據是沒法預測新業務的,也沒法根據數據分析確定新出現的業務關聯性是臨時的,還是可持續的。


互聯網雙週評問題延伸—大數據能做什麼?


大數據當然能做很多事,正如現在許多數據公司在做的一樣,雖然大數據在不同領域的處理能力不同,但大數據分析和工業時代的工具一樣,是普適性的,換句話說,大數據幾乎可以用於所有行業。


數據難道不比具體的現象更準確嗎?


尺子的量化當然更具有普遍的意義,但175這個數字如果不知道是用來記錄身高,或者不知道單位是厘米的話,就無法知道用它來做什麼,更談不上準還是不准。


大數據時代,怎麼理解用數據說話?


數據是現實的記錄,數據不會說謊,未來是過去的延伸,大數據分析能夠預測未來的一些特徵,但預測不是唯一的,沒有業務邏輯輔助,數據給不出正確結論。


既然大數據不能精確預測,那麼大數據對科學範預測比日常生活更適合嗎?


恰恰相反,大數據是複雜的科學運算,目的就是解決海量不規則數據輸入下如何得到更準確結果,好比坐地鐵,地鐵無法精確到達某個人的家裡,但是個有效的接近工具。

* 作者為資深互聯網高管,科技財經作家,天使投資人。(原文刊載騰訊大家網,責任編輯:代金鳳)

關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章