楊建銘專欄:大數據理想國已近?

2017-01-20 07:00

? 人氣

金融上就更不用說了,以股票來說,除了股價和交易量可以由金融市場上「準確而即時」地得到以外,公司的營運數字和產業相關數字大多充滿模糊性,而且往往延遲甚久才能取得。事實上就連股價和交易量都不見得能視為「正確資料」——因為根據隨機漫步理論,市場交易價格只有在長期才會符合基本價值,短期會受到各種不明因素的影響,因此股價是典型的「準確」但不見得「正確」的數據,搜集再多也不見得能協助投資人做出好的投資決定。

透過<Google新聞> 追蹤風傳媒

數據的另一個明顯風險是「客觀性」

在市場學中,問卷的設計就很容易受到主觀的影響,根據這樣的問卷蒐集到的資料就算「正確」——亦即消費者認真憑著良心回答——也無法協助市場專家做出客觀的結論。

在金融上,「客觀性」更是專業投資人每天對自己耳提面命,卻常常很難達到的一個聖杯。事實上為了達到「客觀性」,金融理論要求從業人員對每一個投資的決定都進行統計學上的「假設檢定(hypothesis testing)」,而且還得從很不直觀的「對立假設(alternative hypothesis)」去驗證,才能回頭陳述直觀的「空假設(null hypothesis)」有多少可能性為真。但事實上是當市場在長期多頭,連傻子也都可以賺錢時,這些檢定大多會成功確認假設的正確,當市場崩潰導致假設被否定時,從業人員往往會傾向將市場崩潰當作是意料之外,在這樣的心理操作下,「客觀性」其實是完全不存在的。

數據的另一個風險是讓人產生「一切都在控制中」的錯覺,由於1.1比1.09多了0.01,因此我們感覺對於這兩個數據有了更深的理解,如果1.1比起1.09是我們更想要的結果,我們會傾向去找出可以讓1.09變成1.1的其他數據,並設定策略去影響那些數據。

但是不管在市場學或者金融理論中,都存在著「相關程度(correlation)」和「因果關係(causal)」的渾沌。有時候數據分析出來會讓人以為是因果關係,但有可能只是相關程度而已。經濟學家李維特在暢銷書【蘋果橘子經濟學】就舉過一個讓人印象深刻的例子:根據研究顯示,家中藏書超過一定數量的家庭,青少年在高中的學業表現較為優異。對於渴望「控制」的人性來說,可能會輕易達成「藏書多」代表「青少年讀書多」因此「學業成績優異」的結論,並建議家長以「藏書」做為可執行的策略。但李維特說經過其他數據交叉分析,他們發現藏書多的家庭多半父母受過高等教育,平均智商也較高,因此這些家庭的青少年學業成績較優異,可能只是遺傳了較高智商並且在較優渥的環境下成長而已。如果家長真的以為買很多書就能夠讓小孩「贏在起跑點」,那只是平白便宜了登門推銷百科全書的肥胖業務員而已。

喜歡這篇文章嗎?

楊建銘喝杯咖啡,

告訴我這篇文章寫得真棒!

來自贊助者的話
關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章