「謊言有三種:謊言,該死的謊言,以及統計數字。」這是維多利亞時期英國首相迪斯雷里的名言——或最少是馬克・吐溫宣稱迪斯雷里說的。
一般人熟悉的建立在統計數字上的謊言,大多數來自於資料選擇偏差(data selection bias):只要原始資料數量夠龐大,任何人都能夠透過選取對自己的論點有利的樣本空間——也許是年代區間,也許是年齡範圍,也許是地理區隔,又或許是職業類別——來佐證自己的假說或者論點。事實上這也是川普和其支持者對於統計數字輕蔑的來源,正因為資料選擇如此容易被操弄,他們反過來支持非科學、純直覺的情緒論述,也讓川普一舉坐上總統寶座。
但在風險資本的世界中,統計數字的謊言——或者說使用上的風險——不見得來自於資料選擇偏差,更多來自於風險資本和新創在統計分佈上那驚人地高的偏度(skewness)。
如果我們拿對於傳統產業的證券分析做比對,一個特定產業在一個國家可能有五間上市企業在彼此競爭,他們的市佔率總合可能抵達整個市場的八成,他們的營收和獲利表現的加權平均幾乎就是產業的整體狀況。這五間企業中有的會優於整體狀況,有的會劣於整體狀況,但是優劣差距不會高達十倍或百倍,他們的市值也不會差到十倍或百倍。在這樣的產業中,拿這五家公司的各種營運數字試算出各種統計數字是有意義的,這些平均值、中位數和標準差可以協助證券分析師建立更有意義的估值模型,讓投資人做出更有根據的投資決定。
風險資本的世界卻完全相反。以傳統的風險資本基金假設為例,如果一支基金投資二十間公司,其中一間的回報會返還整支基金,另外兩間會讓整支基金回報到達兩倍,剩下十七間則會倒閉導致血本無歸,在這種高偏度(highly skewed)的樣本空間中,計算這二十間公司的統計數字(募資金額、募資時間、員工人數、執行長薪水、辦公室大小、廁所數目⋯⋯等),用膝蓋想也知道是沒有意義的。
風險資本基金投資的新創如此,風險資本基金本身也是如此。因為同樣是$250M等級的基金,紅杉資本和Founders Fund為投資人的回報最少五倍,甚至可能到十倍,但市場上八成的基金卻只能勉強返還本金給投資人,回報率0%就要偷笑了。這種高偏度的樣本空間裡,統計風險資本基金的「平均」金額和「平均」回報,幾乎不具備任何意義。
尤有甚者,就算根據這些統計數字投資人判斷出應該採取的投資策略也沒用——因為他們仍然不見得「看得到」投資機會,事實上有時候就算「看得到也吃不到」。