楊建銘專欄：風險資本的統計學-風傳媒

「謊言有三種：謊言，該死的謊言，以及統計數字。」這是維多利亞時期英國首相迪斯雷里的名言——或最少是馬克・吐溫宣稱迪斯雷里說的。

一般人熟悉的建立在統計數字上的謊言，大多數來自於資料選擇偏差（data selection bias）：只要原始資料數量夠龐大，任何人都能夠透過選取對自己的論點有利的樣本空間——也許是年代區間，也許是年齡範圍，也許是地理區隔，又或許是職業類別——來佐證自己的假說或者論點。事實上這也是川普和其支持者對於統計數字輕蔑的來源，正因為資料選擇如此容易被操弄，他們反過來支持非科學、純直覺的情緒論述，也讓川普一舉坐上總統寶座。

但在風險資本的世界中，統計數字的謊言——或者說使用上的風險——不見得來自於資料選擇偏差，更多來自於風險資本和新創在統計分佈上那驚人地高的偏度（skewness）。

如果我們拿對於傳統產業的證券分析做比對，一個特定產業在一個國家可能有五間上市企業在彼此競爭，他們的市佔率總合可能抵達整個市場的八成，他們的營收和獲利表現的加權平均幾乎就是產業的整體狀況。這五間企業中有的會優於整體狀況，有的會劣於整體狀況，但是優劣差距不會高達十倍或百倍，他們的市值也不會差到十倍或百倍。在這樣的產業中，拿這五家公司的各種營運數字試算出各種統計數字是有意義的，這些平均值、中位數和標準差可以協助證券分析師建立更有意義的估值模型，讓投資人做出更有根據的投資決定。

風險資本的世界卻完全相反。以傳統的風險資本基金假設為例，如果一支基金投資二十間公司，其中一間的回報會返還整支基金，另外兩間會讓整支基金回報到達兩倍，剩下十七間則會倒閉導致血本無歸，在這種高偏度（highly skewed）的樣本空間中，計算這二十間公司的統計數字（募資金額、募資時間、員工人數、執行長薪水、辦公室大小、廁所數目⋯⋯等），用膝蓋想也知道是沒有意義的。

風險資本基金投資的新創如此，風險資本基金本身也是如此。因為同樣是$250M等級的基金，紅杉資本和Founders Fund為投資人的回報最少五倍，甚至可能到十倍，但市場上八成的基金卻只能勉強返還本金給投資人，回報率0%就要偷笑了。這種高偏度的樣本空間裡，統計風險資本基金的「平均」金額和「平均」回報，幾乎不具備任何意義。

尤有甚者，就算根據這些統計數字投資人判斷出應該採取的投資策略也沒用——因為他們仍然不見得「看得到」投資機會，事實上有時候就算「看得到也吃不到」。

1 2 3 4 全文閱讀

楊建銘專欄：風險資本的統計學

楊建銘專欄：風險資本界的出閘猛虎

楊建銘專欄：連矽谷風險資本家都被中興颱風尾掃到？

林意凡觀點：叛逆份子的區塊鏈革命與風險資本家的危機

楊建銘專欄：風險資本家的天下父母心

楊建銘專欄：一堂關於風險資本基金的數學課