0到[0,1]
金融數據科技結合資訊科學與金融財務,其中一個關鍵點是如何將確定的資料(Data),轉為有不確定的投資判斷 (Decision),並且在0到1之間找答案。也就是在1為百分之百確定,0為毫無信心的範圍內,利用各式市場資訊來做判斷決策。只是市場雜訊紛擾,如何能確定判斷的可信度呢?
台北市的街口總是熙來攘往,找一天我們可以坐在街口的咖啡店,找個窗邊的位子坐下,細數來來往往的人們,有多少人向北走,多少人向南?觀察久了之後,或許我們可以依路人行進的方向,判斷哪邊有較多美食。如果我們進一步觀察行人手上的購物袋,分析出多少人在積極消費,是不是能給出一些景氣的資訊,來協助作為金融市場的判斷呢?當然這分析過程是會稍微再複雜一些。
資料(Data)的運用
首先,資料(Data)與資訊(Information)並不同,資料來源五花八門,但需經由仔細的分析,才能得知有多少資訊隱含其中,許多人稱為資料探勘(Data Mining),例如將觀察到有購物袋的人的資料,統計算出超過8成的人都買了非民生必需品,那可能就是個有趣的資訊。
如何將資訊(Information)進一步轉化為金融市場的判斷(Decision)則為金融數據科技的價值。在資訊尚未應用於一個明確的金融市場判斷之前,是一個0的狀態,也就是在沒有斷言之前,甚麼都對。事後諸葛人人都會,只是鮮有有價值。
而真要下判斷時,通常會伴隨著一個準確度或可信度機率,機率是一個介於0到1之間的數值,數學家常以[0,1]代表0到1之間的所有可能性。也因此金融數據科技專精在從0到[0,1]的一個過程,所建構的模型也常稱為「金融數據模型」。
金融數據科技的進步最直接的貢獻在於加速資料到判斷的過程,因為好的資料是有時效性的。例如某支股票財報公布相當亮眼,如果等太久就變成大家都知道的事情,不外乎就只是個過氣新聞罷了。因此有用的情報多半需要及時處理,並且系統化的將資訊取出彙整,甚至有些是某種情境下才能使用的情報,這樣的工作很適合使用電腦程式來處理。
在今日很多資料數位化之後,我們可以利用科技快速蒐集,但太多資料有時跟沒有資料是一樣沒用的,因為珍貴的資訊常常會被掩埋在無關緊要的資料中!想像如果今天我們使用高科技在路口詳細記錄了每個行人的購物袋顏色與花紋,這樣的資料對於分析群眾的消費行為可能扯不上邊。
因此資料並不是多就好,而是要能經由分析整理產生資訊,並協助做判斷決策,以金融的領域來說,大家最在意的判斷可能是哪支股票會漲吧!
量化金融
如果以[0,1]代表著上漲的所有可能機率,1意味著100%定漲,幾乎是無論如何買就對了的判斷;但是當預測的數字為0.25,也就是僅有4分之1的機會會漲,這樣你投資可能就會有所保留了。
這時聰明的朋友就會問,漲跌機率固然重要,漲跌的幅度也要考慮,這樣才能算實際的報酬啊,的確是如此。
如果漲幅為40%,跌幅為-4%,期望的報酬則為正的7%,那就可能適合投資。但當漲幅為4%,跌幅為-4%,期望的報酬則為-2%,如果還願意投資就非出於理性判斷了。
當我們把判斷的時間縮得夠短,通常會把漲跌幅設為一個定值,例如正負0.1%的幅度,搭配上漲跌機率就可以得到股票價格一系列隨時間的變化,稱為隨機過程模型。有了這樣強大的模型就能進而判斷股票在某個時間區間的漲跌,這就是量化金融的基礎之一。
判斷漲跌變化,其實還有許多其他的考量,如漲跌停、配息、企業整併等等,專業的金融數據科技人會盡量讓金融數據模型更貼近實際市場。
即便如此,0到[0,1]的模型操作仍是單純的,金融投資的判斷困難度常隨著商業複雜度、資金量成長、國際資本市場環境而增加,如何從數據到策略,而實際要能應用於資本管理,就真的進入投資的顯學,我們以後多聊。
*作者林敬倫博士(Peter Lin Ph.D.)為高曼計量/高曼投顧董事長,同時任教於美國約翰霍普金斯大學,專長為計量財務金融,並致力於金融科技創新。