黃銘崇專文:「巨量資料」概念下的史料收集與歷史書寫

2020-09-13 05:50

? 人氣

後來林富士提醒我,這次公民運動產生的大量史料就是典型的「巨量資料」。所謂「巨量」,不僅在其量大,更重要的是資料之完整性。如果能夠趁著這段記憶與相關材料仍然鮮活時,儘量完整地收集,則未來與此次運動有關的歷史或社會學研究,就可以運用「巨量資料」的概念進行,而與過去的歷史研究產生相當大的差異。因此,我開始研讀相關書籍,並進行構思,希望能引起歷史學界同仁,特別是年輕學者的注意,一起開始此一新型態的歷史研究。當然,由一個網路世界LKK的「網路移民」,而非年輕且更具有資格的「網路原住民」,來談這麼新穎的「巨量資料」與「歷史學」之間的關係,實在是有點奇怪,自己也覺得相當意外。以我粗淺的程度,本文只能說是拋磚引玉,相信有很多年輕的學者,可以寫得更好。

透過<Google新聞> 追蹤風傳媒

臉書執行長祖克伯(美聯社)
Facebook、LINE等新興社群媒體興起改變網路資訊傳播的方式,亦改變歷史記錄的角度。(資料照,美聯社)

巨量資料與歷史研究的現狀

近來,「巨量資料」(Big Data)就像龍捲風一樣,席捲整個世界的知識界。這陣風也吹到了台灣,從科技部部長到像我這樣的無名小卒,從科學家到人文學者,在短短的幾個月內,都在談「巨量資料」或「大數據」(我不喜歡用中國的名詞,以下將不會使用)。究竟「巨量資料」是什麼?有什麼樣的魅力與威力?關於「巨量資料」,網路與坊間已經有很多相關書籍(如Mayer-Schönberger & Cukier, 2013),也有很多學科早已運用,本文不擬贅述。

此處要談的,是利用「巨量資料」進行歷史研究。事實上,這種觀念過去已經存在,包括筆者在早期中國史研究中,用「巨量資料」概念與地理資訊系統搭配以進行古代政治地景分析等,皆已經用到了「巨量資料」的概念,只是還未利用到這個名詞。以「巨量資料」的概念進行歷史研究是一個相對新的領域。真正開始使用「巨量資料」這個名詞,並企圖有系統地在歷史學與人文領域中運用,至今也不過短短幾年。而其概念之成型,則是去年年底開始、由美國匹茲堡大學Patrick Manning所主持的CHIA(Collaborative for Historical Information and Analysis),CHIA企圖建構一個在空間方面橫跨全球,在時間方面跨越近世四、五百年的全球史資料架構。這並不是一個已經完成的全球史巨量資料庫,而是一個巨量資料庫的架構,加上局部的實踐,以及要連結這樣一個龐大計畫,啟動之前許許多多必須處理與確認的內容與細節。距離一個真正可以操作的全球史巨量資料庫出現,我認為還需要一段時間,而且需要更龐大的經費挹注,以及更多歷史學者投入這個陣營,增益各種資料並強化研究。

稍微了解了Manning這個現在已經亮出「巨量資料」招牌,而且算是跑得比較快的計畫以後,我的評估是以「巨量資料」的概念進行歷史研究,隨著網路的速度加快、運用範圍愈廣、愈來愈多資料被數位化、愈來愈多數位生產的資料產生、愈多與人類歷史有關的資料庫交叉結合以及運算能力愈來愈強大等各項發展,收集資料對於歷史學家的挑戰,會從一項基本的技藝,變成一種資料擷取的創意。「巨量資料」的歷史研究現在雖然還在拓荒階段,但假以時日,巨量資料的歷史研究雖然不會成為歷史研究的整體,卻遲早會成為歷史研究重要的一環。目前這項歷史研究新技藝的進展尚屬於開創期,只要有合適的材料、有創意的研究概念,都有可能在這個新領域上有所作為。我認為318公民運動產生的史料與根據這些材料所進行的歷史研究,就是一個這樣的契機。由於318以來的史料,規模已經不小,要完整收集,有賴台灣的歷史系所通力合作,共同參與架構資料庫與系統採集資料,並且分工完成結構性資料架構的建置。這項工作,不但可能改變歷史系學生的思考模式與研究方法,甚至可以整體性強化歷史系學生的職場競爭力。

20200908-《歷史學柑仔店》立體書封。(左岸文化提供)
《歷史學柑仔店 1》立體書封。(左岸文化提供)

*作者為中研院歷史語言研究所研究員,本文選自《歷史學柑仔店 1》(左岸文化)

關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章