政府巨量資料的應用,在前後任科技部長張善政與徐爵民熱心推動下,克服無人、無錢、無題目的「三無」困境,打造大數據分析的「新絲路」。新絲路的開拓是透過學者的自由發想,構思出巨量資料在政府施政上可能適合的應用情境,挖掘出政府制訂公共政策的資訊。張善政院長領導的科技團隊在短暫時間內,讓這些躺在政府內部、從未被開發利用的「資料金礦」,展現初步的研發成果,值得我們肯定,但在實際運作過程中,也發現不少路障必須搬開。
路障一:政府自己為什麼不做?
政府推動任何施政,最重要產物之一就是累積龐大的資料庫,有誰比政府更瞭解資料庫的用途與限制?政府不當成是自己主辦的業務自行分析與應用,卻倚賴科技部編列經費,以研究計畫方式委託學者挖掘礦脈,這就值得檢討了。老實說,政府官員高學歷者比比皆是,應非官員本身的能力不足,而是官員忙於送往迎來的政治公關、等因奉此的官樣文章或消磨志氣的繁雜瑣事,壓縮了政府官員分析大數據以提升決策品質之精力與時間。
從事「數據導向的政策分析」是歐美先進國家政府官員的責任,但我國政府少有這種嚴肅態度。試以當前大學數目過於浮濫的夢魘來說,主其事者只要運用簡單的大專生就學率與出生率等數據,就可以訂定大學數目的「總量」管制標準,何至於出現如今的大學倒閉潮?基此,政府巨量資料的分析應是政府業務的一部份,必須自己去分析,學者只能接受更高層次的大數據分析技術。
路障二:走出科技部以外,能自由發想?
科技部是非常尊重學者專家的部門,故賦予學者自由發想的學術空間,而這種尊重學術研究的態度正是大數據分析的要件之一,蓋大數據分析往往無法預期其研究成果,學者絞盡腦汁挖掘出來的資訊固然可能是有價值的,但也可能產生平淡無奇、毫無價值的垃圾資訊,甚至可能出現誤導性的資訊。
上述幾種政府巨量資料應用可能產生的「風險」,科技部可以接受,但科技部以外的中央或地方政府機關能夠接受嗎?須知政府委託研究計畫,悉依《政府採購法》規定辦理,公開招標文件必須載明確定的委託研究項目與預期研究成果,大數據分析若未產生預期的研究成果,抱著法規辦事的公務員膽敢驗收這樣的研發成果嗎?這是一個嚴肅的問題,據本人所知,不少中央各部會官員或地方政府首長都蠢蠢欲動,希望能趕上大數據分析的時髦,但多數官員並不瞭解大數據並非是萬靈丹,政府可能得到一大堆毫無用處的資訊。
路障三:政府能提供「奈米級」的高品質資料嗎?
大數據分析的價值取決於資料品質,而所謂資料品質是指政府提供的資料單元不能太粗,例如,致癌率、出生率等以「縣市」或「年度」為分析單元的「結果資料」,分析價值有限。相反地,必須提供出細緻到「奈米級」程度的「過程資料」,例如,以鄉鎮市區、每日或小時為分析單元的政策執行過程資料;一般而言,資料顆粒愈細,愈可能得到有價值的資訊。