人是習慣的動物
人是「理所當然」(Take for Granted)的動物,習慣於既有的模式以及做事情的方式。今日成功的商業模式、行為模式,往往都是在過去時空背景下所發展出來的最佳案例(Best Practice)。面對「範式轉移」,人們卻往往習慣於既有的模式以及做事情的方式。然而當昔日的假設前提都已經改變了,昔日的最佳案例變成習以為常的包袱時,人們常常不自知,做事情的方式沒有跟著調整,企業運作模式也沒有跟著改變,後知後覺,改變的速度沒有跟上科技發展與進步的速度。
面對源源不絕、持續積累的「活數據」,傳統的數據工作者去常不知水深,從一萬筆、十萬筆、一百萬筆、一千萬筆、一億筆、十億筆到一百億筆的「活數據」,不同的處理階段代表著不同的問題。專家們習以為常的包袱越重,越是習慣於昔日處理數據的模式:需要數據分析時才耗時耗力的下載數據,批次處理,而以當下的商業目標為導向用專案方式執行數據工作。
科技讓數據變的更活了,企業做事情需要跟著調整,運作模式要跟著改變。
數據與分析是兩碼子事
世界是活的,數據是反映世界的,所以數據是活的。企業內常存在一個現象:每個人都在等著數據被處理好,然後,分析數據,最後,每個人都認為自己是數據專家,了解數據。卻不知道活數據的處理與分析是兩碼事,是需要不同的專業。
分析是有成就感的事,因為可以看得到成果;反之,數據處理卻是吃力不討好的事。當數據分析協助完成一個決策時,老闆會稱讚分析師分析的好,可是不會想到稱讚工程師數據清理的好。由於活數據整理是件吃力不討好的工作,所以人們習慣去追尋分析的甜美成果,而不願意、也不喜歡去做整理數據的苦工。因此,活數據的處理與分析是很不同的,專業養成不同,工作內容是必須清楚切割的。
苦盡甘來 – 數據處理是苦的,分析結果是甘的。
供給與需求的鴻溝 – Gap between Business and Technology
活數據基礎建設與分析,常不知從何開始,不知要收集甚麼數據,處理甚麼數據。當企業主管要求從數據中尋找商機、發覺新的營運模式時,常碰到營運/業務人員(Business Users)「問」不對題,數據工作者又答非所問或是用錯誤或局部的數據來分析。雙方雞同鴨講(Gap),導致,數據分析師最怕聽到的一句話: 「你不說我都知道」。
數據的出題與解答是門學問,定義正確的問題、洞察問題背後的問題(QBQ = Question Behind Question),減少供給與需求的鴻溝,問對問題才能收集對的數據,找到對的答案。面對活數據基礎建設與分析,企業需要一套數據方法論來啟動。