首週票房如預期突破12億人民幣(12.69億)後,目前在中國有不少專家以及院線經理認為《復聯3》無疑會成為30億量級的超級英雄大片。相較於這些專家和經理的高歌,對此筆者抱持著不同的看法,從大數據分析的角度上來看,25億就已經夠嗆了,老實說沒想過能突破30億人民幣。
由於預售火爆加上在前期粉絲的加持的關係,貓眼丟資料餵給機器做學習的時候參數值比實際情況來得高,對預測的成果就會有誤判和高估的情形,結果也如筆者所言,從首日(05/11)預測的27.14億下修到目前(05/16)預測的21.14億,上映不到一週下修票房就多達6億!從此可得知,對於貓眼預測來說,它計算最終票房離30億的目標是越來越遠,也和筆者過去文章的預測一致。
雖然目前貓眼在首日票房的預測上準度有待加強,但首週過後的預測呢? 在倒傳遞類神經網路(Back-Propagation Neural Network)等預測演算法重新調整完權重後,預測會更加接近最終的實際票房,未來在蒐集足夠正確的歷史資料後只會越來越準。基本上,擁有數據分析能力的人能夠看得更遠,對於票房數據的敏銳度也會異於常人,以筆者觀點來看,資料科學家之間預測出來的range通常不會有太大落差。
這些專家及院線經理認為無疑會突破30億,是以什麼樣的準則來預測就不得而知了,憑經驗嗎? 或是另類的宣傳方式? Whatever,至少新聞中的「專家」指的應該是資深電影人士,不一定擁有大數據和資料分析的相關背景,因為預測出來的票房實在差太多了,退個一萬步來說,最終票房也是2字頭並不會到3字頭,連預測高估的貓眼電影大數據也「僅」27億,離30億還有一段距離。
如果本篇文章能看到現在,那麼恭喜你!已經follow上筆者的觀點(也被洗腦到一半了),畢竟談論大數據分析的閱讀門檻自然會比較高;上半部文章內容若看不懂也沒關係,提供給大家一定能看懂的逐日票房資料。把近期比較呼聲最高的【玩命關頭8】資料(首日預測28億,最終26.71億)撈出來和【復仇者聯盟3】(首日預測27.14億)進行票房趨勢比較。兩部都是市場原本就看好票房爆發的強片,上映檔期也幾乎沒對手,票房走勢相近做為參考對象再適合不過了。
由於前期宣傳已經鋪天蓋地了,所以票房首週後peak屬於正常現象,並不會呈現口碑片的走勢。然而與【玩命關頭8】同期的票房相較下,兩部的差距卻已經有逐漸拉開的趨勢,實際上連超越玩命關頭的難度都很高了,在中國突破30億人民幣更是場美夢(除非有保底協議這個大招)。並不會說大數據預測分析就一定會比較準,但比起新聞中的專家和院線經理不明依據的高歌,筆者選擇擁抱大數據,而時間將證明一切。
在票房預測中,你是選擇相信自己的直覺,還是選擇擁抱大數據? 這是個奢侈又令人羨慕的討論,在大數據時代的來臨下,我們沒有類似貓眼電影大數據這樣公開即時又透明化的票房資訊系統,至今連公開的全台每日票房都沒有,僅有逐漸失準的台北票房資料能參考,雖然現在各行各業口口聲聲吵著要大數據大數據,可惜沒有相應公開的Raw Data也增加分析的困難度,何時能有透明化的全台每日票房? 希望有生之年能夠見到。
作者介紹│帥猴子
票房分析專家&非專業影評票房分析專家&非專業影評,熱愛電影和票房分析,擁有解讀數據和資料視覺化的能力,並瞭解觀眾觀影喜好趨勢,往往能準確預測票房排名。
本圖/文經授權轉載自帥猴子SHUAI Monkey(原標題:大數據觀點──【復仇者聯盟3】中國票房淺談)
責任編輯/潘渝霈