汪葛雷觀點:黃珊珊大數據報告看好,背後支撐的是「正確數據」嗎?

2022-09-20 06:30

? 人氣

台北市長參選人黃珊珊網路聲量看好,但背後的大數據解讀見仁見智。(柯承惠攝)

台北市長參選人黃珊珊網路聲量看好,但背後的大數據解讀見仁見智。(柯承惠攝)

關於民調,其可信度一直受到質疑,經過長年的選舉洗禮,臺灣民眾也日益體認到民調需要「揀選」,少數幾家有定期出民調,且與選舉結果較吻合的民調機構才值得信賴,今年坊間也出現「臺灣民調透明百科計畫」評鑑各家民調的質量。

透過<Google新聞> 追蹤風傳媒

然而,民眾對民調可能變「民調(ㄊㄧㄠˊ)」,被扭曲成文章已有警覺,然而對於大數據,民眾卻是不那麼懂的,成為另外一個漏洞,能作一些引導輿論的操作。

舉例說明,近日有篇文「陳時中聲量高峰」,裡面提到以下兩段文字:

透過…….資料庫觀察三位主要候選人近一個月的網路聲量走勢,其中陳時中近一個月來聲量最高,將近68萬則,蔣萬安的聲量18萬則,黃珊珊13萬則…….選戰也已經越來越熱,蔣萬安每日平均聲量約為6756,黃珊珊則為6325,黃珊珊幾乎是翻倍成長,每日聲量已與蔣萬安的差距已縮小到431,黃珊珊聲量能否「超蔣趕陳」值得期待。

從目前的結果來看,黃珊珊的選戰策略獲得較佳的網路好感度,以0.56的好感度領先陳時中的0.37、蔣萬安的0.38。陳時中……正面聲量比例較低,只有5%;蔣萬安則是積極「固本」,重撿「疫苗採購黑箱」與「民進黨擋疫苗」等老題目攻擊陳時中,嘗試增加陳時中的仇恨值,但也容易激起對立,導致自己目前的負面聲量為16%,居三人之冠。

這個說法,很明顯是有利於黃珊珊的論述。當然,如果黃珊珊真的聲勢看漲,作為論述者,點出來可不可以?當然可以。但依筆者看.這篇分析至少有二大問題:

1.各家公司網路聲量統計方式皆不透明,難建立絕對權威性

大數據在選舉空戰的時代,確實是很重要,但其鑑定成果一直是黑箱。比方同樣是大數據平台,有些平台陳時中30日聲量隨便都破百萬筆,而「陳時中聲量高峰」一文引述的輿情資料庫,近日的一份報告(量測時間:2022/08/08至09/07),陳時中聲量僅68萬筆,差距甚大。各家公司技術有異,不可能「窮舉」各種網路上的輿論,資料搜集的範圍更被視為商業機密,自然也很難公開一個能讓所有人信服的資料來源清單,更別談誰在聲量上能「超越」對手,能參考的恐怕只有同一個榜單上,各位參選人「漲跌的趨勢」。要真正找出一個準確的數字,是不太可能的。

2.網路好感度僅能參考,過度分析無太大意義

這件事情直白的說,過去數個月,哪位政治人物的聲量比林智堅高?但這聲量對林智堅有什麼幫助嗎?沒有,過街老鼠人人喊打是一種高聲量,但絕對沒有政治人物要這種聲量,大家追求的是正面評價。因應於此,許多輿情分析報告裡面都有談到網路好感度,通常是拿機器檢視後的正面聲量,除以負面聲量,比值越高表示好感度越高。

關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章