鄭宗記觀點:正視以偏概全的民調報導

2025-01-31 06:40

? 人氣

民意調查是一種常用以了解廣大民意的工具,但有關民調的報導經常簡化統計推論,以致常犯下以偏概全的錯誤。(AI生成照片)

民意調查是一種常用以了解廣大民意的工具,但有關民調的報導經常簡化統計推論,以致常犯下以偏概全的錯誤。(AI生成照片)

某些民調機構或媒體在公布調查結果時,將支持或贊同的比例,以一個百分點約等於19.5萬人,來換算全台對某人物或事件的支持、贊同的總人數。例如某調查結果38.8%的民眾認為柯文哲沒有獲得司法公平審理,因此標題呈現「超過750萬人為柯文哲叫屈」;再則,某調查顯示贊同賴清德處理國家大事的方式,一個月內大幅上揚8.5個百分點,標題為「賴清德支持者回流一百六十六萬人」。

透過<Google新聞> 追蹤風傳媒

統計推論的核心精神在於從母體中隨機抽取樣本,有效率地以樣本訊息推論母體特性。前述以樣本比例換算母體數的表達,雖基於統計學理的應用,卻同時存在理論及實務操作的繆誤。本文不討論某些民調報導的標題所呈現的強烈、情緒化措辭,企圖影響民眾觀感;以下說明民意調查結果所可能的偏誤和統計推估的限制。

「一個百分點約等於19.5萬人」反應該調查假設全台二十歲以上的成年人約有1950萬人(2024年十二月之內政部人口資料為19,643,077人,同年總統大選之選舉人數為19,548,531人),此即為調查的目標母體。理論上,若利用簡單隨機抽樣方法(即在固定樣本數下,每組樣本被抽到的機率是相同的)直接對此目標母體進行抽樣,得到具有某一特定特徵的全體受訪者之樣本比例;藉由此樣本比例乘以母體數,則可獲致具有該特徵的估計總數(如前面的例子:1950萬×38.8%=756.6萬)。統計方法提供不確定狀況的決策依據,樣本比例與母體真實比例之間存在差異,即樣本比例估計的抽樣誤差;抽樣誤差是統計推論的基礎,藉此可建構信賴區間或以邊際誤差來表達推估的不確定性。前述抽樣過程需先有抽樣架構(框架),以識別和選擇目標母體中所有個體的清單或範圍;此為抽樣過程的基礎,以確保樣本中的個體是有代表性的,並且來自目標母體。(相關報導:張讚國觀點:游盈隆高估了自己更多文章

在調查研究領域,了解和解決可能影響調查結果品質和有效性的各種偏誤來源至關重要;框架偏誤說明用於調查的抽樣架構與其想要代表的目標母體之間的差異。框架偏誤可能導致樣本選擇偏差、估計不準確、和統計推論的謬誤。在調查研究中,盡量減少框架誤差至關重要,以確保樣本能準確代表目標族群,提高調查結果的普遍性、可靠性和有效性。但實務上無法直接對全台二十歲以上的成年人進行簡單隨機抽樣,無論是純電話、純手機或兩者混合之雙框架的民意調查,所欲推論的目標母體(全台二十歲以上的成年人)與抽樣架構(電話號碼/手機號碼)絕非全然的吻合。

若僅看樣本比例,觀察的是不同特徵、類別間之樣本估計比例的差異是否在誤差範圍內;雖然各民調機構致力於抽樣架構與目標母體的一致性,但兩者間的隱晦、模糊是民意調查實務上的某種妥協。但總數的估計涉及一個明確的母體數,「一個百分點19.5萬人」隱含假設樣本比例可以完美代表全台灣二十歲以上的成年人;忽略任何調查總有無法接觸者及一接電話就拒訪的民眾,此即所謂無回應者偏誤,是指調查中受訪者與非受訪者之間的系統性差異。

關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章