隨著2020選戰倒數,各家民調也紛紛發表最新結果,但明明調查母體皆為台灣民眾,民調結果卻差距甚大,也有不少人因此認為坊間民調作假、不可信。對此,便有退休大學教授吳統雄投書中時解釋,在手機普遍使用、年輕受訪者偏少的情境下,把兩者加入加權項目,看似理所當然,但實則「違反科學原理,反而會擴大誤差」,而在民調長期一面倒之下,恐直接影響選舉勝負。
吳統雄舉例,2018年選舉的43個封關預測,沒有任何一個民調的主要候選人的真實得票率都符合宣稱,而其中37個民調,即86%的民調,與至少1位主要候選人的誤差在10%以上,這與坊間民調經常宣稱的「誤差為正負3%」,差距甚大,根本毫無參考價值可言。
吳統雄也解釋民調的統計意義,要能從少數樣本可以猜出全體民意,必須在抽樣時符合「隨機性」,隨機不等於隨便,真正意義是「等機率性」,即母群中每一個樣本都有相同機率被抽中。
而為了達到「隨機性」,則必須有2項條件,一是取得完整的「母群清冊」,二是樣本選定則不能更換。吳統雄也直接戳破現今坊間民調的錯誤作法,在第一輪訪問的受訪率通常低於20%的情況下,因應做法即是抽出11倍樣本以供替換,而非是同一樣本,而這麼做,則已經不是民調公司所宣稱的「有效樣本」為1000個,而是在11000個樣本。
吳統雄也說,民調所稱「隨機」,事實上全部未滿足此條件,他解釋,由於當前對手機並無法設計完整虛擬清冊,手機號碼無論是自己收集的、買來的、或是加了隨機碼,都是不完整的。想接觸手機使用者,所以直覺性地加入手機號碼的抽樣清冊,但在清冊不完整的前提下,反而是降低「隨機性/等機率性」,因此更擴大誤差。
而在年輕人加權方面,也是同樣道理,吳統雄解釋,年輕人普遍投票比例低,會去投票者通常是意識型態比較鮮明、政治態度較積極者,這些也通常是願意回答選舉民調的年輕族群中的少數,在經過加權之後,這些人就變成了虛胖的多數,造成巨大的扭曲。
吳統雄最後也提醒,扭曲的民調結果會影響選情,他舉例某案例,甲候選人事實上勝選乙候選人3%以上,但經錯誤的坊間民調加權後,甲候選人反以45.17:54.83,大幅落後乙候選人近10%。吳也表示,自己認為這次選舉利於綠營,原因在於選民中有15%「輕泛藍」,這些人可能因為民調結果的錯誤差距而選擇放棄投票。