TVBS的樣本數過少?
該文以有效樣本數應在1068份以上,來質疑只有1009份的TVBS,甚至提出民調要扣除未表態樣本的謬論。然而事實上,樣本數多寡最主要影響的是誤差值,且也沒有任何證據顯示,民調一定要在1068份以上才具可信力,該文顯然誤解了統計學的學理基礎,而單純以95%信心水準和3%抽樣誤差套用在所有民調之
上。
從實例來看,國際最為知名的民調機構-蓋洛普(Gallup),在十月份針對美國死刑、國情、副總統潘斯的調查,分別就僅有1019、1019和1035份有效樣本。如果從該文的角度來看,則蓋洛普這幾份民調也就是不符統計學,不可信的調查。更何況,美國還是三億人口的國家。
實際上,人口基數多寡,與所需有效樣本,並無關聯。因此,三億人口的美國,和2350萬的台灣,民調的有效樣本數都近同。而之所以有時候民調會抽大樣本,諸如台灣世代智庫的2100份,其實並不是要減少那1%的整體抽樣誤差,而主要是要看分項的交叉分析,因為隨著分項,則誤差值就會顯著提高。也就是說,1000份和2000份的民調,最主要的差異係在於交叉分析部份,而非總體趨勢。
此外,民意調查基本必然會存有一定比例的未表態樣本,隨著不同議題、不同時點等因素,有高有低,然而未表態樣本都屬於有效樣本,而不能將其類推為無效樣本。因為未表態僅是一種分類,可能包含尚未決定、不投票等等項目,也屬於投票行為的一環。就TVBS此份民調而言,其實是以「未決定」稱之,比例為21%,就過去的選舉民調來看,實屬正常範圍,並未過高或過低。
然而該文卻將這21%歸類為「未表態」,並扣除掉民調中實屬正常的有效樣本,創造出不具任何學理意義的「實質表態數」,指稱TVBS僅有870份,以文字用詞來誘導讀者,試圖讓讀者認為TVBS的樣本數確實過少。
但事實上,誠如前述,未決定或是未表態的樣本,都屬於有效樣本。而真正在調查中要扣除的,則是所謂的拒訪樣本,這方面,TVBS該份民調早已扣除,從1189位調查民眾中,減去180位拒訪者。
蓋洛普關於美國人對死刑態度民調之調查方法
蓋洛普關於美國國情民調之調查方法
蓋洛普關於美國副總統潘斯民調之調查方法
電話抽兩碼比四碼準?
更有意思的是,該文指稱,台灣世代智庫係用電話號碼末兩碼抽樣,TVBS是後四碼,取樣方式不嚴謹。然而實際上,末兩碼的範圍僅0至99,而末四碼則是0-9999,相當明顯地,末四碼的抽樣範圍較末兩碼大上不少。
而抽樣範圍較大,雖然空號率高,較難取得有效樣本,使得抽樣成本上升,但也同時意味抽樣的隨機性越高,並且較能抽到新增加的號碼;反之,如果使用末兩碼,雖然空號率低,較容易取得有效樣本,成本下降,但抽樣的隨機性就較低,且較能抽到新增加號碼,而可能使用過時資料庫,影響調查結果。