港大民調的迷思

發表於 2014-03-18 23:00

讚好 0

香港大學民意調查所作關於特首評分的民調，一向沒有公開其統計及問卷發問的方式，使其調查的科學性受到質疑。

由於學術界以致民間要求公開的訴求近日越來越高漲，港大民調終於在最近一次有關民調中問卷題目及原始數據公開了。

問卷主要問題有兩條，分別是：

1. 而家想請你用0至100分評價你對特首梁振英既支持程度，0分代表絕對唔支持，100分代表絕對支持，50分代表一半半，你會俾幾多分特首梁振英呢？
2. 假設明天選舉特首，而你又有權投票，你會唔會選梁振英做特首？

第一條問題的受訪者答案再經過加權處理而得出的平均分數就是每次公布的特首評分。對於這樣的民調方法是否科學，實在有一連串的迷思。

平均數的迷思

港大民調以平均數作為特首評分，究竟平均數是否能反映一個普遍的評分？

統計香港巿民的個人收入，我們將每個巿民的收入作一個統計後再以平均數去反映出來，會得出一個甚麼結果？就是因為香港有李嘉誠一人（當然香港還有其他富商，但筆者只是簡化地去表達平均數的迷思），就足以將平均數拉得天般高。如果普遍港人收入是每月一萬元，採用平均數去表達，就可能因為李嘉誠而令到數字變成十萬、二十萬或者更多。

根據20/80法則，20%的人擁有80%財富，80%人擁有20%財富。假如一個社會有100人，共有一萬元，則20人共擁有8000元（每人400元），而餘下的大部分人即80人就合共只擁有2000元（每人25元），如用平均數計算，每人有100元，但實況是普遍每人只有25元。

用平均數，就會被一些極端個案令到數字失去真實性而產生假象。因此在很多統計都不會用平均數去反映而用中位數。

港大民調以平均數作為公布的評分，實將極端個案變成重要，是有違民調的科學性。

港大用平均數去表達特首評分，最近一次的結果是 47.5。

如果再將原始數據分析，會得出以下數字：

給與合格評分的受訪者佔受訪人數的百分比（傳統民調採納的數字）：61.8%
評分中位數：50分

採用兩個數據，特首的評分都是合格分數，但採用最不科學的平均數就變成不合格。

正常的數據分佈，叫Normal Distribution，其特點是當製成圖表時會呈現一個倒Ｖ形，即有一個山峯在中間，兩邊都會有較少的分布。而港大民調的數據製成圖表後，結果出現兩個山峰，分別在正常的中間及不正常的極端低分。從圖表已可見，平均數結果被不正常的極端低分改變了。

問題的迷思

凡民意調查，被調查者是隨機抽樣的，未必受過高深教育，因此問題的設計必須簡潔易明，可選擇的答案不可過多，最好不多於五個，同是答案必須有清晰的定義（Well Defined），不可模棱兩可。

港大民調的第一條問題，即給與特首評分，0代表絶對不支持，100代表絶對支持，50代表一半一半。

先講選擇，由0到100，就是一百零一個選擇，有被定義的選擇，只有3個，0、50、100，而50的定義是一半一半，其實已不明所以，並不是Well Defined。一個問題，一百零一個可供選擇的答案，有98個其實是不明意思的。受訪者只能按自己的理解去理解，從而給與一個分數，每個人對55分的理解都不同，我對55分的理解，可能相等於你對65分的理解。結果是莫衷一是，「鷄同鴨講」。

而正常這類型的民調，會問的問題是：

你時否支持特首？可選擇的答案是：支持、不支持、沒意見。最多會加非常支持和非常不支持，都是三個或五個選擇，而且每個選擇的答案都有明確意思，是Well Defined的。

至於第二個問題，假如明天選特首會不會投梁振英票，這個問題更是荒謬。我投不投梁振英票，是要視乎有甚麼對手，如果對手是劉德華，我就不會投梁振英，但如果對手是巴士阿叔，我肯定會投梁振英。會投或不投某人一票，是需要有對手才能比較決定，憑空在沒有對手下問一條這樣違反邏輯的問題，常識已能告知我問這條問題的人是神經病。

一條沒有邏輯問題得出的民調結果，有邏輯嗎？

原圖：無綫新聞截圖

葉楓部落格連結：http://yefengblog.com/97-港大民調的迷思.html

評論