:::

台灣2012 年總統選舉隨機作答模式調查探討

台灣2012 年總統選舉隨機作答模式調查探討 81
研究論文
台灣2012 年總統選舉
隨機作答模式調查探討✽
謝淑惠✽✽ 杜素豪✽✽✽ 李燊銘✽✽✽✽ 王千文✽✽✽✽✽
摘要
在問卷調查中若有涉及個人隱私或非法行為的敏感性問題時,問
卷的設計以直接詢問(Direct Inquiry)經常會造成拒答,或即使願
意回答也難以確保內容的真實性。因此,為了減少受訪者拒絕回答、
逃避回答、或不實回答等現象,可利用隨機作答方式(Randomized
Response Technique,簡稱 RRT)蒐集正確的問卷資料,降低統計推
論的誤差。RRT 可以讓受訪者在不洩露自己的身分且不知道問題的真
正意圖情況下,誠實地回答敏感性問題,但目前國內學界鮮少於實地
調查中使用RRT 來蒐集敏感性問題,僅有楊文山(1994)於大型面訪
調查中應用不相關問題模型的隨機作答方式,估算台灣地區選舉的賄
✽ 本文初稿發表於2014 年12 月5 日中央研究院社會學研究所舉辦的「國家
認同:台灣社會變遷基本調查第二十三次研討會」,承蒙政治大學選舉研究
中心游清鑫教授等多位學術先進,對於本文提出的寶貴評論與建議,作者
受益良多,特此致謝。
✽✽ 謝淑惠為通訊作者,中央研究院人文社會科學研究中心調查研究專題中心
助研究員,E-mail: shhsieh@gate.sinica.edu.tw
✽✽✽ 杜素豪為中央研究院人文社會科學研究中心調查研究專題中心副研究員。
✽✽✽✽ 李燊銘為逢甲大學統計學系教授。
✽✽✽✽✽ 王千文為中央研究院人文社會科學研究中心調查研究專題中心博士後研究
人員。
82 調查研究—方法與應用/第35 期
選比例。本文利用Hsieh et al.(2013)在2012 年至2013 年參與的
「台灣社會變遷基本調查計畫」中所提出的多元類別隨機作答(Randomized
Response Technique in Multi-Category),蒐集2012 年總統
大選投票行為的資料,估計各候選人的得票率,並與直接詢問法及中
央選舉委員會公布的總統候選人之得票率進行有效性比較。
關鍵詞:隨機作答、多元類別隨機作答、敏感性問題、總統選舉
Application of the Randomized Response Technique
in the 2012 Presidential Election of Taiwan
Shu-Hui Hsieh✽, Su-Hao Tu✽✽, Shen-Ming Lee✽✽✽,
Chain-Wen Wang✽✽✽✽
ABSTRACT
Direct inquiry in social surveys of sensitive questions such as
personal privacy or illegal behaviors often encounters refusal or untrue
response. In order to collect reliable sensitive data, reduce the unwillingness
of respondents, and reduce bias in estimation, Randomized
Response Technique (RRT) is one of the important methods. RRT has
been commonly used to avoid biased answers in surveys on sensitive
issues by ensuring respondents’ privacy, but are rarely adopted in faceto-
face interview surveys in Taiwan, except for Yang (1994) in his
✽ Assistant Research Fellow, Center for Survey Research, Research Center for
Humanities and Social Sciences, Academia Sinica, 128 Academia Rd., Section 2,
Nankang, Taipei 115, Taiwan. Email: shhsieh@gate.sinica.edu.tw
✽✽ Associate Research Fellow, Center for Survey Research, Research Center for
Humanities and Social Sciences, Academia Sinica. Email: shuao@gate.sinica.edu.tw
✽✽✽ Professor, Department of Statistics, Feng Chia University, Taiwan. Email: smlee@
fcu.edu.tw
✽✽✽✽ Postdoctoral Fellow, Center for Survey Research, Research Center for Humanities
and Social Sciences, Academia Sinica. Email: chianwen@gate.sinica.edu.tw
台灣2012 年總統選舉隨機作答模式調查探討 83
study estimating election bribery by using the unrelated question RRT
of Greenberg et al. (1969). We use Randomized Response Technique
in Multiple Categories (RRTMC) developed by Hsieh et al. (2013) in
the Taiwan Social Change Survey (TSCS) conducted in 2012 and 2013
to collect two waves of 2012 presidential election data to validate
RRTMC based by comparing the estimates with the responses to direct
inquiry collected in the same survey and official voting records.
Keywords: Randomized response technique, Randomized Response
Technique in Multiple Categories, sensitive question,
presidential election
一、前言
在1996 年之前台灣的總統是透過國民代表大會來間接選舉產生,
自1996 年開放公民直選總統開始,透過人民參與的民主體制對於國家
未來發展具正面的價值,在經濟事務、政治制度與選舉事務也形成更
健全體制。1996 年至2012 年的五次公民直選總統中,1996 年、2000
年及2012 年,分別有三位或三位以上候選人同時競爭,使得策略性
投票在選舉過程中蘊釀,而有「棄保效應」投票行為的發酵。如2012
年的總統大選,因牽涉台灣政權的爭奪戰,同時也牽動兩岸與國際關
係等議題的激烈攻防,選情變化莫測。在該次選舉中主要的競爭對手
為馬英九、蔡英文與宋楚瑜三人,最後國民黨的馬英九與吳敦義獲得
51.60% 得票率,相對於民進黨的蔡英文與蘇嘉全45.63% 得票率,兩
組得票率相差了6% 約近80 萬票。然而在實際投票結果與選前最後一
次公布民調相比,宋楚瑜(2.77% 得票率)的選票的確是少很多,這
84 調查研究—方法與應用/第35 期
意味著選舉過程中部分選民有棄保效應存在,或尚有其他左右選情的
因素等,這也提供選舉研究更寬廣的研究空間。
台灣政治的法定選舉採行了「無記名投票」的方法,目的不在於
維護選舉結果的正確,而是在於保障投票人的投票自由。在刑法第148
條(妨害投票秘密罪):於無記名之投票,刺探票載之內容者,處三百
元以下罰金。所以在台灣目前的選舉生態下,透露個人的投票對象,
有時會招致不必要的糾紛或麻煩。而研究者若欲研究此類敏感性議
題,以直接詢問(Direct Inquiry,簡稱DI)方式調查,易因拒訪或無
反應率太高的資料產生選舉預測上偏誤的推估。在社會調查研究中常
有些問題涉及到個人隱私或非法行為,與社會的一般規範或期許有所
衝突,如投票意向、吸毒、墮胎、性傾向等敏感性問題。
為了減少受訪者拒絕回答或逃避回答所產生的誤差,Warner 在
1965 年提出隨機作答(Randomized Response Technique,簡稱 RRT)
的調查方法來蒐集敏感性問題的資料,期待藉由RRT 可以保護受訪
者隱私或降低不誠實回答之機率的優點,獲得可靠的資料以推論敏感
性問題的比例。此後許多學者也提出其他改良Warner(1965)模式的
RRT 程序,其最主要的目的皆在於能更準確的估計敏感性問題的效
率。如Greenberg et al.(1969)又將Warner 模式加以改善,提出了不
相關問題(unrelated-question)的RRT;Franklin(1989)提出假設隨
機裝置(random device)為常態分配,利用最大概似估計法來推估二
分類母體的比例;Kuk(1990)提出不直接作答的觀念;Mangat and
Singh(1990)提出了二階段隨機作答的觀念等,使得受訪者的隱私保
護程度提高不少,隨機作答法之精確度也更加提高。另外,Christofides
(2003)延伸Warner(1965)模式提出新的RRT,讓受訪者不必直接
回答「是」與「否」,僅須回答兩數字的差值,來降低不誠實回答的
台灣2012 年總統選舉隨機作答模式調查探討 85
機率。綜合上述,多位學者所提出之不同的RRT 調查方式都是為了消
除受訪者心中的疑慮,讓他們可以誠實回答亦可減少拒絕回答或逃避
回答的現象。
本文將選舉調查中訪問受訪者投票對象的問題視為敏感性議題。
因2012 年總統大選中有三組候選人,對其得票率的推估乃屬於社會調
查常須估計之多分類母體的比例。Abul-Ela et al.(1967)推廣Warner
模型於多類別型態;Chang and Liang(1996)的隨機作答可處理多屬
性(multiattribute)的情況,即同一位受訪者能同時具有一個以上的敏
感性特質;Greenberg et al.(1971)修改不相關隨機作答模式,來估計
敏感性問題的量化特性。另外,Chen and Singh(2009)使用Franklin
(1989)提出的隨機作答模型,並將其推廣至可以估計三項式敏感特性
(A、B、C)的隨機作答方式。若受訪者具有A 特性,則依甲隨機裝
置作答;若受訪者具有B 特性,則依乙隨機裝置作答;否則依丙隨機
裝置作答。實務上,訪員須準備三個隨機裝置,且其分配皆為已知。
若受訪者具有A 特性,則從甲隨機裝置抽取一個數字並告訴訪員。而
訪員僅知道數字,但無法知道受訪者回答的數字來自於甲、乙、丙哪
個隨機裝置,能確實的保護受訪者隱私。然而,此隨機作答的執行條
件,受訪者自己應誠實且明確清楚自己所歸屬的敏感性特性,否則將
會造成選錯隨機裝置,這種調查操作上的誤差,會使得資料不準確而
導致推論的偏誤,也易使受訪者感受到不同隨機裝置可能歸屬為某敏
感性特質,此設計因此在受訪者隱私保護上容易受到質疑。
為了改進前人隨機作答模型的缺點,並提高多分類RRT 模型在實
務執行上的可行性,同時降低調查操作上的誤差,本文因此引用Hsieh
et al.(2013)所提出的多元類別隨機作答(Randomized Response Technique
in Multi-Category,簡稱RRTMC)。此方法主要延伸自Christo86
 調查研究—方法與應用/第35 期
fides(2003)所提出之二分類RRT 的概念,僅須使用一個隨機裝置方
式,即可降低來自受訪者於隨機裝置操作所產生的變異。主要目的在
於利用2012 年與2013 年執行的「台灣社會變遷基本調查計畫」(以
下簡稱「變遷調查」)中針對2012 年總統大選投票對象議題所進行的
RRTMC,以與RRTMC 並列同一份問卷上的DI 結果,以及中央選舉
委員會(以下簡稱中選會)所公告的總統候選人得票率為比較基準,
驗證RRTMC 的有效性。目前在台灣地區的全國性抽樣調查中鮮少使
用隨機作答設計,僅楊文山(1994)應用不相關問題模型的隨機作答
方式,估計台灣地區選舉的賄選問題。相信本文的研究結果對於文獻
中關於敏感性回答品質、RRT 於實地調查的應用,以及RRT 改進等
的相關議題,具有參考價值。
二、文獻探討
隨著台灣的民主化,幾乎年年舉辦的大小型選舉活動,不只是民
眾日常生活的一部分,投票更成為政治參與中最重要的一環。由於近
十年來國內政治生態急遽變化,面對越來越大的時代衝擊、選舉壓力
與選情瞬息萬變,影響選舉的因素越來越繁雜,但在掌握選民投票意
向的選舉研究上則提供更寬廣的研究空間。選舉預測是選舉研究者極
感興趣的議題之一,過去台灣對於選舉預測的研究大多集中在以民意
調查所得到資料作為分析主體,並透過個體資料或整體資料的呈現,
在選舉前予以評估預測,或在事後尋求更具解釋力的模型,不僅在學
術領域中有助於了解選民的投票行為,在實務上也可以幫助競選策略
擬定及競爭態勢研判。在台灣受到選罷法規定選前十天禁止發布民調
結果,使得民意受到短期競選事件影響後,採用發布之民調結果進行
台灣2012 年總統選舉隨機作答模式調查探討 87
選舉預測工作具有局限性。
在台灣地區的選舉調查,不論是電話訪問、面對面訪問或網路訪
問等調查方式,已實行十多年且累積了相當多的研究資料。選前的民
意調查會在無意間刺激受訪者對於選舉產生興趣或促進其積極參與選
舉活動和投票,而選後的民意調查則容易引起受訪者在接受訪問時產
生當時社會所讚賞或期許的回答行為。因此,不論是在選舉前的預測
或者選舉後的結果估計上,我們往往無法蒐集到投票行為有效與可信
的資料。
此外,在問卷調查中若受訪者認為投票對象、投票行為等議題是
涉及個人隱私的敏感性問題時,受訪者往往會有拒絕回答或不誠實回
答的傾向,造成推論之投票率或得票率有誤差的現象。為了解決此一
問題,Warner(1965)提出RRT,其構想在於透過某種隨機裝置(如
數字卡、擲骰子)的設計,受訪者可以隨機選答敏感性問題或該敏感
性問題的反向問題。透過隨機裝置,受訪者須利用研究者設計好的隨
機裝置來選擇回答題目A 或題目B,其選擇的機率分別為p 和1 − p:
題目A:我具有A 特性嗎?
題目B:我具有Ac 特性嗎?
實際執行時,受訪者僅須告訴訪員他的回答為「是」或「否」,而訪
員無法知道受訪者是回答題目A 或B,藉此設計希望受訪者了解其
所提供的答案並不會在不認識的人面前曝光,因而願意提供正確的回
答。假設具有敏感性A 特性的比例為θ,其餘具Ac 者的比例為1 − θ。
在受訪者皆誠實作答的情形下,受訪者回答 「是」的機率為:
π = θp + (1 − θ)(1 − p)
88 調查研究—方法與應用/第35 期
假設n 為樣本總數,n1 為回答「是」的人數,則π 的不偏估計量為
n1
n 。所以θ 的不偏估計量與變異數為:
θˆw = 1 p − 1 +n1
2p − 1 n
Var(θˆw) = θ(1 − θ) + p(1 − p)
n n(2p − 1)2
此處p ≠12
。由於研究者可以先行設計隨機裝置的機率p,然而p 的大
小會決定變異數的大小,也會影響到受訪者與訪員之間的合作程度。
當p = 1 或0 時變異數會最小,θˆw 會得到較高的效率。但這樣的設計
就是所有的受訪者應回答題目A( p = 1),或所有的受訪者應回答題目
B( p = 0),就相當於DI 法,則受訪者誠實回答率應該不高。
為了改善Warner(1965)模式中題目A 和題目B 皆為敏感性問
題的疑慮,Greenberg et al.(1969)提出了不相關問題的隨機作答模
型,令Y 與A 不相關的特性,期望藉由具有Y 特性的題目C 來增加
受訪者的信任感,以降低不誠實回答的比例。Greenberg et al.(1969)
的執行步驟與Warner(1965)相同,透過隨機裝置來選擇題目A 與
題目C,其機率分別為p1 和1 − p1:
題目A:我具有A 特性嗎?
題目C:我具有Y 特性嗎?
在此,假設γ 為題目C 回答是(具有Y 特性)的比例,則受訪者皆誠
實作答的情形下,受訪者回答 「是」的機率為:
π = θp1 + γ(1 − p1)
台灣2012 年總統選舉隨機作答模式調查探討 89
若假設γ 已知時,以θ 的不偏估計量與變異數為:
θˆg =
n1
n − (1 − p1)γ
p1
Var(θˆg) = n(1 − π)
np1
2
但若γ 未知時,我們需要兩個獨立的樣本才能來估計θ 和γ。
Abul-Ela 等人(1967)延伸Warner 模型的兩類回答選項(是與
否)為多類別型態。假設敏感特性之回答選項可分為m 個互斥的類別
A1, A2, . . . Am,則其所對應參數為θ1, θ2, . . . θm。其原理是選取s = m − 1
樣本,每一組內的樣本數為n1, n2, . . . ns,因此須準備s 組隨機裝置,
其對應的機率為pij (1 ≤ i ≤ s, 1 ≤ j ≤ m),則Σ mj
=1 pij = 1。因此,第i 組受
訪者被要求回答第i 個隨機裝置中所提及之特性,則回答「是」的機
率為:
m
πi = Σ pijθj
j=1
在多類別設計中,若問題的回答類別有m 個,則需m − 1 組獨立
樣本,實務上將付出較高的調查成本。為解決此缺點,Bourke and
Dalenius(1976)提出僅須選取一組樣本的RRT 模型,每一受訪者據
實陳述其類別的機率為p,而按指示回答j 類別的機率為pj ( j = 1, 2, . . .
m) 其中p + Σ mj
=1 pj = 1。因此,回答類別j 的機率為:
φj = pπj + pjπi + . . . + pjπj + . . . + pjπm
此處j = 1, 2, . . . m,亦利用矩陣型式則可得到θ1, θ2, . . . θm 的不偏估
90 調查研究—方法與應用/第35 期
計量與變異矩陣。
之後,許多學者為了讓受訪者誠實作答,一直不斷的研究如何獲
得較準確的估計值,如Kuk(1990)、Christofides(2003)、Kim and
Warde(2004)等。其中Christofides(2003)提出讓受訪者不必直接回
答「是」和「否」,僅須回答是兩個數字的差值,藉以降低不誠實回答
的機率。假設具有敏感特性A 的比例為θ,Christofides(2003)提供一
個隨機裝置給每一位受訪者使用,其中隨機裝置為整數1, 2, . . . L,且
其對應的機率為P1, P2, . . . PL,則定義每一個受訪者使用隨機裝置之
後得到的數字為Y。若受訪者具有A 特性,則回答Y 到L + 1 的距離;
反之,則回答Y 到0 的距離。因此,我們可以定義若受訪者具有特性
A,則X = L + 1,反之則X = 0,所以P(X = L + 1) = θ 與P(X = 0) = 1 − θ。
實際執行時,訪員僅知道受訪者回答兩數差的距離D = | X − Y |,
完全不會知道受訪者的X 和Y 分別為數字多少,藉此可提高受訪者願
意誠實回答的比例。因此,每第i 位受訪者回答數字為k 的機率為:
P(Di = k) = (1 − θ ) Pk + θPL + 1−k
此處i = 1, 2, . . . n 和 k = 1, 2, . . . L。令D¯ 為D1, D2, . . . Dn 的樣本平均
數,因此可得θ 的估計式為:
θˆc = D¯ − E(Y ) L+1−2E(Y) , L+1−2E(Y)≠0
則θˆc 的變異數為:
Var(θˆc) = θ(1 − θ) + Var (γ)
n n[L + 1 − 2E(Y )]2
綜合以上,應用隨機作答法於敏感性問題的調查,可以降低非抽
台灣2012 年總統選舉隨機作答模式調查探討 91
樣誤差。然而,在調查設計、訪問費等方面的成本較一般調查為高。
除了調查成本外,隨機作答設計方法應用在社會科學大型面訪調查
時,在操作程序的可行性與受訪者的隱私保護措施等相關問題上也需
要嚴密的考量與設計。
三、研究設計
民意調查在台灣的政治選舉文化中占有很重要的一環,但如何蒐
集準確性高的資料則是一件相當困難的工作。為了使龐大的樣本在不
同年齡或教育程度皆能順利完成,問卷設計內容的完整性與複雜性就
成為設計問卷相當重要的考慮因素。一般而言,以2012 年總統選舉
為例,最常見的問卷設計如下:
題目A:2012 年一月的總統選舉,請問您有沒有去投票?
□(01)有,投給馬英九 □(02)有,投給蔡英文
□(03)有,投給宋楚瑜 □(04)有,投廢票
□(05)沒有去投票   □(06)年滿20 歲但沒有總統投票權
□(07)未滿20 歲
在此,若以題目A 的設計方式直接詢問獲得投票對象的資料,我們
稱之為DI。本文以2012 年總統選舉為例,引用可以更簡化又準確估
計,由Hsieh 等人(2013)所提出的RRTMC 與執行流程。接著,說
明分析資料來源。
(一)多元類別隨機作答(簡稱 RRTMC)
為了提高實務執行上的可行性,確實保護受訪者的隱私,Hsieh et
92 調查研究—方法與應用/第35 期
al.(2013)所提出的RRTMC 主要是延伸Christofides(2003)二類別
的隨機作答設計概念,並延伸為多元類別的作答方式,其所設計的題
目如下:
題目B1:請問在2012 年一月份總統選舉時,您有沒有去投票?
(01)有去投票(02)沒有去投票(03)沒有投票權(04)投廢票(98)拒答
題目B2:請問您投票時所選的總統候選人是數字7、6 或0 ,但請不
要告訴我您選的數字,只需要告訴我這數字跟您現在所抽到的數字差
多少就好了。
(由於您回答的是『數字的差』,我們完全不會知道您真正是投票給哪
一組總統候選人,所以請您放心回答。)
數字7:宋楚瑜
數字6:蔡英文
數字0:馬英九
那麼,請問您抽到的數字跟提示卡上所選的數字,大減小後差多少?
在RRTMC 的調查執行程序中,詢問所有的受訪者題目B1,若受
訪者回答有去投票(01),則再進一步回答題目B2。在回答題目B2 之
前,受訪者需由隨機裝置中抽取1 張數字卡(其中,數字為1 者有8
張;4 張數字2;8 張數字3;16 張數字4,與4 張數字5 ,共40 張),
並假設受訪者所抽中的數字卡為變數Y。接下來,設變數X 為受訪者
回想2012 年投票時每位總統候選人所代表的數字,則分別為X = 0 代
表馬英九,X = 6 代表蔡英文,X = 7 代表宋楚瑜,因此,P(X = 0) = θ1,
P(X = 6) = θ2,P(X = 7) = θ3,且θ1 + θ2 + θ3 = 1。由於受訪者不須讓訪員知
道自己抽中的數字為 Y 與投票對象所代表數字X,僅須回答X 和Y 兩
台灣2012 年總統選舉隨機作答模式調查探討 93
數字的差值D = | X − Y |,則D 的範圍為1 至6。舉例說明,若受訪者投
票對象為馬英九則X = 0,抽中數字Y = 3,則其機率P(X = 0, Y = 3) =
θ1P3。因此,在RRTMC 的設計下,當訪員可得受訪者回答D = 3,其
中可能來自於(X = 0, Y = 3)、(X = 6, Y = 3) 和(X = 7, Y = 4),則其機率為:
P(D = 3) = P(X = 0, Y = 3) + P(X = 6, Y = 3) + P(X = 7, Y = 4) = (θ1+θ2)P3 + θ3P4
接著,由表1 隨機裝置數字卡Y 與受訪者回答數字D 的聯合機率分
配,亦可清楚得到P(D = k),k = 1, 2, . . . 6 的機率。而在參數θ1、θ2、
θ3 估計方面,Hsieh et al.(2013)提出最大概似法來得到不偏估計量
及變異數。
整體而言,RRTMC 僅能得到受訪者回答數字D 的資料,因此,
只能做「整體意見的推估,不會知道個人的意見」,藉此希望可以消
弭受訪者害怕自己身分隱私被曝光的疑慮,以避免受訪者的無反應及
提供錯誤的回答等。
表1 Y 與D 的聯合機率分配
D Y 1 2 3 4 5 P(D = k)
1 θ1P1 θ2P5 θ1P1 + θ2P5
2 θ1P2 θ2P4 θ3P5 θ1P2 + θ2P4 + θ3P5
3 (θ1 + θ2)P3 θ3P4 (θ1 + θ2)P3 + θ3P4
4 θ2P2 θ3P3 θ1P4 θ2P2 + θ3P3 + θ1P4
5 θ2P1 θ3P2 θ1P5 θ2P1 + θ3P2 + θ1P5
6 θ3P1 θ3P1
94 調查研究—方法與應用/第35 期
(二)分析資料
本研究所使用的資料來自2012 年和2013 年由中央研究院社會學
研究所執行的「變遷調查」(章英華等人2012)。此調查以台灣地區
(不含福建省金門縣和連江縣)具有本國國籍且設有戶籍,年齡在18
歲(含)以上的民眾為抽樣母體,以戶籍資料為抽樣清冊(sampling
frame)。樣本的選取採分層三階段等比例機率抽樣,各層內採用抽取
率與單位大小成比例(Probability Proportional to Size Sampling, PPS)
等距抽樣法,逐步抽取「鄉鎮市區」、「村里」、「人」。實際調查訪問
時,並不包括軍事單位、醫院、療養院、學校、職訓中心、宿舍、監
獄等機構內之居民及通緝犯;採用電腦輔助面對面訪問方法。
本文利用「變遷調查」2012 年的社會階層組和2013 年的國家認同
組中針對2012 年總統選舉投票對象議題,於同一份問卷中設計DI 的
題目A 與RRTMC 的題目B2(見附錄)。因考量到先問RRTMC 的題
目B2 後,受訪者可能會覺得DI 的題目A 敏感性過高,或是RRTMC
的題目B2 操作執行程序複雜,因而造成拒絕回答或逃避回答DI 的題
目A 比例過高,形成資料可靠性降低的問題。所以DI 的題目A 置於
前,並間隔一些題目後,於問卷最後設置RRTMC 的題目B2。
在題目設計方法上,2012 年與2013 年的RRTMC 的篩選題目B1
有些不同。2013 年的問卷中並沒有篩選題目B1,僅利用DI 的題目A
作為篩選題,若受訪者有確切回答出投票對象、有去投票但不願回答
或忘記投給誰、投廢票者,皆歸類成有去投票者,亦須回答題目B2。
但是為了整體一致性的比較分析,最後資料分析時決定將2012 年的資
料也調整為與2013 年相同,皆以DI 的題目A 作為篩選進入RRTMC
的題目B2 的依據。
台灣2012 年總統選舉隨機作答模式調查探討 95
四、研究結果
本文利用2012 年及2013 年的「變遷調查」資料,希望了解選民
真正的投票意向,以及受訪者回答是否有社會讚許或期許的傾向。
(一)調查方法對回答投票對象意願是否有影響
表2 列出2012 年和2013 年「變遷調查」實際完成的樣本數,分
別為2134 和1952,因本研究所需,經過篩選後僅保留20 歲以上且具
總統投票權的受訪者,分別為2044 和1839。針對有關投票對象的問
題,資料重新整理為一個新的變數。如DI 的題目A,若受訪者確切回
答出投票對象則歸為「願意回答」,反之為「不願意回答」;而RRTMC
的題目B2,若受訪者確切回答出兩數值差值則歸為「願意回答」,反
之為「不願意回答」。因此,我們就可以比較同一年度不同調查方法
DI 和RRTMC 的願意回答投票對象比例之間是否存在差異。
表2 願意回答投票對象比例DI 和RRTMC 的比較
調查年度和主題2012 年社會階層2013 年國家認同
完成樣本數2134 1952
篩選後樣本數2044 1839
調查方法DI RRTMC DI RRTMC
願意回答投票對象
1335
(65.31%)
1499
(73.34%)
1283
(69.77%)
1366
(74.23%)
註:1. DI 為直接詢問法。
  2. RRTMC 為Hsieh et al.(2013)提出的多元類別隨機作答模式。
96 調查研究—方法與應用/第35 期
在表2 中,利用DI 所蒐集資料而估算之願意回答投票對象比例,
2012 年和2013 年分別為65.31% 和69.77%。在RRTMC 中,所估算
願意回答投票對象比例為73.34% 和74.23%,應該是有去投票且願意
回答的比例,與中選會公布的投票率74.3% 相當接近。就2012 年的
比較,受訪者願意回答投票在RRTMC 相對於DI 高估8.03%,而於
2013 年則高估4.46%,呈現RRTMC 在隱私保護上比DI 還要理想,
所以受訪者願意回答的比例較高。
(二)調查方法對得票率估算是否有影響
為了了解有多少受訪者對RRTMC 有操作上問題,或多少受訪者
願意直接回答投票對象等,本研究設計了兩類回答選項,用以區分成
受訪者自行計算和訪員計算兩類,其中,只要受訪者告訴訪員兩數之
任一個或以上歸類為訪員計算。如表3,就受訪者計算部分,先利用
卡方檢定值為1.18,且P 值為0.95,表示2012 年和2013 年資料於各
類別選項比例差異不顯著。在2012 年受訪者計算的比例約80.39%,
與其相比較2013 年則減少約4.91%,也相對呈現訪員計算會多出此
部分。
在得票率方面,表4 為DI 和RRTMC 於2012 年總統選舉中各投
票對象得票率的分析結果。就DI 而言,馬英九的得票率在2012 年和
2013 年分別為56.40% 和54.79%,相對於中選會公布結果高估4.80%
和3.19%。呈現在讚賞或期許的導向下,選後調查時受訪者是有可能
會偏向於回答已獲得勝選的總統候選人,因而有可能造成該候選人的
得票率高估的現象。相對的,已落敗的候選人,極有可能在得票率的
估計上會較為低落,如表4 蔡英文與宋楚瑜兩位候選人得票率與中選
會公布結果相比,分別為平均低估約4.48%,與平均高估0.48%。
台灣2012 年總統選舉隨機作答模式調查探討 97
表3 RRTMC 的資料次數分配
2012 年社會階層2013 年國家認同
受訪者計算訪員計算受訪者計算訪員計算
兩數差1 182 40 154 57
兩數差2 270 70 227 75
兩數差3 284 73 228 72
兩數差4 277 70 246 78
兩數差5 169 38 155 50
兩數差6 23 3 21 3
合 計1205 294 1031 335
百分比80.39 19.61 75.48 24.52
卡方檢定X2=1.18, P-value=0.95
表4 得票率DI 和RRTMC 的比較
總統候選人
中選會
公布結果
2012 年社會階層2013 年國家認同
DI RRTMC DI RRTMC
1. 馬英九51.60 56.40
(1.40)
46.31
(2.98)
54.79
(1.36)
48.03
(3.08)
2. 蔡英文45.63 40.22
(1.39)
44.31
(2.94)
42.09
(1.35)
43.48
(3.04)
3. 宋楚瑜 2.77 3.37
(1.25)
9.38
(1.69)
3.12
(1.27)
8.50
(1.56)
願意回答投票
對象的樣本總數
1335 1499 1283 1366
註:表格中數字為百分比,括弧中數字為估計標準差。
98 調查研究—方法與應用/第35 期
在RRTMC 蔡英文的得票率在2012 年和2013 年分別為44.31% 和
43.48%,與中選會公布結果相比低估1.32% 和2.15%,相較於DI 方法
精確性高。而馬英九得票率分別為46.31% 和48.03%,與中選會公布
結果相比分別低估5.29% 和3.57%,其中差距比例與DI 差不多,但
RRTMC 皆呈現低估的現象。然而,蔡英文或馬英九在2012 年,與其
相對於2013 年RRTMC 方法的得票率分別減少0.83% 和增加1.72%,
或許是因調查年度與實際投票選舉日期距離較遠,受訪者回答比較有
社會讚許或期許從眾效果,所以馬英九推估得票率2013 年會較2012
年高。但在宋楚瑜得票率分別為9.38% 和8.50%,都相較於中選會公
布結果高估許多,反而DI 和中選會公布結果較接近。
(三)不同受訪者特質在回答投票對象意願的差異
由於選民的投票行為本來就是一種心理狀態的陳述,在調查時只
能依受訪者當時自我的表達來判斷。本研究的設計是將DI 的題目A
與RRTMC 的題目B2 並列同一份問卷,所以我們可依受訪者回答DI
與RRTMC 的情況,來區分成問卷設計上的「隱密性」和「複雜性」
兩種效果。其中「隱密性」效果意指受訪者不願意回答在DI 的題目
A,但願意回答在RRTMC 的題目B2,如同表5 所示,RRTMC 中願
意回答投票對象的比例於2012 年和2013 分別為176(8.61%)和106
(5.76%)。「複雜性」效果方面,則為受訪者願意回答在DI 題目A 的
投票對象,但不願意回答在RRTMC 的題目B2,占所有願意回答投票
對象的比例於2012 年和2013 年分別為12(0.59%) 和23(1.25%)。
整體而言,RRTMC 的隱密性設計效果較佳,所得到的願意回答投票
對象的比例相較於DI 高,主要來自於DI 有去投票者中,有去投票但
不願回答或忘記投給誰、投廢票的受訪者,在使用RRTMC 設計時比
台灣2012 年總統選舉隨機作答模式調查探討 99
表5 DI 與RRTMC 問卷設計效果的比較
調查年度和主題2012 年社會階層2013 年國家認同
調查方法DI RRTMC DI RRTMC
隱密性僅回答RRTMC —
176
(8.61)

106
(5.76)
複雜性僅回答DI 12
(0.59)

23
(1.25)

DI 和RRTMC 皆有回答1323 1260
總樣本數1335 1499 1283 1366
註:表格中數字為人數,括號中數字為百分比。
較願意回答投票對象。
進一步,在隱密性設計效果中探討RRTMC 對哪些人具有效用,
能提高其回答率。針對影響受訪者回答意願的主要屬性,我們檢視受
訪者的性別、年齡、教育程度、政黨支持與主觀社經地位等五個變數
在回答上的差異,結果如表6。就性別而言,以2013 年有去投票且願
意回答投票對象者的女性為最高(55.66%,相對於男性的44.34%)。
整體而言,女性願意回答投票對象的比例較男性高11.32%。在年齡方
面, 2012 年資料顯示40 歲到59 歲的選民,最不願意透露投票對象
(45.45%),其次則為20 歲到39 歲的28.98%。在教育程度方面,兩
年資料均呈現教育程度高中以下的受訪者,越傾向告訴訪員他們的投
票對象,於2012 年和2013 年分別為63.07% 和69.81%。在政黨支持
上,都沒有╱都支持的選民比較傾向告訴訪員他們的投票對象,其中
2012 年的比例為87.25%,相較於2013 年(81.11%)高出約6.14%。
最後,主觀社經地位方面,呈現主觀社經地位高的人最不願意回答投
100 調查研究—方法與應用/第35 期
表6 分析隱密性效果的受訪者特質
調查年度和主題2012 年社會階層2013 年國家認同
性 別
男性82(46.59) 47(44.34)
女性94(53.41) 59(55.66)
年 齡
20–39 51(28.98) 33(31.13)
40–59 80(45.45) 39(36.79)
60 以上45(25.57) 34(32.08)
教育程度
高中以下111(63.07) 74(69.81)
專科以上65(36.93) 32(30.19)
政黨支持
泛藍9( 6.04) 6( 6.67)
泛綠10( 6.71) 11(12.22)
都沒有╱都支持130(87.25) 73(81.11)
主觀社經地位
低60(35.09) 30(29.70)
中98(57.31) 59(58.42)
高13( 7.60) 12(11.88)
註:1. 若資料有缺失值採刪除後再進行計算。
  2. 括號內數字為百分比。
票對象,以2012 年而言只占7.60%,其次為主觀社經地位低。整體
而言,女性、年齡40 歲到59 歲、教育程度高中以下、政黨支持都沒
有╱都支持、主觀社經地位中者,若應用RRTMC 法調查時,會提高
願意回答投票對象的比例。
台灣2012 年總統選舉隨機作答模式調查探討 101
五、結論與討論
在「變遷調查」中,我們於2012 年的社會階層組與2013 年國家
認同組加入調查2012 年總統選舉中受訪者的投票對象議題的隨機作
答方法研究。我們將「直接詢問法」(DI)的題目與「多元類別隨機
作答」(RRTMC)的題目並列同一份問卷,先以DI 的題目詢問受訪
者,在問卷最後才採RRTMC 的題目,希望能提高受訪者兩種方法都
回答的比例,以進行DI 與RRTMC 的差異性與有效性的比較。就訪
員訓練方面,為了提高受訪者願意接受訪問的機率,除了培訓訪員如
何說服受訪者的技巧外,並告知本研究僅能做「整體意見的推估,不
會知道個人的意見」,在保護資料提供者的隱私權之下,提供研究者
較為可靠之資料,此乃為隨機作答法主要用途之一。
本研究發現RRTMC 對於願意回答2012 年總統選舉投票對象的比
例估算結果,於調查年度2012 年與2013 年分別為73.34% 和74.23%,
或許民眾覺得在隱私保護上比DI 更受到尊重,所以願意回答投票對
象的比例較DI 高。在投票對象得票率的估算方面,蔡英文於2012 年
和2013 年調查估算的得票率分別為44.31% 和43.48%,與中選會公布
結果低估1.32% 和2.15%,且此差距都在一倍標準差以內,此結果與
DI 相比較都更接近實際得票率45.63%。而馬英九估計的得票率與中
選會公布結果分別低估5.29% 和3.57%,而此差距大於一倍標準差,
反而DI 估計的得票率與中選會公布結果分別高估4.8% 和3.19%,差
距低於RRTMC。由DI 的結果可以清楚看出選後調查會有社會讚許或
期許的情況,但在RRTMC 下則看不到。最後,RRTMC 所估算宋楚
瑜得票率分別為9.38% 和8.50%,與實際得票率2.77% 差距頗大,卻
102 調查研究—方法與應用/第35 期
與多數媒體於選前最後一次公布的民意調查介於7% 至10% 的方向相
同,反而DI 法的估計結果與中選會較接近。
我們也進一步探討RRTMC 對哪些人具有提高其回答率的效果。
針對影響受訪者回答意願的主要屬性,我們檢視受訪者的性別、年
齡、教育程度、政黨支持與主觀社經地位等。最後發現,女性、年齡
40 歲到59 歲、教育程度高中以下、政黨支持都沒有╱都支持、主觀
社經地位中者,若應用RRTMC 來調查時,願意回答投票對象的比例
較高。整體而言,在RRTMC 下,願意回答投票對象的比例應該是有
去投票且願意回答者的比例,而其估算的比例與中選會公布的投票率
相當接近。但由於台灣目前沒有其他相關文獻可以參考,需要未來多
做一些實證分析才能有更清楚的證據來說明。
綜合上述,在選後調查中利用RRTMC 所估算各候選人的得票
率,僅蔡英文得票率比較準確,低估了馬英九得票率,卻高估了宋楚
瑜得票率。然而,如文獻假設及前人研究的發現,隨機作答法比較能
測量或反映民眾內心的看法或傾向等,但或許政治民主化後,認為調
查投票對象的問題屬於高度敏感性問題的受訪者人數減少或不誠實回
答太高,而使得此RRTMC 對於得票率的估算結果與預期效果不同。
由於上述結論仍缺乏相關變項可以檢驗,有待未來進行更深入的研究
設計來處理此問題。
最後,本文仍有不足與局限之處。本研究RRTMC 所估算的得票
率與真實得票率有差距,卻與多家媒體在選前禁止公布前最後一次民
調的結果相同(見附錄),這是一個值得深入探討的問題。若想利用
RRTMC 了解是否有策略性投票的選舉效應,從單一時間點的橫斷面
調查資料亦有其局限,理想上若能納入選前民調調查資料進行跨時比
較分析,或許更能看出趨勢中的效應,才能用以解釋其投票選擇。然
台灣2012 年總統選舉隨機作答模式調查探討 103
而,由於未能針對相同樣本進行追蹤調查,無從得知這些選民在大選
中的實際投票選擇,而形成驗證此調查方法可行性的主要困境。不過,
本文以選後調查所得之研究發現仍可提供後續總統大選進行調查研究
時,思考與規劃可行性的選前樣本並進行選後追蹤調查,以建構比較
完整跨時的調查方法研究。另外,本文是在「變遷調查」中利用Hsieh
et al.(2013)提出的多元類別隨機作答模型,是僅次於楊文山(1994)
應用不相關問題模型的隨機作答方法調查選舉賄選問題後,以台灣樣
本在面對面的訪問中利用隨機作答方法進行調查,這在研究方法、訪
問技術或問卷設計上都是未來可以再努力與改進的研究方向。
104 調查研究—方法與應用/第35 期
附錄1 問卷
2012 年社會階層
A. 直接詢問(DI)題目
96. 今年一月的總統選舉,請問您有沒有去投票?
(01)有,投給馬英九 (02)有,投給蔡英文
(03)有,投給宋楚瑜 (04)有,投廢票 (05)沒有去投票
(06)年滿20 歲但沒有總統投票權 (07)未滿20 歲
B. RRTMC 題組
112. 請問在今年一月份總統選舉時,您有沒有去投票?
(01)有去投票 (02)沒有去投票 (03)沒有投票權
(04)投廢票  (98)拒答
113. 請問您投票時所選的總統候選人姓名前是7、6 或0 的哪個數字?
(提示卡38)請不要說出您所選的數字,記在心裡就好。
數字7 :宋楚瑜
數字6 :蔡英文
數字0 :馬英九
那麼,請您抽一張數字卡,然後告訴我數字卡上的數字跟提示卡上所
選的數字,大減小後差多少?
受訪者自己算的:
□(01)01  □(02)02  □(03)03  □(04)04
□(05)05  □(06)06
台灣2012 年總統選舉隨機作答模式調查探討 105
訪員幫忙算的:
□(07)01  □(08)02  □(09)03  □(10)04
□(11)05  □(12)06
2013 年國家認同
A. 直接詢問(DI)題目
92. 去年一月的總統選舉,請問您有沒有去投票?投給誰?
□(01)有,馬英九 □(02)有,蔡英文 □(03)有,宋楚瑜
□(04)有,投廢票 □(05)有,但不願意回答或忘記投給誰
□(06)有,但拒領總統選舉票     □(07)沒有去投票
□(08)當時年滿20 歲但沒有總統投票權 □(09)當時未滿20 歲
B. RRTMC 題組
112. 請問在去年一月的總統選舉,您投票時所選的總統候選人是數字
7、6 或0?但請不要告訴我您選的數字,只需告訴我這數字跟您現在
所抽到的數字差多少就好了。(由於您回答的是『數字的差』,我們完
全不會知道您真正是投票給哪一組總統候選人,所以請您放心回答。)
數字7:宋楚瑜
數字6:蔡英文
數字0:馬英九
那麼,請問您提示卡與抽到的數字,大減小後差多少?
受訪者自己算的:
□(01)01  □(02)02  □(03)03  □(04)04
□(05)05  □(06)06
106 調查研究—方法與應用/第35 期
訪員幫忙算的:
□(07)01  □(08)02  □(09)03  □(10)04
□(11)05  □(12)06
台灣2012 年總統選舉隨機作答模式調查探討 107
附錄2
2012 年總統大選前各調查機構最後一次民調的結果
馬英九蔡英文宋楚瑜未表態
原始
支持度
預測
得票率
原始
支持度
預測
得票率
原始
支持度
預測
得票率
原始
支持度
TVBS(1/2) 45 51.1 37 42.0 6 6.8 12
聯合報(1/3) 44 50.6 36 41.4 7 8.0 13
蘋果日報(1/2) 42.2 50.2 35.7 42.4 6.2 7.4 15.9
中國時報(1/3) 39.5 48.3 36.5 44.6 5.8 7.1 18.2
台灣智庫(1/1) 38.8 43.9 37.8 42.8 11.8 13.3 11.6
未來事件交易所(1/2) 42.6 49.8 10.7
資料來源:http://blackrain.skycity.cc/2012/01/03/11448.html
註:括弧內數字為日期。
108 調查研究—方法與應用/第35 期
參考文獻
中央選舉委員會,2012,歷屆公職選舉資料。選舉資料庫網站(http://db.cec.gov.tw/
histMain.jsp?voteSel=20120101A1,取用日期:2014 年11 月5 日)。
章英華、杜素豪、廖培珊,2012,《台灣社會變遷基本調查計畫第六期第二次調查計畫
執行報告》。台北:中央研究院社會學研究所。
—,2013,《台灣社會變遷基本調查計畫第六期第三次調查計畫執行報告》。台北:
中央研究院社會學研究所。
楊文山,1994,〈隨機問答在大型實地調查中的應用:以估計台灣地區賄選為例〉。頁
363–382,收錄於伊慶春主編,《台灣社會的民眾意向:社會科學的分析》。台北:
中央研究院中山人文社會科學研究所。
Abul-Ela, Abdel-Latif A., Bernard G. Greenberg, and Horvitz, Daniel G., 1967, “A multi-
Proportion Randomized Response Model.” Journal of the American Statistical Association
62: 990–1008.
Bourke, P. D. and T. Dalenius, 1976, “Some New Ideas in the Realm of Randomized Inquiries.”
International Statistical Review 44(2): 219–221.
Chang, Horng Jinh and Der Hsin Liang, 1996, “A Two-Stage Unrelated Randomized Response
Procedure.” Australian Journal of Statistics 38(1): 43–51.
Chen, Cheng C. and Sarjinder Singh, 2009, “The Franklin’s Randomized Response Model for
Two Sensitive Attributes.” Section on Survey Research methods-JSM 2009: 4171–4185.
Christofides, Tasos C., 2003, “A Generalized Randomized Response Technique.” Metrika 57(2):
195–200.
Franklin, Le Roy A., 1989, “A Comparison of Estimators for Randomized Response Sampling
with Continuous Distributions from a Dichotomous Population.” Communication in Statistics
Theory and Methods 18(2): 489–505.
Greenberg, Bernard G., Abdel-Latif A. Abul-Ela, Walt R. Simmons and Daniel G. Horvitz,
1969, “The Unrelated Question Randomized Response Model: Theoretical Framework.”
Journal of American Statistical Association 64: 520–539.
Greenberg, Bernard G., Roy R. Kuebler, Jr., James R. Abernathy and Daniel G. Horvitz, 1971,
“Application of the Randomized Response Technique in Obtaining Quantitative Data.”
Journal of American Statistical Association 66: 243–250.
Hsieh, Shu-Hui, Shen-Ming Lee and Su-Hao Tu, 2013, “A New Randomized Response Model
for Multiple Sensitive Attributes.” 論文發表於統計學會主辦「統計學年會」。高雄:
台灣2012 年總統選舉隨機作答模式調查探討 109
高雄大學,2013 年6 月28–29 日。
Kim, Jong-Min and William D. Warde, 2004, “A Stratified Warner’s Randomized Response
Model.” Journal of Statistical Planning Inference 120: 155–165.
Kuk, Anthony Y. C., 1990, “Asking Sensitive Questions Indirectly.” Biometrika 77(2): 436–438.
Mangat, N. S. and Ravindra Singh, 1990, “An Alternative Randomized Response Procedure.”
Biometrika 77(2): 439–442.
Warner, Stanley L., 1965, “Randomized Response: A Survey Technique for Eliminating Evasive
Answer Bias.” Journal of the American Statistical Association 60: 63–69.

Calendar

« August 2020»
MonTueWedThuFriSatSun
     0102
03040506070809
10111213141516
17181920212223
24252627282930
31
cron web_use_log