巴马香猪价格交流组

为什么美国总统大选结果的预测永远不准?

海棠金融快讯 2018-06-08 20:50:30

除了刺激销量、娱乐大众,民意调查到底有没有一丁点预测选举结果的作用?




新鲜出炉的美国总统选举结果,几乎让所有人大跌眼镜。选举前几乎在所有民调中都领先的希拉里,最终输掉了选举。

民调到底靠不靠谱?大选结果到底能不能预测?我们不妨听听豆瓣阅读专栏作者何满子在几个月前的预言……


怎么大选结果的预测永远不准?

作者 何满子


几个月前,当英国开始公投决定是否脱欧,几乎所有的民意调查都显示留欧派人群占了上风。一年以前,英国的总统大选投票前,民调也显示投票的结果一定是联合政府——不可能有任何一个政党赢得议会席位的绝对多数。


可后来的故事大家都知道了:不论总统大选还是脱欧公投,结果都和之前的民调数字相差甚远。英国出人意料地以52%的选票通过脱欧,保守党则以令人咋舌之势大获全胜,以绝对多数党的身份入主唐宁街。而时间转到2016年,离11月8号投票日还有不到一个月,特朗普43%,希拉里44%的民调数字满天飞,这些数字到底表示着什么意思、又是怎么得出来的?除了刺激销量、娱乐大众,民意调查到底有没有一丁点预测选举结果的作用?



民调机构:谁在调查民意?


从一个人正式宣布参加总统竞选起,各种媒体和出版物就开始跟踪他的民调数字。在美国,进行大选民调的主要承载者有两类,一是媒体,二是大学。只要是大的传媒集团,像CNN,路透社,华尔街日报等等,都会不时展开民调;除他们之外,有几所大学下属的研究院也会发布他们的调查数字,而其中Quinnipac大学的报告,以起范围之广、和调查之严谨,一向被认为是最具可信度和权威的民调。


这个星期发布的民调数字,几个例子:


ABC(美国广播公司)/华盛顿邮报,全国民调:希拉里47%,特朗普43%,约翰逊(自由党提名人)5%,斯坦(绿党提名人)2%;


Rasmussen Reports(美国一家民意调查公司),全国民调:希拉里41%,特朗普43%,约翰逊6%,斯坦2%


FOX News(福克斯电视台),全国民调:希拉里47%,特朗普38%,约翰逊7%,斯坦3%


NBC(国家广播公司)/WSJ(华尔街日报),俄亥俄州民调:希拉里41%,特朗普42%,约翰逊9%,斯坦4%


Emerson(爱默生大学),俄亥俄州民调:希拉里45%,特朗普43%,约翰逊7%,斯坦2%


不难看出,以上不过是众多民调数字里的冰山一角,可差别也足够明显的了。全国民调的数字有多有减,各州、尤其是摇摆州的数字就更参差不齐。可是每一期的报纸还在印,每一日的民调数字还在源源不断地推出和讨论。可是我们必须得知道,当我们讨论民调数字的时候,我们到底在讨论什么?



民调的偏见(一):媒体偏见


几乎所有的调查机构都会出现「媒体偏见」,这种偏见通常出现在他们调查的人群、问问题的方式、以及汇报方式中。譬如有一些机构采取的是传统的电话采访、甚至是登门采访的方式,那么采访时间、街区、以及什么样的人会在家和不在家、都是产生偏差的原因。


根据媒体和媒体内部风向的不同,媒体偏见的程度有所区别:我见过最夸张的,比如CNN在首次大选辩论之后所做的调查,希拉里以62%比27%大获全胜。可要是读一读他们给出的详细报告,便立刻见得赤裸裸的取样偏见:在接受调查的521个人里,有41%的人自称民主党人,而共和党人只有26%(另外的33%无党派)。


当然,不是所有的民调都如CNN一般赤裸裸地宝贝希拉里。多数的民调,是搭配好民主党、共和党和中间选民倾向的,但他们也有自己的缺陷:由于整个媒体社会的左倾,导致人们在公开场合接受调查的时候,往往会把自己说得左一点。右派不受待见,所以偏共和党人士往往会说自己是中间独立派,这样一来,无形中又容纳了许多披着独立派外衣的共和党。



民调的偏见(二):取样偏见


如果说,媒体偏见通常是一目了然、并且只要想避免就能避免的,那么民调数字所面临的取样问题,才是真正棘手的偏见来源。取样的核心在于,民意调查无法真正调查每一个人的意向,所以只能选一小部分(有时是几百人、最多也不过一两万)来代表百万计的选民。


于是问题来了——到底哪些人能代表所有选民?什么样的取样,最能多元化、并且成比例地代表11月8日会出现在投票窗口的人?


现行的民意调查,通常选取的样本,称为 “likely voters”,既「预计投票的选民」。他们在调查问卷的第一栏就会问受访者「是否准备投票」,只有答是的人,所填的结果才会计入在内。


然而简单的一句是否准备投票,离保证民调取样的代表性,还差得很远。通常的民调除了只选取「准备投票」的选民之外,还会将他们的取样人群按性别、种族、年龄分布等等因素和美国人口匹配好,尽力模拟大选的投票。


可是最难预测、也最难模拟的,是一个叫做「投票率」的问题,所谓“voter turnout”。「投票率」说的是在号称自己准备去投票的人中,到底有多少人,最终到11月8日那一天会真的出发到投票站去投。


为了保证选票公正和公开,到目前为止,美国的总统选举(以及西方世界几乎所有严肃的民主投票),还是采取设立投票站、让选民一一拿着身份证去投票的方式。这样最能保证一人一票,但是也最麻烦:首先,在离投票日还有三四个星期之前(各个州的截止日期不同),先要进行「选民注册」,既只有在自己所住地登记注册的人,才能参与投票。有些人可能看着大选热热闹闹,可一不留神错过了选民注册,那到11月时再想投票也没辙了。另外,那些不住在美国、旅居海外的美国公民,也可以通过邮寄的方式来投票,但收不收得到、能不能在有效日期内收到,也是另外一回事。


而最重要的,是那些已经注册、并且打算投票的人,到底会不会走出家门去投。想好了周末要去买菜、去郊游、去串门、去打球结果没去成,还有买了健身房、游泳馆的年卡最后没去几次的人,我们都不陌生,而大选投票也是一样——支持者到底能不能真的将支持转化为行动,是候选人和民调机构一致最大的难题。


而今年的选情之下,「投票率」这件事对于候选结果的影响,可能还要更大一些:特朗普的支持者大多是狂热支持者,希拉里的支持者则大多是掂量再三,决定两害取其轻而支持的她。这两种人,投票的动力显然是不一样的。狂热支持者几乎百分之百会去投票,哪怕是在己方处于绝对劣势的州。希拉里的支持者就不一定了:别人在电话里问他支持谁,他可能想想说还是勉强支持希拉里吧,可是到了11月8号,他投票的感情并没有那么强烈,所以可能他早上起来,逛个街,买个菜,做了中饭做晚饭,晕乎乎的就忘了投票的事。也可能他早上起来准备去投票,却发现原本以为10分钟路程的投票站,原来得走15分钟,顿时觉得没必要走那么久,干脆不投算了。


尽管听起来很可笑,但是买菜、做饭、理发、走太远,真的是很多「预计投票选民」最终没有去投的原因,而希拉里从超市、面馆和理发店中损失的票数,必定要比特朗普多的多。


当然,也有调查机构,比如洛杉矶时报,考虑到了选民转换率的问题,于是在他们的取样群体中除了调配好年龄、性别、居住地这些特质的比例之外,还加入了「上届选举投票率」这个变量。譬如说,2012年的所有选票之中,大约有47%投给了民主党人奥巴马,45%给了共和党人罗姆尼。于是洛杉矶时报将自己进行民调的取样人群也控制在这个比例,既受访的人中有47%的人四年前投给了奥巴马,45%的人四年前投给了罗姆尼,这样就让自己的取样人群在组成上更加接近理想中的「likely voters」。


可是洛杉矶时报这个看似聪明的做法解决了支持者转化率的问题,却又创造了新问题:它假定每一次选举的投票群体是不变的——既参与投票的人总会参与,不参与投票的人永远都不投。这个假定大体上有合理之处,但也有纰漏:其一,是没考虑到四年之内长大、并且超过了18岁的初次投票者;其二,今年的大选,尤其特朗普反传统的竞选政纲,势必会吸引一大群通常对政治并不感兴趣的新人参加,使其选民样本也与往年不同。


同时,洛杉矶时报进行「上届投票比例控制」最重要的一个问题,则是人们在回答“四年前投票给了谁”的问题时,会有意无意地偏向赢家。譬如2012年,奥巴马收获了47%的选票,但是随机调查的结果,往往比这个数字要高——因为奥巴马最终赢得了大选,而人们总倾向于认为自己是站在了历史的正确面上。这并不是说他们故意在说谎——而是人类的记忆本来就是点点滴滴的记录片段加上理性推导的结果,所以潜意识中想要站在历史正确方的愿望,有时会使人在毫无察觉中「记错」。而这种记错,会暗中增加民调取样中罗姆尼——也就是偏共和党人士——的支持度,无形中提高了特朗普的数字。



尾声


虽然希拉里目前在80%的民调数字中都遥遥领先,但考虑到媒体偏见、调查方式的狭窄、以及选民的投票动力不足,这些民调并不能给她什么安全感。所以说,如果11月8日给我们的结果反转了之前所有的民调数字,我是一点也不会惊讶的。




本文节选自豆瓣阅读专栏作品

《为了2016》



深度八卦2016:

白宫之争,议员、州长和地产商的权力游戏

作者 何满子


外行看热闹,内行看门道,选战实况风云变幻,《为了2016》将每周五选取本周最重磅的选举话题,辅以美国历史、政治版图、错综复杂的游戏规则和人情世故,深度剖开这个奇妙大国的社会与人心。


点击【阅读原文】,了解更多美国选举背后的秘密