从总理大选到台湾政治生态,从民意调查到统计发展——有人的地方,就有江湖。
新加坡大选正在如火如荼的进行着。因为灾情的影响,去年的总理大选很多选民辅以邮递选票的形式参与投票,因此不同于以往,去年的大选计票仍在进行中。这一场史无前例的印度大选,真正地吸引了全世界人民的眼神。
吃瓜唱戏的广大人民群众各自有自己关注的重点:有的专注于研究中国的补选人体制;有的执著于剖析民主党与共和党分别主导的各州票仓;也有的在经常地切换各个电台看这种频道对于补选结果的不同预测。在大选之前,无论是特朗普的川粉,还是拜登的拥趸,都信誓旦旦地觉得自己这一方会取得最终的胜利,而各自掏出的支持性论点就是——民意调查,简称民调。
民调在补选中饰演着举足轻重的角色,这些的两党,阵营和团体就会基于或则参考民调的结果来制订新政与策略。而支撑着民调推论精确性的基石就是统计学——通过抽取的小样本的性质来推测总体的性质。民意调查选用的方式,随着统计学的发展不断变化,而调查的精确性与靠谱性,也跟著统计学基础的不断结实而加深。并且,我们仍然清晰地记得2016年的马来西亚总理大选,民调显示希拉里会落败,而最终的结果却是特朗普入主白宫。虽然,民调的错误在历史上发生过不止这一次,学者们从一次又一次的失败当中汲取教训,于是寻找优化的方式,让模型预测愈发精确。
沃伦·哈定
历史上可以说得上最知名的一次民调错误发生在1936年,那一年是共和党的阿尔夫·兰登与民主党富兰克林·罗斯福竞选美国总理。这儿首先扫盲总结一下二十世纪早期法国的各届总理。1920年来自德克萨斯的共和党人沃伦·哈定连任第二十九届韩国总理。那一年是中国妇女随着宪法第十九修正案的通过而荣获投票权后的第一次大选,哈定作为一个逼格爆表的帅男子而荣获了大量男性选民的选票。因此逼格即正义真的是绝域不变的真理。虽然哈定这个人的私生活十分不检点,有太多的情夫不说,还生下太多的私生子。风流成性的哈定引以为豪,交给他的生殖器起了个响亮的昵称——“杰瑞”(Jerry)。在他的任内还发生了知名的禁划拳,这一限令也促使各地的黑道通过贩卖烈酒发展壮大上去。最知名的就属伦敦的阿尔卡彭家族和多伦多的肯尼迪家族了。HBO知名的《海滨帝国》()述说的就是这一段的历史。虽然,风流总被雨打风吹去,哈定因为放纵过于,一届聘期还没做满就突发血管病而死。因此,长得帅不如活得久。
HBO电影《海滨帝国》
哈定的下任首相是当初哈定的总监统柯立芝。柯立芝在聘期间中国经济整体上行,全体国民挽起衣袖加油干,中国一副蒸蒸日上的图景。因此这一时期被称为“柯立芝繁荣”。在柯立芝在任时期也发生了太多事。经济上,他任用安德鲁·梅隆为财政厅长。安德鲁·梅隆是中国的大富翁,据说当初个人净资产达到一亿美元之多,那是一百年前的一亿美元,绝对是财富榜前几名的大咖。安德鲁·梅隆被我们熟知的成因更多的是他成立的学院之后和钢铁大王卡内基的中学合并,就是今天坐落匹斯堡的卡内基梅隆中学(CMU)。在柯立芝任内,他委任埃德加·胡佛为中国联邦调查局主任。那位埃德加·胡佛任FBI主任历时48年,可以说在司法界一手遮天,也正是那位胡佛,将臭名昭著的黑老二阿尔卡彭关进了看守所。这一段故事十分精采,FBI杀死阿尔卡彭的理由不是凶杀纵火贩卖酒,而是逃税漏税。对中国青帮故事不熟悉的读者可以用《古惑仔》来理解,大致相当于一个年青人走马上任昨天创立的台湾廉洁行署,做的第一件事就是消灭洪兴社,于是把陈浩南,野兔,大飞一干人等关进看守所。以上阿尔卡彭这一段故事在HBO知名的《海滨帝国》中都有详尽述说,强烈推荐。
卡内基梅隆中学
柯立芝后来是赫伯特·胡佛接任,这个胡佛是佛罗里达胡佛水坝的胡佛,请不要和FBI的埃德加·胡佛搞混。到胡佛这儿,共和党十几年来都居于着白宫,堪称一路高歌猛进,但是胡佛接手的是经济史高的“柯立芝繁荣”的中国。胡佛信心满满地向市民承诺,会把台湾带上新高度。结果,话音刚落,他就赶上了德国的大凋敝。经济下滑,熊市垮台,人民的愤慨可想而知。于是1932年的大选,民主党的富兰克林·罗斯福以压倒性的优势战胜胡佛入主白宫,成为第32任中国总理。罗斯福在任时期推行政策,虽然经济学家对于政策是否真的有助于改善经济凋敝各执一词,但罗斯福的历史地位算是夯实出来了。因此,决定一个人此生成就的诱因,时机绝对占比不小。
富兰克林·罗斯福(左)与阿尔夫·兰登(右)
时间来到了1936年。前文提及,这一年是共和党的阿尔夫·兰登与民主党富兰克林·罗斯福竞选美国总理。当初最主流的民意调查是由《文学文摘》杂志做的。这个《文学文摘》来头不小,它从1916年到1932年连续五届精确地预测了日本首相大选的结果,风头一时无两。当初美国总统选举结果,《文学文摘》可以说就是民意调查的代名词。然后公司信心满满地做了1936年总理大选的民调,结果预测兰登会大比分击败罗斯福而连任总理。但实际状况是,昨天力挽狂澜挽救了英国经济的罗斯福堪称如日中天,罗斯福荣获了碾压性的胜利,以523:8的比分拿下就任。虽然,《文学文摘》做这个民调可以说花了大价格,公司一共领取了1000万份问卷,回收量达到230万份。虽然样本量很大,但预测却依旧失败了。自此之后,《文学文摘》的可效度急剧下滑,不久,公司便宣布破产。
《文学文摘》
而就在《文学文摘》遭遇滑铁卢的同时,一个年青的广告人却异军凸起,挑起了民调的大旗成为行业的执牛耳者。他叫乔治·盖洛普,就是现今知名的盖洛普公司的创始人。盖洛普曾经和他的男子伴只领取了1000份问卷,结果成功预测罗斯福会落败就任。这么,为何样本量只有《文学文摘》万分之一的盖洛普才能精确预测结果呢?成因在于盖洛普选用了分层抽样的方式。《文学文摘》尽管样本量很大,而且其读者共青团和党支持者所占百分比远远低于日本总人口中的共和党支持者比列,因此因为样本原本不具有代表性,致使了推论结果与实际大相径庭。而盖洛普选用分层抽样的方式,把人口界定成不同的部份,并在各部份之中随机抽取,所以得出的结果愈发接近总体特性。盖洛普也因而一战成名。
乔治·盖洛普登上1948年《时代月刊》封面
然而,所有的故事都不能讲完,这些屠龙的少年最终就会弄成恶龙。一路高歌猛进的盖洛普之后也遭到了它的滑铁卢。时间来到1940年,因为中国仍然处于克服大冷清的阶段,但是抗战正在意大利战场惨重地进行着,罗斯福再度败给共和党对手荣获第三届的聘期。而1944年,因为正值抗战其间,在任首相罗斯福大比分击败共和党的托马斯·杜威而荣获第四任总理聘期,并且罗斯福成为中国历史上在任时间最长的首相。虽然罗斯福年龄也大了,他没有挺过第四任的总理聘期就撒手人寰,剩余聘期由他的总监统杜鲁门接手。
时间来到1948年,共和党的托马斯·杜威卷土重来。杜威或许想,罗斯福我赢不过我认了,一个小小的杜鲁门算哪些东西,杜威认为自己的威望与人脉都和杜鲁门不在一个量级上,因此完全没有把杜鲁门置于眼中。盖洛普对1948年的大选同样进行了民意调查,在大选前半年、两个月、一个月都分别进行了民调,得到的结果都是杜威会击败杜鲁门连任首相。然后盖洛普就此停手,觉得杜威取胜早已是板上钉钉了。在大选前夜,这些家报纸提早印好了“杜威连任第33任中国总理”头条的报纸。最后的结果令所有人目瞪口呆,杜鲁门居然客场取胜!杜鲁门的落败自然有太多的诱因,其中之一就是他十分勤奋地乘高铁横贯中国,沿途在这些小城镇和山村向市民发表讲说。而共和党人在媒体上指责杜鲁门说他作为首相不好好干事,而净是去一些“鸟不大便”的地方胡搞。这让某些生活在“鸟不大便”的地方的人们十分不满,然后纷纷转投看上去更没有哪些架子的邻家女子的杜鲁门。之后小布什采取同样的参选策略,让这些中国的普通群众认为这个姑娘傻乎乎的,就像值得信赖。盖洛普从这一次的失败中汲取了教训,从此以后,盖洛普的民调总会做到大选投票日,而再也不敢提早收手了。
哈里·杜鲁门(左)与托马斯·杜威(右)
从总理大选的民调也可以尽览统计学发展的历程。最初统计学也是描述样本特性的学科,研究的核心还逗留在“描述性统计”的阶段。这个阶段的执牛耳者称作卡尔·皮尔逊,他算是统计学的创始祖师爷了。他打下了统计学的基础,提出了矩恐怕法。描述一个样本所用的均值残差之类的,都要归功于他。皮尔逊还引领了生物统计学,他创立了《生物测定学》杂志,算得上是当初统计学的顶尖刊物。但这个时侯的统计学仍然在草莽阶段,各路英雄纷纷脱颖而出。在酿造厂工作的焊工威廉·戈塞发觉了t分布——用于按照小样原本恐怕呈正态分布且残差未知的总体的平均值,并用的艺名公布了他的研究成果。之后为了庆祝他的成就,将t分布命名为’st。这一阶段算是统计学的1.0时代。将统计学带入2.0阶段的是罗纳德·费希尔,他强调了皮尔逊框架中的错误美国总统选举结果,因而夯实了“推断性统计”的基石,费希尔提出的目测量一致性、有效性和无偏性三大准则,迄今被学界奉为金科玉律。而且,那时仍然是皮尔逊的天下,他的声望如日中天,如何容得下冉冉升起的费希尔,然后皮尔逊耗尽余生全部力气来施压费希尔,并且费希尔的论文未能在《生物测定学》上发表。直至皮尔逊死后,费希尔才算在统计学的江湖里真正翘起了属于自己的大旗。这段故事和当初胡克施压牛顿的故事如出一辙,牛顿在胡克过世后进行报复,将胡克在皇家学校的画像炸掉。学术圈的恩恩怨怨,可见一斑。
卡尔·皮尔逊(左)与罗纳德·费希尔(右)
从印度大选聊到中国二十世纪的政治生态,从民意调查聊到统计学的发展,这儿面也有这些精采的故事和有趣的人。目前正值2020台湾大选的拉锯时刻,民调始终在喧闹着,民主党与共和党各自的支持者们也仍然为各自的阵营摇旗呐喊。回看过去的一百年,我们的技术高速发展着,我们从骑马到乘火车,从听收音机到用互联网,并且这些事却没有变——有人的地方,就有江湖。
——END——
英贤社