-
威廉·戴维斯 :“大数据”将如何颠覆民主?
关键字: 大数据美国大选民主危机过去四十年中,各国政治、经济和地理状况不断变化。主导政治辩论的统计数据主要包括国家的以下情况:贫穷水平、失业率、国内生产总值(GDP)、净移民数。但资本主义国家地理位置这一因素与前两个因素的发展方向有所不同。
全球化并没有使地理位置变得无关紧要。在许多情况下,全球化反而使经济活动的位置变得更为重要,加剧了经济成功地区(如伦敦或旧金山)和不成功地区(如英格兰东北部或美国锈带)之间的不平等。主要的地理单元不再局限于民族国家,而变成了那些正处于上升和下降期的城市、地区或独立的城市街区。
将国家作为一个单一社区,并用一个普适的数据框架去测量的启蒙理想越来越难维持。如果你住在威尔士山谷里一个曾经依赖钢铁制造业或采矿业来创造工作机会的城镇,那些说“经济运行态势正好”的政客可能反而会招致更多的怨恨。从这个角度来看,“GDP”一词无法传递任何有意义或是令人信服的信息。
当宏观经济学被用来作政治论证时,这就意味着该国的一部分损失被其他地方的收益抵消了。那些引人注目的国家指标(如国内生产总值和通货膨胀)都隐藏着各种各样地方化的收益和损失,而这些政治家们都很少讨论。总体而言,移民可能对经济有好处,但这并不意味着没有任何地方成本。
所以当政客们使用国家指标做出他们的案例,他们是在隐射那些有爱国精神选民的牺牲:这个时候你可能是失败者,但下次你可能是受益人。但是如果桌子从来没有转过呢?如果同一个城市或区域一次又一次地赢了,而其他地方总是输呢?付出和收益应该适用什么样的原则才是公正的呢?
在欧洲,货币联盟加剧了这个问题。影响欧洲中央银行(ECB)重要指标是那些代表了5亿人口的指标。欧洲央行关注整个欧元区的通货膨胀率或失业率,它将欧元区看做一个单一同质的领域。同时,由于欧洲公民的经济命运正在向不同的方向分裂,这取决于他们所居住的地区、城市或社区。官方的知识变得越来越抽象,甚至逐渐与生活经验脱节,直到变得不再相关或是可信。
国家有着天然成为数据分析范围的特权,这也是数据分析内在的偏见之一。而随着多年来经济的变化这个特权已经消失殆尽了。另一个正在面临日益紧张压力的内在偏见是对数据分析的分类。统计学家的工作之一是通过把人类放在由其创造的一系列标准之中来进行分类:就业或失业,已婚或未婚,亲欧洲或反欧洲。只要人类可以根据这种方式被归类,那么就可以看出不久的将来可以有一种分类能够涵盖整个人类。
这可能会涉及减少选择项。以失业为例,例如一个人要被归类为失业人口,他必须向调查机关报告,自己是非自愿失业,即使现实情况可能要比那复杂的多。许多人一直在徘徊在工作和失业之间,原因可能与健康和家庭需求等劳动力市场的条件有关。但是基于这种简化的分类,我们便可以确定整个人口的失业率。
然而这里存在一个问题。如果我们这个时代定义的很多问题,并不是指它们影响了多少人,而是指与此有关的人会受到多深的影响,这时应该怎么办?失业就是一个例子。英国就因失业率没有显著上升而平稳渡过了2008至2013年的经济大萧条,这也被视为一项积极成就。但是过度关注“失业”掩盖了“就业不足”的问题。“就业不足”指没有足够工时或就业能力低于岗位要求水平的人。目前就业不足人口在“就业”劳动力中占比约6%。然后自雇劳动力兴起,这使得“就业”和“非自愿失业”之间的区分变得没有意义。
这并不是对国家统计局(ONS)等机构的批评,这个机构目前正负责就业不足的数据。但只要政治家继续通过指责失业率来模糊批评指向,那么这些挣扎着却无法充分就业或是仅靠工资无法生存的人在公开辩论中就得不到充分代表。如果同样是这些人在怀疑政策专家和政治辩论中使用的统计数据,以及政客们所描述的劳动力市场和现实生活的不一致,这将令人非常惊讶。
20世纪60年代以来身份政治的兴起对这样的分类制度造成了更大的压力。只有当人们接受了有限的几种由专家而非被调查者选择提供的人口统计类别时,统计数据才是可信的。但当身份成为了一个政治问题,人们需要界定他们自身的性别,性取向,种族或阶级等。
意见投票也正遭受类似原因的困扰。传统上投票可以了解人们的态度和偏好,并且可以合理假设人们会做出相应行为。但是,在政治参与度下降的时代,仅仅知道人们可能会倾向于在哪个盒子投否认票是不够的,还需要知道他们是否真的对此感到强烈不满。当涉及捕获这样的情绪波动时,投票工具并不好用。
四、统计数据的“信任危机”缘起何处?
长期以来统计数据一直面临批评。身份政治和全球化给其带来的挑战也不是新鲜事。为什么过去一年发生的事件对定量研究及其在政治辩论中的作用如此有害?
近年来出现了一种新的量化和可视化人口的统计方式,这可能会将统计数据推到边缘,从而进入了一个完全不同的时代。由技术专家收集和汇编的统计数据,正在让位于数字化扫描时默认累积的数据。传统上,统计人员已经知道哪些人群想问哪些问题,然后开始回答他们的问题。相比之下,每当我们刷信用卡,在Facebook上评论或在谷歌上搜索某物时,都会自动产生数据。随着我们的城市、汽车、家庭、家庭用品都变得数字化时,我们的踪迹将会留下更多的数据。在这个新世界里,首先要捕获数据,然后再进行相关的问题研究。
从长远来看,这一发现的影响可能会与17世纪末发明统计数据一样深刻。“大数据”的兴起和以往所有的投票或统计建模相比,带来了更多的定量分析机会。但是这种不同不仅表现在数据量的不同。它代表了一种完全不同的类型的知识,并且伴随着一种新的专业模式。
第一,没有固定的分析规模(如国家)或是任何固定的类别(如“失业者”)。这些庞大的新数据集可以挖掘出模式、趋势、相关性和大众情绪。它成为跟踪人们身份的一种方式,但这种跟踪是基于人们的自发行为(如网民贴出的“我正在和科比在一起”或“企业家”的标签)而不是强加分类。这种集合形式更适合当今流动性更强的政治时代,我们不能指望一切都能回溯到启蒙运动理想时,民族国家可以作为公共利益的守护者。
第二,我们大多数人完全不了解这些数据是怎么评判我们个人或是整个集体的,也没有和国家统计局办公室相当的机构商业性地收集大数据。我们生活在一个我们的感觉、身份和关系网都可被以前所未有的速度和敏感度跟踪和分析的时代;但这点从未在公共利益中体现或是在公开辩论中有所提及。有数据分析师为谷歌和Facebook工作,他们并不是生成统计数据的“专家”,现在却受着广泛的谴责。新分析师的不确定性和秘密性可能使他们在政治上比任何社会科学家都要更强大。
像Facebook这样的公司有能力以非常低廉的成本对数亿人进行量化社会科学研究。但它没有动力去揭示结果。2014年,Facebook研究人员发表了一篇关于“情绪感染”研究的结果,他们对用户进行了实验,改变了新闻消息来看它如何影响用户回应的共享内容。有点要强调的是人们是在不知情的情况下参加试验的。因此,从Facebook的角度来说,为什么要这么麻烦去出版这个实验结果?为什么不只是做这项研究然后保持沉默?
从统计逻辑到数据逻辑的这种转变最具政治意义的地方在于,这些数据与兴起的民粹主义的匹配度如何。民粹主义的领导人可以鄙视传统的专家,如经济学家和调查人员,转而信任一种不同的数字分析。这些政治家依靠一个新的、不那么高调的精英,从庞大的数据库中寻找模式,但很少公开发表声明,更不用说发表任何证据。这些数据分析师通常是物理学家或数学家,其技能根本不是为了研究社会。例如迈克尔前顾问兼投票联盟竞选总监多米尼克·卡明斯(Dominic Cummings)宣传的世界观,他说:“物理,数学和计算机科学与宏观经济预测不同,这些是有真正专家的领域。”
- 原标题:“大数据”将如何颠覆民主? 本文仅代表作者个人观点。
- 责任编辑:宋煜昊
-
联大通过涉巴勒斯坦“入联”决议 评论 194“对于联大第2758号决议,美国只有严格遵守的义务” 评论 204与匈牙利关系升级!中国的“朋友圈”还有哪些布局? 评论 102美又对37家中国实体下黑手,中方:将采取必要措施 评论 445“这是中国车企对欧洲野心最大胆的表述” 评论 134最新闻 Hot
-
联大通过涉巴勒斯坦“入联”决议
-
“电动汽车关税将升至100%,还要对医疗器械下手”
-
美国认了,又没认…
-
最后一天,印度从马尔代夫全部撤军
-
美欲对中国联网车下手,韩国又紧张了
-
为对付中国,他称美国得向印度取经
-
他向美媒“告洋状”,想蹭乌克兰却忘了……
-
乌克兰称俄军可能在北部开辟新战线
-
拜登都承认了,“布林肯报告仍将嘴硬”
-
“韩国得自卫,不然美军赢不了中国”
-
“对于联大第2758号决议,美国只有严格遵守的义务”
-
上万人抗议以色列,她也现身了
-
美议员举例广岛长崎支持向以供武,日外相:不可接受
-
他当美官员面表态:只认联合国,不认美国
-
以色列人自己都看不下去了,向美媒发图“吹哨”
-
与匈牙利关系升级!中国的“朋友圈”还有哪些布局?
-