谷歌研究员质疑“看脸识罪犯”，交大教授撰文：我被扣帽子了

APP下载

扫一扫

下载观察者APP

谷歌研究员质疑“看脸识罪犯”，交大教授撰文：我被扣帽子了

分享到：

2017-05-16 13:43:47 字号：A- A A+ 来源：澎湃新闻

关键字: 罪犯脸谷歌帽子交大看脸识罪犯论文研究院

“基础概率谬误”（base rate fallacy）

来自谷歌的作者们是“为广大的受众，不只是为研究者”写这篇文章的，但他们随意地忽视了一些非技术流的博客和媒体报道里出现的“基础概率谬误”迹象。

人脑往往会被一个特定事件的高条件概率锁住，而忘记了该事件在大环境里发生的极低概率。我们文章中最强的基于深度学习的面相分类器有89%的识别率（注意：这是基于我们目前的训练数据，还有待用更大的数据核实），很多人就认为，这么高，这还不一试一个准！（国外就有文章报道我们时就惊呼“correct 9 out 10 times”）。有人在网上调侃 “教授，把你的脸放进去试试”。好吧，这倒是蛮好玩的。假设我的脸被测阳性（被认定为罪犯），我有多高概率有犯罪倾向呢？计算这个概率需要用贝叶斯定理：

P(罪|+) = P(+|罪)*P(罪) / [ P(+|罪)*P(罪) + P(+|非)*(1-P(罪)) ]

上式中P(+|罪)=0.89 是罪犯的脸被我们深度学习测试方法判阳性的概率，P(罪)=0.003是中国的犯罪率，P(+|非)=0.07是我们方法假阳性（把一个非罪犯判定为罪犯）的概率。将这些数值代入贝叶斯公式，结果是武筱林有3.68%的概率犯罪。我想，这一路从89%到3.68%走下来，原来不少骂我们的人就释怀了吧。那些叫着要纪委用我们的方法的网友也该歇歇了。不过，我这里再次郑重声明，我们坚决反对在执法司法中使用我们的方法，原因不仅仅是上面演算的结果。

基础概率谬误是媒体惯用的伎俩，夸张地描述某项大众所不熟悉的新技术或新研究，借此操纵大众，逐步灌输对人工智能研究的不理性恐惧。

无用输入（Garbage in）？

尽管我们对来自谷歌的作者们的精英主义论调感到不适，但我们认同他们提出的进步性的社会价值。他们实在没必要像编年史一样列出历史上那些臭名昭著的种族主义者，接着把我们列在后面。但起码在理论上，独立于主流社会观念的研究客观性是存在的。

我们都很了解“无用输入”和“无用输出”。然而，来自谷歌的作者们似乎在说，因为输入数据中人类的偏见是无法避免的，所以机器学习工具无法用于社会计算。就像大多数技术一样，机器学习是中性的。如果像他们说的，机器学习可以用来巩固社会计算问题中的人类偏见，但机器学习也可以用于发现并矫正人类偏见。他们担心反馈循环的问题，然而，反馈本身就既可以是负向的，也可以是正向的。就算“犯罪性”是个十分复杂的问题，受过良好训练的人类专家可以努力确保训练数据的客观性，也就是说，能使用独立于嫌犯外貌的正确判决。如果数据标签是不带人类偏见的，那机器学习在客观性上无疑是优于人类判断的。

即使标签中存在噪点，无论是随机的还是系统性的，也有科学办法能洗涤和恢复/提高结果的准确度。我们不能畏于民粹主义就在科学知识上让步。

过拟合（overfitting）的风险

批评者很快就指出了我们实验中所用的样本集较小，存在数据过拟合的风险。我们痛苦地意识到这个缺点，但鉴于某些显然的原因，我们难以拿到更多的中国男性罪犯身份证照片（这篇批评文章可能让我们丰富数据集的希望化为泡影）。然而，在如下所示的论文3.3章节，我们已尽全力验证我们的发现，这又被他们完全忽视了。

“鉴于社会上对这个话题的敏感性和反响度，以及对面相术的质疑，我们在公布结果前异常谨慎。我们故意跟自己唱反调，设计实施了以下实验，以挑战分类器的正确性……”

我们把训练集中的照片以五五开的概率随机标签为罪犯或非罪犯，看看四个分类器能否以超过50%的概率区别这两组照片。结果是四个分类器都失败了。一些类似的、更具挑战性的测试结果也是如此（详情参见论文）。这些实证结果，说明论文中分类器出色的表现并非由数据过拟合所致。否则，在样本集大小和类型一样的情况下，分类器也应能够区别两组随机标签的数据。

“白领子”（ white collar）

批评文章也质疑道，罪犯组的身份证照片大多是不穿衬衫的，而非罪犯组的身份证照片大多穿了白领子的衬衫。在这点上，我们忘了说明，在实验中，我们训练和测试使用的图片全部是只抠出了脸部的。

但不管怎样，这个“白领子”线索还牵出了另一个重要的细节，在这里我们需要向读者们道歉。这个细节是，我们无法控制那些实验对象的社会经济地位。我们不是不想控制，但基于保密协议，我们不能拿到元数据。考虑到这个微小差别，我们预期分类器的准确率在控制社会经济地位这一项后会下降。这是基于社会歧视的一个推论。事实上，也因此，我们认为这项研究结果对社会科学来说是有意义的。

在论文中，我们还采取了一切措施，避免机器学习方法，特别是CNN，检测到图像间一些浅表的差距，比如压缩噪点或照相机的不同（参见论文3.3章节）。

总之，我们感谢所有针对论文的问题和讨论，但坚决反对歪曲我们的初衷。比如James Weidmann说“武和张论文的意图正是如此”，这既不专业，也很傲慢。

（澎湃新闻记者虞涵棋杨漾）

首页上一页 1 2 余下全文
标签违法犯罪人脸识别上海交通大学种族主义科技
- 原标题：谷歌研究员质疑“看脸识罪犯”，交大教授撰文：我被扣帽子了
- 责任编辑:王佳璐
搜索

   观察者头条查看全部

美财长又威胁：若中方有伊朗资金往来，就二级制裁评论 242

一边增兵放狠话，一边画饼降油价，特朗普为选票拼了评论 48

砸100亿美元给东南亚，日本这样真能“遏制中国”？评论 140

欧洲谋划战后布局：邀请中印，排除美国评论 199

倒打一耙！美财长污蔑：中国才不可靠评论 247

   风闻 · 24小时最热查看全部

   最新视频查看全部
最新闻 Hot
快讯

谷歌研究员质疑“看脸识罪犯”，交大教授撰文：我被扣帽子了

万斯公开告诫教皇，被高声打断…

英国王要见“黑手党老大”？斯塔默回应

芬兰总统：我觉得加拿大可加入欧盟

“照这个速度，中国要超越美国，成为全球最大旅游经济体”

“印度老尴尬了：特朗普访华不访印，还大赞巴基斯坦”

伊朗总统：美国是想先把我们拿下，然后再去和中国交手

美财长又威胁：若中方有伊朗资金往来，就二级制裁

回应美方封锁，伊朗军方提及“波斯湾、阿曼湾和红海”

美伊均否认

一边增兵放狠话，一边画饼降油价，特朗普为选票拼了

逃亡美国的巴西情报局前局长，被ICE抓了

“美军将增派约6000名士兵，还有4200名在路上”

翻脸？“斯塔默犯了悲剧性的错误，毁了英国”

砸100亿美元给东南亚，日本这样真能“遏制中国”？

美国在为打古巴炒作？

“中方考虑限制对美出口”