中读

AI寻亲的进步与难题

作者:王梓辉

2019-07-17·阅读时长10分钟

2044人看过

本文需付费阅读

文章共计5338个字,产生2条评论

如您已购买,请登录


通过新的跨年龄人脸识别技术,已经有一些被拐已久的儿童找到了他们的亲生父母


用一张10年前的照片找到他

如果一个儿童被拐卖了,想找回他有多难?放在当前这个遍布摄像头的环境中,也许希望很大;但在10年前,答案是残酷的。

直到2017年12月,公安部刑侦局副局长陈士渠还记着他几年前曾督办过的那个拐卖儿童的案子。主犯在2014年落网前先后拐卖了13个儿童,只找回来了当年拐卖的3个,2008~2010年拐走的10名儿童仍无下落,据说原因是“主犯只交代了3个,如果再交代第4个刑责就有可能加重到死刑”。

负责打拐的警察们不是不努力,他们想过不少办法。根据专案组自己透露的历史,2015年,他们曾联系了著名刑事相貌专家、中国刑警学院的赵成文教授,依照孩子们的童年照片,画出他们十几岁的样子,专案组再带着这些画像到儿童们被卖去的广东省,提取适龄儿童照片,“用肉眼找出觉得和这个像的”。看了10天,专案组带回了300余份疑似照片,组织家长辨认,最终确定了176个疑似对象,但最终无一命中。他们还曾经用肉眼尝试从十几万张可能的照片中拿走失儿童的照片进行比对,就那么一张一张看,还是没能找出来。而这就是传统寻找被拐儿童的方法。

这也让汤海鹏在2017年12月听到这个案子后提了一嘴,说腾讯正在做一些跨年龄人脸识别的算法,也许可以试试。当时陈士渠正在腾讯调研,而汤海鹏是腾讯安全管理部安全专家。就这样,在对话发生千里之外的广东,笼罩在10名被拐儿童身边的迷雾终于被撕开了一道缝。

但事情没有汤海鹏想得那么容易。简单来说,人脸识别技术指的是通过比较人脸的视觉特征信息从而进行身份鉴别的技术。但我们手机上用到的人脸识别技术应用难度没那么大,因为它识别的对象就是当下的你,你的脸部特征不会在短时间内发生剧烈变化。而跨年龄的人脸识别就要难得多,特别是青少年阶段,人脸特征变化最大,许多人长大后回看自己小时候的照片都认不出来。

拿到这个项目之后,汤海鹏回来和腾讯内部负责图像识别技术研发的优图团队交流,他才发现出了很大的问题,因为他们当时根本就不具备这个能力。“当时我们可能也就能够做到在几百张成人照片中间,通过一张婴儿时期的照片找出一个人。”汤海鹏对本刊说。而这种能力显然无法满足在几十万张照片中找到一个人的需求。

事后回忆起来,其实也只有一线希望。但因为这个项目的特殊性,他们决定尽最大努力试试。办法只有一个。“就是要让机器知道,当一个人的面部随年龄演变时,不变的那些量是什么。”研究员晓程说。然后他们再把这些面部特征转化为对应的计算机语言。

具体来说,这个由十几位博士组成的团队自己研发出了一套算法,对0~18岁的人脸成长变化进行了模拟建模,生成可供学习的人脸样本,然后利用深度神经网络算法让机器来学习这些人脸在成长过程中的变化。学习的材料不好找,就用研发人员自己小时候不同时期的照片,分别告诉计算机,“这是一个人1岁的样子、5岁的样子、10岁的样子、20岁的样子”。

还好计算机技术的进步一般是指数型的。2018年3月,AI比对的成功率提升到了可以一试的程度,第一次比对的时刻也来了。但没有预想到的问题出现了。“一开始,我们拿到的照片其实是家长自己用手机翻拍的那种,我们拿过来发现信息量损失非常大,根本没办法用。”汤海鹏回忆说。只好又跟四川警方商量,说能不能让这一部分家长把原片送过来,没想到这个过程又挣扎了几周。

汤海鹏说,很多家长是不愿意送原片的,因为这么多年过去了,那一张照片可能是他们唯一留下来的孩子的物品,可能没有其他任何的能够留下来的东西了,而且这些照片又是分布在四川好几个地市不同的家长手上。但没办法,警方也只能硬着头皮去劝说家长们能够把照片提供过来。汤海鹏现在还记得一个细节,当四川警方收集完了照片,统一拿到上海漕河泾开发区软件园的优图实验室里时,他们慢慢打开袋子,看到的是好几个油纸包裹,把油纸一层一层地拆开,里面才是那一张小小的照片。他们再用数字化高清仪器将照片提取出来,每张照片的大小能从之前的几百KB变成10MB,终于让对比有了可行性。

2018年4月,在由警方提供的房间里,优图团队的研究人员把那10张照片放到广东省方面提供的数据库里开始检测。两个小时后,电脑上生成了10个文件夹压缩包,每个文件夹里有101张照片。第一张照片是被拐儿童的原照片,剩下的100张照片是100个十二三岁左右的儿童,他们以满分100分制降序排列,分数基本都在75分以上。“75分是万分之一阈值,80分是十万分之一阈值,85分是百万分之一阈值”,汤海鹏说,“以75分为例,如果两个人脸比对分数超过75,则这两个人脸是万里挑一的像”。

这1000张照片被交给了四川警方,警方又找来家长一张张去看,看他们觉得哪个像,这样再删选到几十个;最终经过信息筛查,范围被缩小到了10张以内,而这个过程用了4个月的时间。最后一个环节就是比对DNA,据说在四川省公安厅,参与打拐的警察们都充满期待,有人很乐观,猜测可能会比对上几个;一个干了多年警察的老刑侦比较保守,猜两个。“我们当时都在祈祷,觉得如果能找到一个就已经很谢天谢地了。”汤海鹏说。最后的结果是比对上了4个。

文章作者

王梓辉

发表文章131篇 获得9个推荐 粉丝355人

前《三联生活周刊》记者

中读签约作者

收录专栏

女人四十

中年转折期与自我重启

7931人订阅

现在下载APP,注册有红包哦!
三联生活周刊官方APP,你想看的都在这里

下载中读APP

全部评论(2)

发评论

作者热门文章

推荐阅读