只凭 DNA 就还原出罪犯的长相,还是3D 版的?
没错,只需要一个 AI 模型,就能还原出这人的年龄、肤色、瞳色、甚至整个 3D 头像……
即使在此之前,没有任何人目击过这个嫌疑犯也没关系,用它合成的照片直接就能发布通缉令。
据提供这项技术的公司介绍,他们之前用这种手段合成过一张照片,最后捉到的嫌犯和照片中长得几乎一模一样。
听起来不仅高科技,甚至有点魔幻了。
消息一出,不少网友闻讯赶来围观,但他们很快发现了不对劲的地方。
从这家公司其他的 DNA 表型分析照片来看,嫌犯和照片长得比较像,更多情况下是一种 "巧合"。
他们还扒出这家公司之前发布过的一张罪犯照片,两人除了性别以外,可以说是长得毫不相干……
△找相同(doge)
那么这种技术,真的能用在罪犯通缉这么严肃的事情上吗?
一个备受争议的例子
事情还要追溯到 2019 年冬天的一个凌晨,加拿大埃德蒙顿警察局接到了一个报警电话。
一位 20 多岁的女性被强奸后丢在了路边,全身只有一件衬衫。
那天的气温接近零下 20 多度,她一度被冻得失去知觉,因此凌晨 5 点多醒来后才找到路人报了警。
由于嫌疑人带着面罩,又穿着厚厚的外套,受害人没有看清他的长相,只知道他说话带点口音、身高 1.63 米(5.3 英尺)左右。
案件的侦查也一直没有进展,就这样过去了 3 年。
就在上周二,事情迎来了新转机,加拿大警方找到一家专门从事 DNA 分析服务的公司,对该案犯人留下的 DNA 进行表型分析,得到了一张 3D 人像。
警方把它作为通缉令,发布在了其官网和推特等社交平台上,并声称这是 " 在所有调查途径都用尽后的最后手段 "。
不过老实讲,从通缉令上可以看出的信息并不多,能确定的似乎只有他是一名年轻的黑人男性。
其他特征像嫌疑人的具体年龄、发型、是否有纹身、是否有疤痕都不得而知。
而且,让加拿大警方没想到的是,通缉令一经发布,就在网上引起了轩然大波。
许多隐私专家表示,警方这一举动是极其有害的,很有可能加剧种族偏见和侵犯 DNA 数据库隐私。
美国电子隐私信息中心的全球隐私顾问 Callie Schroeder 就转发了该推文,并对 3D 人像的实用性提出了质疑:
如果你看到这条消息,你会如何思考?难道怀疑看到的每个身高 1.63 米的黑人吗?
他还进一步解释:不了解 DNA 表型知识的人看到合成图像,很可能会相信嫌疑人长得和 3D 人像完全一样。
他们意识不到这只是一个近似值,年龄、体重、发型和脸型都可能相差很大,而且肤色、发色、眼睛颜色也可能有细微区别。
在 reddit 论坛上,热评前几也几乎都是质疑声。
我不明白这怎么可能有用。
当警察缺乏必要的证据时,这将被操纵用来专门针对某人,或者只是为了骚扰他们不喜欢的人,这个主意太可怕了。
有网友甚至还举了自己因为和通缉令上的头像长得相似,被误认为是嫌疑人的例子,力证这一行为的不靠谱:
最后,在巨大的舆论压力下,加拿大警方不得不删除了这一通缉令,并表示会继续寻找其他方法破案。
不过话说回来,用 DNA 还原 3D 人脸,真的没有前途吗?
DNA 还原 3D 人脸,什么原理?
给警方提供 DNA 还原 3D 人脸照片的这家公司名叫 Parabon NanoLabs。
公司成立于 2008 年,大约在 2015 年初推出了一个名叫Snapshot DNA的 DNA 表型分析工具,可以基于 DNA 推测一个人的肤色、发色和种族等信息。
这项工具一发布,就受到了警方的热烈欢迎,当年美国国防部还给 Snapshot DNA 专门提供了 200 万美元的研发资金。
2015 年 6 月,Snapshot DNA 成功协助美国警方侦破了一起长达三年的谋杀案,如今罪犯已经在监狱服刑。
同时一些专家也认为,Snapshot DNA 在一定程度上具有科学依据,包括人类的发色、瞳色、肤色以及身高都与基因有关。
BUT,这项技术发布以来一直在遭到质疑——
毕竟 DNA 既不能解释由于吸烟、饮酒、受伤(包括纹身)等引起的个人外貌变化,甚至连实际人脸大小都无法预测。
生物信息学 &Snapshot 部门技术主管、哈佛大学博士Ellen Greytak对此回应称,尽管这项技术没有将一个人的所有细节特征还原出来,但 " 提供了一种针对罪犯长相的描述 "。
Ellen Greytak 进一步介绍称,Snapshot 是基于机器学习技术来根据 DNA 合成 3D 人像的,训练数据来自公开 DNA 数据集和对应的人脸长相。
但对于 Snapshot DNA 背后的详细算法原理,Parabon NanoLabs 拒绝公布。
当然,目前学术界已经有不少针对类似算法的研究。
此前发表在 PNAS(美国国家科学院院刊)上的一篇文章就试图通过 1061 个来自不同种族和年龄段的志愿者 DNA/ 人像样本,训练出仅凭 DNA 还原肤色、身高、年龄等信息的 3D 模型。
虽然这个 AI 经过训练后,脸型和肤色看起来比较接近:
但从实际数据来看,DNA 对于年龄等数据的预测准确度还有待提升:
所以,这些公开的 DNA 数据是怎么来的?
主要来源于两个家谱分析网站 GEDmatch 和 FamilyTree DNA。
在这些免费公开的网站上,人们只需要上传自己的 DNA 信息,就能知道哪些名人 or 网友和自己有亲属关系。
甚至如果你上传照片和出生年月等信息,各种家谱网站还能帮你整理好一整个系的图谱,但这些信息如今却被用在训练 AI 合成模型上了。
如此来看,这项技术距离真正精确用上还有不少的路要走。
原文地址:http://www.myzaker.com/article/634cebb68e9f0922011f5ebb