AI能窥探隐私?马赛克不起作用了?

2021-04-04 11:14发布

所知道的 AI 技术能有多厉害?前不久炒得火热的 AI 换脸技术,可以把人物的脸替换成别人的,京剧里的“变脸”在现实中也能实现了,要有多神奇就有多神奇。

让人意想不到的是,AI 还原马赛克技术已经成熟到让你无法想象的地步了。

近日,一个名为 Depix 的项目火爆 GitHub,上线没几天,在 GitHub 上标星已超过11.3k,累计分支超过1.1k个。

(GitHub地址:

https://github.com/beurtschipper/Depix)

据悉,Depix 能够将打上马赛克的文字解码,恢复成原图中的文字,但目前只适用于使用线性方框滤波器创建的像素化图像。
从视频《马赛克在AI面前可能不安全了》中可以看到,被打码的文字已经用马赛克覆盖的面目全非,完全看不出一点原始的痕迹,而用 AI 技术还原后的该文字,文字的排列基本可以看清楚,准确度也很高,稍加推理即可得到原始文字。

据项目作者介绍,使用 Depix 将打上马赛克的文字恢复成原图,只需要简单的四步就可以实现:
  • 从屏幕截图中截取像素块作为一个选区。

  • 在具有相同字体设置(包括文本大小、字体、颜色、hsl)的编辑器中,粘贴具有预期字符的 De Bruijn 序列。

  • 制作一个序列的屏幕截图,尽可能使用与创建像素化图像相同的屏幕截图工具。

  • 执行如下命令:

python depix.py -p[pixelated rectangle image] -s [search sequence image] -o output.png
同时,作者也分享了实现这一技术背后所用到的算法:
Depix 算法利用了线性盒滤波器分别处理每个色块的特点,它对搜索图像中的每一个块进行像素化来寻找直接匹配。
对于大部分像素化的图像,Depix 能够找到单个匹配结果,它假设这些结果是正确的,然后将周围多个匹配块的匹配在几何上与像素化图像中相同的距离进行比较,并假设这些匹配也是正确的。这个过程重复几次。
当正确的块不再有几何匹配后,Depix 将直接输出所有正确的块,而对于多匹配块,它将输出所有匹配的平均值。
虽然 Depix 算法输出的结果并不太完美,但相比之前的其它技术而言,已经算不错的了。
除了字符“密码”,清除图像马赛克也一直备受关注,一些技术能将面目模糊的人像变得清晰可辨,例如谷歌的超强像素递归方案、杜克大学的 AI 算法 PULSE等。

(谷歌的超强像素递归方案)


(杜克大学的 AI 算法 PULSE)
对于这个项目的火爆,网上的质疑声一片,不少网友担心会不会方便坏人窥探人们的隐私,也有人为那些草草打码就以为能隐藏机密信息的人“捏把汗”。
网友@山鬼花兮:研究的初衷是为了提醒人们保护隐私???确定不是方便坏人窥探人们的隐私吗?
网友@正则邱:这是基于大量人脸数据算出来的吧?反正我是不相信已丢失的细节能被还原
网友@Kang紫琪同学:所以一般马赛克我都马两次以上……以前总觉得有软件可以还原,居然现在才问世?
作者在文中写到:该项目开发的初衷并不是窃取信息,而是为了提醒人们注意信息安全。
无论是 AI 还原马赛克文字还是还原人脸图像,其初心都是科技向善。技术是一把双刃剑,有利也有弊,我们在享受技术进步带来的便捷时,也应该时刻警醒,不要将这些技术用于不良或非法用途。
对于这件事,你怎么看?欢迎在留言区评论交流!



往期福利
关注【飞马会】公众号,回复对应关键词打包下载学习资料;回复“入群”,加入飞马网AI、大数据、项目经理学习群,和优秀的人一起成长!
回复 数字“1”下载从入门到研究,人工智能领域最值得一读的10本资料(附下载)
回复 数字“2”机器学习 & 数据科学必读的经典书籍,内附资料包!
回复 数字“14”小白| 机器学习和深度学习必读书籍+机器学习实战视频/PPT+大数据分析书籍推荐!
回复 数字“29”干货 | 28本大数据/数据分析/数据挖掘电子书合集免费下载!
回复 数字“36”286页PDF教你如何搞明白深度学习的算法、理论与计算系统!(可下载)
回复 数字“46”700页的《图形深度学习》(附代码和下载)
回复 数字“47”好书推荐| 106 页的《Python进阶》中文版(附下载) 
回复 数字“48”最具影响力的20篇数据科学研究论文,附电子版~

回复 数字“131”下载|《人工智能的认知神经基础白皮书》PDF版

回复 数字“132”下载|2020城市大脑与超级智能建设规范研究报告(PDF版)