您现在的位置是:首页 >互联网 > 2020-10-23 13:59:19 来源:
微软从互联网上提取了大量的面部识别数据库
导读 根据周四发布的一份报告,微软公司本周谨慎地从互联网上撤出了面部识别数据库。建于MS Celeb数据库一度包含1000万张图像,约有100,000个人
根据周四发布的一份报告,微软公司本周谨慎地从互联网上撤出了面部识别数据库。
建于MS Celeb数据库一度包含1000万张图像,约有100,000个人,据称是同类数据库中最大的。它只应该包含名人,但据一位研究人员的照片,“新闻工作者,艺术家,音乐家,激进主义者,政策制定者,作家和学者”也已存储在数据库中。
可以根据知识共享许可从互联网上提取此类图像,这意味着人们可能最终不知道该数据库。看来中国是最充分利用这些图像的国家。
中国科技公司SenseTime和Megvii都使用了该数据库。据《纽约时报》报道,这两家公司都向中国政府提供了面部识别技术。该报告指出,政府已使用该软件监视少数民族。
可以说,对于微软公司来说,这不是一个好看的公司,该公司直言不讳地将面部识别技术用于监视方面。该公司在四月份表示,由于担心它可能侵犯人权,拒绝了与美国执法部门共享面部识别技术的机会。
微软在向英国《金融时报》发表的一份声明中说:“该网站旨在用于学术目的。” “它是由一个不再与微软合作的员工经营的,此后已被撤职。”
该报告中的一位记者说,他不满意将其包含在数据集中,他说:“微软无法让自己的研究人员保持诚实和正直,因为这在离开大楼之前并未遭到鱼雷袭击。”
微软补充说,数据集一旦“挑战结束”就被删除,尽管它还没有完全消除。
“尽管msceleb.org网站最近终止了,但是该数据集仍然存在于GitHub上的数个存储库中,这是无数研究人员的硬盘驱动器,并且很可能会继续用于世界各地的研究项目中,”位于柏林的研究员Adam Harvey作为他的项目MegaPixels的一部分写的。该项目清楚地概述了使用该项目的人员,并给出了使用其图像的人员的姓名。