您现在的位置是:首页 >要闻 > 2020-12-09 08:41:45 来源:
研究人员设计出减少计算机视觉数据集中偏差的方法
导读 为了解决人工智能中的偏见问题,普林斯顿大学和斯坦福大学的计算机科学家已经开发出方法来获取包含人的图像的更公平的数据集。研究人员提出
为了解决人工智能中的偏见问题,普林斯顿大学和斯坦福大学的计算机科学家已经开发出方法来获取包含人的图像的更公平的数据集。研究人员提出了对ImageNet的改进,ImageNet是一个包含1400万张图像的数据库,在过去十年中,它在推进计算机视觉方面发挥了关键作用。
ImageNet包含对象,风景以及人物的图像,可作为培训数据的来源,供研究人员创建机器学习算法以对图像进行分类或识别其中的元素。ImageNet规模空前,需要自动图像收集和众包图像注释。尽管研究团体很少使用数据库的人员类别,但是ImageNet团队一直在努力解决偏见和其他有关图像的担忧,这些图像所包含的图像是ImageNet构造的意外结果。
普林斯顿大学计算机科学助理教授Olga Russakovsky说:“计算机视觉现在真的很好用,这意味着它已在各种环境中遍及整个地方。” “这意味着现在是时候谈论它对世界产生什么样的影响并思考这些公平问题了。”
在一篇新论文中,ImageNet团队系统地识别了ImageNet的人员类别中的非视觉概念和令人讨厌的类别,例如种族和性别特征,并建议将其从数据库中删除。研究人员还设计了一种工具,该工具允许用户指定和检索按年龄,性别表达或肤色平衡的人的图像集,其目的是促进更公平地对人的脸部和活动进行图像分类的算法。研究人员于1月30日在西班牙巴塞罗那举行的计算机协会关于公平性,问责制和透明度的会议上介绍了他们的工作。
Russakovsky说:“非常需要具有核心技术专长的研究人员和实验室来进行此类对话。” “鉴于现实,我们需要大规模收集数据,因为这将是最有效,最完善的管道,因此需要通过众包来完成,我们该如何以更公平的方式做到这一点呢?会陷入这些先验陷阱吗?本文的核心信息是关于建设性的解决方案。”