您现在的位置是:首页 >要闻 > 2020-12-02 17:11:10 来源:

基于大规模数据集的图像识别新方法

导读 中国科学院深圳先进技术研究院(SIAT)的研究人员提出了一种具有指导性学习和噪声监控功能的产品图像识别方法。该研究发表在《计算机视觉与图

中国科学院深圳先进技术研究院(SIAT)的研究人员提出了一种具有指导性学习和噪声监控功能的产品图像识别方法。该研究发表在《计算机视觉与图像理解》上。

该团队没有通过费力且费时的图像捕获来收集产品图像,而是引入了一个称为Product-90的新型大规模数据集。该数据集包含超过90万个类别的140K图像,与Clothing1M(旨在在人为监督下从嘈杂数据中学习的大规模公共数据集)相关,但包含更多类别。图片是从电子商务网站上的评论中收集的。

为了避免产生不相关的图像,研究人员进一步开发了一种简单而有效的指导学习(GL)方法,用于在嘈杂的监督下训练卷积神经网络(CNN)。

他们使用此建议的指导学习方法对Product-90和四个公共数据集(即Food101,Food-101N,Cression1M和合成噪声CIFAR-10)进行了综合评估。

在第一阶段,他们在完整的Product-90数据集(没有干净的测试集)上训练了基线CNN模型(教师模型)。在第二阶段,他们通过多任务学习在大型噪声集和小型干净训练集上训练了目标网络(学生网络)。

结果表明,该建议的指导学习方法更有效,更简单,并且在这些数据集上取得了优于最新方法的性能。