您现在的位置是:首页 >要闻 > 2020-12-04 08:19:29 来源:

神经科学家找到一种使对象识别模型表现更好的方法

导读 可以训练称为卷积神经网络的计算机视觉模型来识别与人类几乎一样准确的物体。但是,这些模型有一个重大缺陷:图像的很小变化几乎不会被人类

可以训练称为卷积神经网络的计算机视觉模型来识别与人类几乎一样准确的物体。但是,这些模型有一个重大缺陷:图像的很小变化几乎不会被人类观看者察觉,会诱使他们做出严重错误,例如将猫分类为树。

麻省理工学院,哈佛大学和IBM的神经科学家团队开发了一种缓解此漏洞的方法,方法是在这些模型中添加一个新层,该层旨在模拟大脑视觉处理系统的最早阶段。在一项新的研究中,他们表明,该层大大提高了模型针对此类错误的鲁棒性。

麻省理工学院的博士后,一位科学家该研究的主要作者。

卷积神经网络通常用于人工智能应用中,例如自动驾驶汽车,自动装配线和医疗诊断。哈佛大学研究生乔尔·达佩罗(Joel Dapello)也是该研究的主要作者,并补充说:“实施我们的新方法可能使这些系统更不容易出错,更符合人类视觉。”

詹姆士·迪卡洛(James DiCarlo)说:“根据定义,关于大脑视觉系统如何运作的良好科学假设应该使大脑在内部神经模式和非凡的健壮性方面都与大脑相匹配。这项研究表明,获得这些科学收益直接导致了工程和应用收益。” ,麻省理工学院脑与认知科学系主任,大脑,思维与机器中心和麦戈文脑科学研究所的研究员,以及该研究的高级作者。

这项研究将在本月的NeurIPS会议上进行介绍,它也是由MIT研究生Martin Schrimpf,MIT来访学生Franziska Geiger和MIT-IBM Watson AI实验室主任David Cox共同撰写的。

识别对象是视觉系统的主要功能之一。在短短一秒钟的时间内,视觉信息就通过腹侧视觉流流到大脑下颞叶皮层,在此大脑神经元包含对物体进行分类所需的信息。在腹侧流的每个阶段,大脑执行不同类型的处理。腹侧流的第一个阶段V1是大脑中最有特色的部分之一,其中包含对简单的视觉特征(例如边缘)做出反应的神经元。