您现在的位置是：首页 >要闻 > 2020-12-09 15:05:43 来源：

人工智能学习技术可以说明大脑奖励路径的功能

导读来自DeepMind，大学学院和哈佛大学的一组研究人员发现，将学习技术应用于AI系统的经验教训可能有助于解释奖励途径如何在大脑中发挥作用。该

来自DeepMind，大学学院和哈佛大学的一组研究人员发现，将学习技术应用于AI系统的经验教训可能有助于解释奖励途径如何在大脑中发挥作用。该小组在《自然》杂志上发表的论文中描述了将计算机中的分布强化学习与小鼠大脑中的多巴胺处理进行比较，以及他们从中学到的知识。

先前的研究表明，大脑中产生的多巴胺与奖励过程有关，多巴胺是在发生好事时产生的，其表达会带来愉悦的感觉。一些研究还表明，大脑中对多巴胺的存在做出反应的神经元都以相同的方式做出反应-事件会使人或小鼠感觉好坏。其他研究表明，神经元反应更多是一个梯度。在这项新工作中，研究人员发现了支持后一种理论的证据。

分布式强化学习是一种基于强化的机器学习。在设计诸如Starcraft II或Go之类的游戏时，经常使用它。它会跟踪好动作与坏动作之间的关系，并学会减少坏动作的数量，并发挥更多的性能。但是，这样的系统不会对所有好的和坏的动作都一视同仁-每个动作在记录时都经过加权，权重是做出未来动作选择时所使用的计算的一部分。

研究人员指出，人类似乎也使用类似的策略来提高他们的游戏水平。伦敦的研究人员怀疑，人工智能系统与大脑进行奖励处理的方式之间的相似性也可能相似。为了找出它们是否正确，他们对小鼠进行了实验。他们将能够插入单个多巴胺神经元反应的设备插入大脑。然后，对小鼠进行培训以执行一项任务，在这些任务中，它们会以期望的方式获得奖励。

小鼠神经元反应表明，它们并非都像先前理论所预测的那样以相同的方式反应。取而代之的是，他们以可靠的不同方式做出了反应，这表明小鼠所体验到的快乐程度更多地是一种梯度，正如该团队所预测的那样。

免责声明：本文由用户上传，如有侵权请联系删除！

标签：人工智能学习技术

上一篇:AlphaFold在预测蛋白质结构中脱颖而出

下一篇:类脑网络使用障碍来检测秩序

猜你喜欢

定州市2021年度耕地轮作工作实施方案（关于定州市2021年度耕地轮作工作实施方案介绍）

定州宇飞电子科技有限公司（关于定州宇飞电子科技有限公司介绍）

定州天鹭新能源有限公司（关于定州天鹭新能源有限公司介绍）

定州城墙（关于定州城墙介绍）

定州四方诚信畜牧科技有限公司（关于定州四方诚信畜牧科技有限公司介绍）

定州咏古（关于定州咏古介绍）

定州南城门（关于定州南城门介绍）

定州北疃烈士陵园（关于定州北疃烈士陵园介绍）

定州冠农农业科技有限公司（关于定州冠农农业科技有限公司介绍）

定州八景（关于定州八景介绍）

定州供销商贸有限公司（关于定州供销商贸有限公司介绍）

定州佰仕达塑料制品有限公司（关于定州佰仕达塑料制品有限公司介绍）

定州人物志（关于定州人物志介绍）

10分钟被AI骗走430万

快手2023年第一季度营收252点2亿元

木仓科技宣布驾考智能模拟器发布

最新文章

掠夺尼罗河——埃及的盗墓贼和考古学家（关于掠夺尼罗河——埃及的盗墓贼和考古学家简介）

开元九龙湖畔（关于开元九龙湖畔介绍）

崔仁荷（关于崔仁荷简介）

怎样进行建筑装饰装修工程施工（关于怎样进行建筑装饰装修工程施工介绍）

定州市2021年度耕地轮作工作实施方案（关于定州市2021年度耕地轮作工作实施方案介绍）

掠夺型政府（关于掠夺型政府简介）

怎样进行建工电气施工-工程建设十万个怎么办（关于怎样进行建工电气施工-工程建设十万个怎么办介绍）

定州宇飞电子科技有限公司（关于定州宇飞电子科技有限公司介绍）

建筑工程制图习题集（关于建筑工程制图习题集介绍）

来电显示是什么（了解一下）

三个臭皮匠赛过诸葛亮的意思是什么（三个臭皮匠赛过诸葛亮具体含义）

桦可以组什么词语（桦可以组哪些词语）

定州天鹭新能源有限公司（关于定州天鹭新能源有限公司介绍）

建筑工程制图习题集第四版（关于建筑工程制图习题集第四版介绍）

掠夺兽（关于掠夺兽简介）

怎样进行工程项目质量管理（关于怎样进行工程项目质量管理介绍）

点击排行

热门推荐

随机推荐