您现在的位置是：首页 >要闻 > 2020-11-30 15:03:38 来源：

通过学习音乐家的肢体语言来识别旋律

导读我们用耳朵听音乐，也用眼睛听音乐，欣赏钢琴演奏者的手指在琴键上飞舞，小提琴演奏者的弓弦越过琴弦。当耳朵无法分辨两种乐器时，眼睛通常

我们用耳朵听音乐，也用眼睛听音乐，欣赏钢琴演奏者的手指在琴键上飞舞，小提琴演奏者的弓弦越过琴弦。当耳朵无法分辨两种乐器时，眼睛通常会通过将每个乐手的动作与每个声部的节拍相匹配来进行调整。

MIT-IBM Watson AI Lab开发的一种新的人工智能工具利用计算机的虚拟眼睛和耳朵来分离相似的声音，这些声音即使对于人类也很难区分。该工具通过将各个音乐家的动作(通过其骨骼关键点)与各个部分的速度进行匹配来改进早期迭代，从而使听众可以在多个长笛或小提琴中隔离单个长笛或小提琴。

这项工作的潜在应用范围包括混音，增加录音中的乐器音量，以及减少导致人们在视频会议通话中互相交谈的混乱情况。这项工作将在本月的虚拟计算机视觉模式识别会议上进行介绍。

该研究的主要作者，该实验室的IBM研究人员Chuang Gan说：“人体关键点提供了强大的结构信息。” “我们在这里使用它来提高AI收听和分离声音的能力。”

在这个项目以及其他类似项目中，研究人员已经利用同步音视频轨道来重现人类的学习方式。通过多种感觉模式学习的AI系统可能能够以更少的数据更快地学习，而无需人类为每个现实世界的表示添加讨厌的标签。麻省理工学院教授，该研究的共同资深作者安东尼奥·托拉尔巴(Antonio Torralba)说：“我们从所有的感官中学习。“多传感器处理是可以执行更复杂任务的嵌入式智能和AI系统的先驱。”

免责声明：本文由用户上传，如有侵权请联系删除！

标签：肢体语言识别旋律

上一篇:计算模型通过预测对语音进行解码

下一篇:EPFL实验室开发设计低功耗电路的方法

猜你喜欢

定州城墙（关于定州城墙介绍）

定州四方诚信畜牧科技有限公司（关于定州四方诚信畜牧科技有限公司介绍）

定州咏古（关于定州咏古介绍）

定州南城门（关于定州南城门介绍）

定州北疃烈士陵园（关于定州北疃烈士陵园介绍）

定州冠农农业科技有限公司（关于定州冠农农业科技有限公司介绍）

定州八景（关于定州八景介绍）

定州供销商贸有限公司（关于定州供销商贸有限公司介绍）

定州佰仕达塑料制品有限公司（关于定州佰仕达塑料制品有限公司介绍）

定州人物志（关于定州人物志介绍）

10分钟被AI骗走430万

快手2023年第一季度营收252点2亿元

木仓科技宣布驾考智能模拟器发布

定州中山公园（关于定州中山公园介绍）

锚定本源柔韧生长

Meta被欧盟罚款13亿美元

最新文章

崔亚君（关于崔亚君简介）

怎样进行工程项目合同管理（关于怎样进行工程项目合同管理介绍）

掠夺倾国色（关于掠夺倾国色简介）

定州城墙（关于定州城墙介绍）

建筑工程制图习题集第五版（关于建筑工程制图习题集第五版介绍）

怎样进行党性修养和党性分析（关于怎样进行党性修养和党性分析介绍）

建筑工程制图习题集第6版（关于建筑工程制图习题集第6版介绍）

掠夺你（关于掠夺你简介）

崔亚军（关于崔亚军简介）

步步惊心玉檀怎么死的（步步惊心简介）

胡萝卜须歌词（歌手简介）

崔亚允（关于崔亚允简介）

掠夺之斧（关于掠夺之斧简介）

怎样进行党性修养与党性分析（关于怎样进行党性修养与党性分析介绍）

建筑工程制图习题集第3版（关于建筑工程制图习题集第3版介绍）

什么是渣油（渣油的解释）

点击排行

热门推荐

随机推荐