您现在的位置是:首页 >要闻 > 2020-12-09 15:21:30 来源:
深度学习有助于弄清基因相互作用
卡内基梅隆大学计算机科学家采用了一种深度学习方法,近年来彻底改变了人脸识别和其他基于图像的应用程序,并将其功能重新定向到探索基因之间的关系。
他们说,诀窍在于将大量的基因表达数据转换成更像图像的东西。善于分析视觉图像的卷积神经网络(CNN)随后可以推断出哪些基因正在相互作用。CNN在此任务上的表现优于现有方法。
研究人员关于CNN如何帮助鉴定与疾病相关的基因以及可能成为药物靶标的发育和遗传途径的报告今天在《国家科学院院刊》上发表。但是计算生物学和机器学习教授Ziv Bar-Joseph表示,这种名为CNNC的新方法的应用范围可能远远超出基因相互作用。
与博士后Ye Yuan共同撰写论文的Bar-Joseph说,论文中描述的新见解表明,CNNC可以类似地用于调查包括财务数据和社交网络在内的各种现象的因果关系。CMU机器学习系研究员。
Bar-Joseph说:“十年前开发的CNN具有革命性意义。” 当他在智能手机上滚动浏览照片时,他补充说:“我仍然对使用谷歌照片进行面部识别感到敬畏。”他展示了该应用程序如何识别不同年龄的儿子,或根据图像识别父亲头部右后方 “我们有时会把这项技术视为理所当然的,因为我们一直在使用它。但是它功能强大,而且不仅限于图像。这完全取决于您如何表示数据。”
在这种情况下,他和袁正在研究基因关系。人类中大约有20,000个基因协同工作,因此有必要知道基因如何在复合体或网络中协同工作以了解人类的发育或疾病。
推断这些关系的一种方法是查看基因表达,它表示细胞中基因的活性水平。通常,如果基因A同时激活,则基因B激活,这就是两者相互作用的线索。不过,这可能是巧合,或者两者都被第三个基因C激活。已经开发出了几种先前的方法来弄清这些关系。
为了利用CNN来帮助分析基因关系,Yuan和Bar-Joseph使用了单细胞表达数据,这些实验可以确定单个细胞中每个基因的水平。然后,以矩阵或直方图的形式排列数十万个这些单细胞分析的结果,以使矩阵的每个细胞代表一对基因的不同共表达水平。
以这种方式呈现数据增加了空间方面,这使得数据更像图像,因此CNN更易于访问。通过使用来自已经建立了相互作用的基因的数据,研究人员能够训练CNN识别哪些基因在相互作用,哪些不是基于数据矩阵中的视觉模式。
Yuan说:“很难区分因果关系和相关性,”但是CNNC方法在统计学上比现有方法更准确。他和Bar-Joseph期望CNNC将成为研究人员最终将用于分析大型数据集的几种技术之一。
Bar-Joseph说:“这是一种非常通用的方法,可以应用于许多分析。” 主要限制是数据-数据越多,CNN的工作效果越好。细胞生物学非常适合使用CNNC,因为典型的实验可能涉及成千上万个细胞并产生大量数据。