您现在的位置是:首页 >人工智能 > 2022-04-27 15:50:06 来源:

人工智能技术缩小到只提出可以在实验室生产的候选分子

导读 制药公司正在使用人工智能来简化发现新药的过程。机器学习模型可以提出具有特定特性的新分子,这些分子可以对抗某些疾病,在几分钟内完成人

制药公司正在使用人工智能来简化发现新药的过程。机器学习模型可以提出具有特定特性的新分子,这些分子可以对抗某些疾病,在几分钟内完成人类可能需要几个月才能手动完成的工作。

但是有一个主要障碍阻碍了这些系统的发展:这些模型通常会提出在实验室中难以或不可能生产的新分子结构。如果化学家实际上不能制造这种分子,则无法测试其抗病特性。

麻省理工学院研究人员的一种新方法限制了机器学习模型,因此它只建议可以合成的分子结构。该方法保证分子由可以购买的材料组成,并且这些材料之间发生的化学反应遵循化学定律。

与其他方法相比,他们的模型提出的分子结构在流行的评估中得分很高,有时甚至更好,但保证可合成。他们的系统还需要不到一秒钟的时间来提出合成途径,而其他单独提出分子然后评估其可合成性的方法可能需要几分钟。在包含数十亿潜在分子的搜索空间中,这些时间节省加起来。

“这个过程重新制定了我们如何要求这些模型生成新的分子结构。其中许多模型考虑的是逐个原子或逐个键地构建新的分子结构。相反,我们正在逐个构建新的分子构建块,并通过反应构建新的分子,”康纳·科利(ConnorColey)说,他是麻省理工学院化学工程、电气工程和计算机科学系的HenriSlezynger职业发展助理教授,也是该论文的高级作者。

加入Coley的还有第一作者、研究生高文豪和博士后RocíoMercado。这项研究将于本周在国际学习代表大会上发表。

建筑模块

为了创建分子结构,该模型模拟了合成分子的过程,以确保它可以被生产出来。

该模型给出了一组可行的构建块,它们是可以购买的化学品,以及可以使用的有效化学反应列表。这些化学反应模板由专家手工制作。通过只允许某些化学物质或特定反应来控制这些输入,研究人员可以限制新分子的搜索空间有多大。

该模型使用这些输入来构建一棵树,方法是选择构建块并通过化学反应将它们连接起来,一次一个,构建最终的分子。在每个步骤中,随着添加额外的化学物质和反应,分子会变得更加复杂。

它输出最终的分子结构以及合成它的化学和反应树。

“我们不是直接设计产品分子本身,而是设计一个动作序列来获得该分子。这使我们能够保证结构的质量,”高说。

为了训练他们的模型,研究人员输入了完整的分子结构和一组构建块和化学反应,模型学习创建合成分子的树。在查看了数十万个示例后,该模型学会了自己提出这些合成路径。

分子优化

训练后的模型可用于优化。研究人员定义了他们希望在最终分子中实现的某些特性,给定某些构建块和化学反应模板,并且该模型提出了可合成的分子结构。

“令人惊讶的是,您可以使用如此小的模板集实际复制大部分分子。您不需要那么多构建块来生成大量可用的化学空间供模型搜索,”Mercado说。

他们通过评估模型重建可合成分子的能力来测试该模型。它能够复制51%的这些分子,并且只需不到一秒钟的时间就可以复制每个分子。

他们的技术比其他一些方法更快,因为模型没有搜索树中每个步骤的所有选项。高解释说,它有一套明确的化学物质和反应可供使用。

当他们使用他们的模型提出具有特定性质的分子时,他们的方法提出了更高质量的分子结构,这些分子结构比其他方法具有更强的结合亲和力。这意味着这些分子将能够更好地附着在蛋白质上并阻止某种活动,例如阻止病毒复制。

例如,当提出一种可以与SARS-Cov-2对接的分子时,他们的模型提出了几种分子结构,这些分子结构可能比现有的抑制剂更能与病毒蛋白结合。然而,正如作者承认的那样,这些只是计算预测。

“有很多疾病需要解决,”高说。“我希望我们的方法可以加速这一过程,这样我们就不必每次都针对疾病目标筛选数十亿个分子。相反,我们可以指定我们想要的特性,它可以加速寻找候选药物的过程。"

他们的模型还可以改善现有的药物发现管道。Mercado说,如果一家公司已经确定了一种具有所需特性但无法生产的特定分子,他们可以使用该模型来提出与其非常相似的可合成分子。

现在他们已经验证了他们的方法,该团队计划继续改进化学反应模板,以进一步提高模型的性能。借助额外的模板,他们可以对某些疾病目标进行更多测试,并最终将模型应用于药物发现过程。

“理想情况下,我们需要能够自动设计分子并同时快速为我们提供合成树的算法,”微软剑桥研究院(英国)领导一个致力于药物发现机器学习的团队的MarwinSegler说。参与了这项工作。“Coley教授和团队的这种优雅方法是解决这个问题的重要一步。虽然早期有通过合成树生成进行分子设计的概念验证工作,但这个团队确实做到了。这是第一次,他们在有意义的规模上展示了出色的性能,因此它可以对计算机辅助分子发现产生实际影响。

这项工作也非常令人兴奋,因为它最终可以为计算机辅助合成规划提供新的范式。这可能会对该领域的未来研究产生巨大的启发。”