一种新的人工智能工具可以根据酶的氨基酸序列预测酶的功能,即使酶未经研究或知之甚少。研究人员表示,被称为CLEAN的AI工具在准确性,可靠性和灵敏度方面优于领先的先进工具。更好地了解酶及其功能将为基因组学、化学、工业材料、医学、制药等领域的研究带来福音。
“就像ChatGPT使用来自书面语言的数据来创建预测文本一样,我们正在利用蛋白质的语言来预测它们的活性,”研究负责人,伊利诺伊大学厄巴纳 - 香槟分校化学和生物分子工程教授Huimin Zhao说。“几乎每个研究人员在处理新的蛋白质序列时,都希望立即知道蛋白质的作用。此外,在为任何应用(生物学,医学,工业)制造化学品时,该工具将帮助研究人员快速识别合成化学品和材料所需的适当酶。
(资料图片仅供参考)
研究人员将在《科学》杂志上发表他们的发现,并于31月<>日在线提供CLEAN。
随着基因组学的进步,许多酶已被鉴定和测序,但科学家们对这些酶的作用知之甚少或根本没有信息,伊利诺伊州Carl R. Woese基因组生物学研究所的成员赵说。
其他计算工具试图预测酶的功能。通常,他们试图通过比较查询序列与已知酶目录并找到相似的序列来分配酶委员会编号 - 指示酶催化反应类型的ID代码。然而,这些工具不适用于研究较少或未表征的酶,或执行多种工作的酶,赵说。
“我们不是第一个使用人工智能工具来预测酶佣金数字的人,但我们是第一个使用这种称为对比学习的新深度学习算法来预测酶功能的人。我们发现这种算法比其他人使用的人工智能工具要好得多,“赵说。“我们不能保证每个人的产品都能被正确预测,但我们可以获得比其他两种或另外三种方法更高的准确性。
研究人员通过计算和体外实验通过实验验证了他们的工具。他们发现,该工具不仅可以预测以前未表征的酶的功能,还可以纠正被领先软件错误标记的酶,并正确识别具有两种或多种功能的酶。
赵的小组正在为其他寻求表征酶或确定酶是否可以催化所需反应的研究人员在线访问CLEAN。
“我们希望这个工具将被广泛的研究界广泛使用,”赵说。“通过网络界面,研究人员只需在搜索框中输入序列,就像搜索引擎一样,然后查看结果。
赵说,该小组计划扩展CLEAN背后的人工智能,以表征其他蛋白质,例如结合蛋白。该团队还希望进一步开发机器学习算法,以便用户可以搜索所需的反应,并且AI将为这项工作指出适当的酶。
“有很多未表征的结合蛋白,如受体和转录因子。我们也想预测它们的功能,“赵说。“我们希望预测所有蛋白质的功能,以便我们能够了解细胞具有的所有蛋白质,并更好地研究或设计整个细胞用于生物技术或生物医学应用。
赵还是加州大学伊利诺伊医学院生物工程、化学、生物医学和转化科学教授。
这篇论文的标题是“使用对比学习的酶功能预测”。
X 关闭
Copyright © 2015-2022 亚洲五金网版权所有 备案号:豫ICP备20022870号-9 联系邮箱:553 138 779@qq.com