“阿尔法折叠2”实现开源

 

它代表着科学家将广泛使用能精确测定蛋白质3D形状的软件。7月16日,总部位于英国伦敦的DeepMind公司发布了其深度学习神经网络AlphaFold 2的开源版本,并在《自然》杂志的一篇论文中描述了其方法。

理解蛋白质的结构有助于确定蛋白质的功能,了解各种突变的作用。截至目前,约有10万个蛋白质的结构已经用实验方法得到了解析,但这在已经测序的数10亿计的蛋白质中只占了很小一部分。在50多年的时间里,研究人员一直尝试根据蛋白质的氨基酸序列预测其折叠而成的三维结构。然而,当前使用的计算方法准确度有限,实验方法对人力和时间的要求也非常高。

英国,伦敦深度思维(DeepMind)公司的John Jumper、Demis Hassabis和同事描述了AlphaFold2,这是一个基于神经网络的新模型,其预测的蛋白质结构能达到原子水平的准确度,作者称该方法达到了“前所未有的准确度”。

去年5至7月,Jumper等在举办在第14届“蛋白质结构预测关键评估”(CASP14)大赛中验证了这种方法。该比赛要求参赛团队根据蛋白质的氨基酸序列解析它们的结构。比赛用的蛋白质会先用实验方法解析出来,但具体结果不会公开。

比赛中,AlphaFold2预测的大部分结构达到了空前的准确度,不仅与实验方法不相上下,还远超解析新蛋白质结构的其他方法。将实验方法得到的蛋白质结构叠加在AlphaFold2的结构上,组成蛋白质主链骨架的叠加原子之间的距离中位数(95%的覆盖率)为0.96埃(0.096纳米)。成绩排第二的方法只能达到2.8埃的准确度。

AlphaFold2的神经网络能在几分钟内预测出一个典型蛋白质的结构,还能预测较大蛋白质(比如一个含有2180个氨基酸、无同源结构的蛋白质)的结构。该模型能根据每个氨基酸对其预测可靠性进行精确预估,方便研究人员使用其预测结果。

作者认为,这一精准的预测算法可以让蛋白质结构解析技术跟上基因组革命的发展步伐。

DeepMind创始人兼首席执行官Demis Hassabis表示,去年该公司在CASP14大会上揭晓了将蛋白质3D结构预测精确到原子水平的全新AlphaFold系统后,承诺将分享其方法,为科学共同体提供广泛、免费的获取途径。

“今天我们迈出了承诺的第一步。”Hassabis说,“我们期待看到它会启发出什么样的其他新方法,也期待很快能和大家分享更多我们的新进展。”

机器学习软件预测的人类白细胞介素-12蛋白与其受体结合的结构。图片来源:Ian Haydon,华盛顿大学蛋白质设计医学研究所

相关文章链接:

https://doi.org/10.1038/s41586-021-03819-2