关键词不能为空

位置:好奇号 > 科学 > 人工智能预测蛋白质结构,它是怎样做到的?

人工智能预测蛋白质结构,它是怎样做到的?

作者:admin
来源:好奇号
日期:2020-12-23 13:54:15
阅读:
 

 
       所有生物体都含有很多蛋白质,因为它们是生命活动必需的有机大分子。以人类为例,蛋白质的总量占到人体重量的16%~20%——一名60千克重的成年人体内,蛋白质为9.6~12千克。
 
       在细胞里,大部分工作其实都是由蛋白质完成的,包括运载物质、为细胞把守细胞膜上的通道、促进细胞内的生物化学反应……所以,不管是数量上,还是功能上,蛋白质都是生命活动不可缺少的分子——人体内存在多种多样的蛋白质分子,不同的蛋白质执行着不同的任务,从而让生命活动能够持续下去。
 
       而且,蛋白质的功能和它们的结构密切相关。一旦某个蛋白质发生变异,或者出现故障,导致结构发生变化,这种蛋白质就无法完成自己的任务,生命活动就可能受到影响,疾病就会发生。有一个科学领域叫做“结构生物学”,专门研究蛋白质之类的生物大分子的结构,弄清楚生物分子的结构与功能之间的关系,进而为病理机制的研究、药物的研发提供科学基础。
 
       但是,要研究蛋白质的结构并不容易,因为它们虽然是生物“大分子”,但这只是相对较大。蛋白质的尺寸通常只有几纳米到几十纳米,需要借助先进的电子显微镜才能观察到它们是什么样子。
 
       而且,蛋白质在本质上是一条氨基酸链(由多种不同的氨基酸组成),氨基酸链要经过多次折叠,形成特定的三维结构之后,才具有特定的功能。正是因为蛋白质是一种三维结构,所以有时候即便使用电子显微镜,也只能看到蛋白质分子表面的情况,这就是结构生物学研究所要面临的难题。
 
       人工智能技术或许可以帮助生物学家更好地研究蛋白质的结构。2018年,曾经推出 AlphaGo,打败多位世界级围棋选手的DeepMind公司又推出了一款名为AlphaFold的人工智能程序,它的任务就是根据基因序列来预测蛋白质的结构。
 
       在理论上,这是可行的,因为基因序列决定了氨基酸链的组成,而氨基酸链的组成最终决定了蛋白质的结构。但在实际研究中,预测蛋白质结构是极其困难的任务,因为大部分蛋白质都由很多氨基酸组成,每个氨基酸的化学性质都会影响最终的折叠结果。如果要把所有影响因素都考虑进去,那将是极其庞大的计算量。
 
       尽管很难,但DeepMind公司一直在推进相关研究,并终于在最近取得了突破。在2020 年的国际蛋白质结构预测竞赛(CASP)中,AlphaFold预测了多种蛋白质的结构。对于
AlphaFold预测的近100个蛋白质分子的结构,科学家进行了检测,结果发现2/3的预测结果都与通过实验手段获得的结果相差无几,这让科学家感到非常震惊。
 
       国际蛋白质结构预测竞赛的创办者之一约翰·莫尔特(John Moult)教授表示,对于某些预测结果和实验结果不相符的情况,他们甚至无法确定这是AlphaFold的预测出现错误,还是实验结果存在误差。
 
       AlphaFold的最新表现意味着,随着人工智能技术的不断进步,它不仅能让我们的生活更便捷,还能帮助科学家更好地开展研究。
 

    相关推荐

    《好奇号》2020年第2期
    关注我们
    • 微信公众号

    • 官方微博