>首页> IT >

环球今日讯!DeepMind预测出地球上几乎所有蛋白质结构,数字生物学迎来全新时代

时间:2022-07-29 08:48:50       来源:腾讯网

腾讯科技讯 7月29日消息,谷歌母公司Alphabet旗下人工智能(AI)公司DeepMind在短短18个月内预测了科学界已知几乎所有蛋白质的结构,从而改变了生物学。这一突破将有助于加快药物开发,并彻底改变基础科学。

根据蛋白质组成氨基酸的序列来确定蛋白质的折叠形状,这是几十年来生物学中始终存在的一大难题。这些氨基酸中,有些会相互吸引,有些会被水排斥,这些链形成了复杂的形状,很难准确地预测。


(资料图片仅供参考)

然而借助名为AlphaFold的人工智能,DeepMind仅用了18个月就预测了迄今为止几乎已知的所有蛋白质结构。研究人员表示,这项工作已经在抗击疟疾、抗生素耐药性和塑料垃圾方面取得了进展,并可能加快新药物的发现。

总部位于英国的DeepMind在2020年底首次宣布,它已经开发了一种准确预测折叠蛋白质结构的方法。到2021年中期,该公司透露其已经确认人体中所含98.5%的蛋白质。现在,该公司宣布将公布超过2亿种蛋白质的结构,几乎所有这些蛋白质都在全球公认的蛋白质研究库UniProt中。

DeepMind与欧洲分子生物学实验室下属欧洲生物信息学研究所(EMBL-EBI)合作,创建了有关所有这些信息的可搜索数据库,世界各地的研究人员可以轻松自由地访问这些信息。EMBL-EBI的欧文·伯尔尼(Ewan Birney)称,AlphaFold蛋白质结构数据库是“送给人类的礼物”。

他说“作为一个自上世纪90年代以来始终从事基因组学和计算生物学研究的人,我看到过很多这样的时刻,你可以感觉到这些领域正在发生的变化,新的资源正在出现,而这是最快的时刻之一。我的意思是,两年前,我们根本没有意识到这样做是可行的。”

已经取得的成果

DeepMind首席执行官德米斯·哈萨比斯(Demis Hassabis)表示,AlphaFold蛋白质结构数据库使寻找蛋白质结构变得“几乎和搜索谷歌一样简单”,而在此之前,确定蛋白质结构往往需要数年时间。

这些数据已经被科学家用来推进许多领域的研究。牛津大学的马特·希金斯(Matt Higgins)和他的同事正在研究一种蛋白质,他们认为这种蛋白质是中断疟原虫生命周期的关键,但他们却难以绘制其结构。

希金斯说:“我们使用的实验方法之一是X射线晶体学。我们使蛋白质形成晶格,向它们发射X射线,从这些X射线衍射模式中获得信息,看看分子到底是什么样的。但是,尽管经过多年的研究,我们始终未能充分了解这个分子的详细情况。”

但当AlphaFold发布时,它给出了与研究人员收集到的信息相匹配的蛋白质结构明确预测。他们现在已经能够设计出新的蛋白质,他们希望这种蛋白质可以作为一种有效的疟疾疫苗。

伯尔尼说,使用X射线晶体学来绘制蛋白质的结构既昂贵又耗时。他称“这意味着实验人员必须对他们要做的事情做出选择,而AlphaFold不必做出选择。我认为,AlphaFold将带来新的实验和新的见解。例如,它将帮助弄清楚‘特定寄生虫如何传染疾病’或‘特定的疾病为什么会发生在人类身上’。”

研究人员还利用AlphaFold设计了新的酶来分解塑料垃圾,并了解更多使细菌对抗生素产生耐药性的蛋白质。

还有更多工作要做

伦敦帝国理工学院的基斯·威尔逊(Keith Willison)说,AlphaFold无可争议地“改变了生物学研究领域”,但在蛋白质折叠方面仍有许多问题有待解决。

他解释称:“AlphaFold一问世就非常棒。现在你只需要把最喜欢的蛋白质拿出来查一查,而不需要制造晶体。我做了蛋白质复合物的晶体结构,这花了我大约8年的时间。人们开玩笑说晶体学家要失业了。”

但是,威尔逊指出,AlphaFold无法选取任意一串氨基酸,并精确地模拟它们的折叠方式。相反,它只能利用部分蛋白质及其结构通过实验来预测新蛋白质的折叠方式。

虽然这个工具经常甚至通常是非常准确的,但毕竟它的结果来自预测,而不是明确的计算。AlphaFold还没有解决蛋白质之间的复杂相互作用,甚至没有在被称为”内在无序蛋白质“的结构子集上取得进展,这些结构似乎具有不稳定和不可预测的折叠模式。

威尔逊说:“一旦你发现了一件事,就会出现更多的问题。事实上,生物学是如此复杂,这非常可怕。”

伦敦大学学院的托梅克·沃达斯基(Tomek Wlodarski)说,AlphaFold已经对生物学的许多领域产生了巨大影响,但在准确性方面还有待改进,而且开发蛋白质如何折叠的模型也是DeepMind尚未解决的问题。AlphaFold并非是完美无暇的,尽管它确实表明了其预测的准确性。

沃达斯基称“我们引入了一种突变,我们知道这种突变可以在实验中完全展开蛋白质,但AlphaFold给了我与没有发生突变的结构相同的结果。我做了另一个测试:我去除了蛋白质一端的残基,因为我们知道,对于我们的蛋白质,如果你从一端砍下九个残基,它就会完全展开蛋白质。我设法砍掉了蛋白质序列的一半,算法仍然预测它是个完全折叠的蛋白质,具有完全相同的结构。所以就有了这些问题。”

DeepMind科学团队的负责人普什米特·科利(Pushmeet Kohli)表示,该公司还没有完成对蛋白质的研究,正在努力提高AlphaFold的准确性和能力。

他说:“我们知道蛋白质的静态结构,但这并不是最终目标。我们想要了解这些蛋白质的行为方式,它们的动力学是什么,它们如何与其他蛋白质相互作用。然后还有基因组学的另一个领域,即我们想了解生命的配方如何转化为特定蛋白质,它们是什么时候产生的,以及细胞的具体工作情况。”(金鹿)

关键词: DeepMind预测出地球上几乎所有蛋白质结构 数字生物学迎来