我眼中的“阿尔法折叠”|老梁说药
梁贵柏·7月以前
老梁说药

如果是狭义的,只能预测几个特殊的蛋白质构象,阿尔法折叠还只是AI在这个领域向前迈出的“一小步”,是量变;如果是广义的,能预测除了几个特殊之外的所有蛋白质构象,那么蛋白质科学就向前跨出了“一大步”,是质变。 


近日“阿尔法折叠(AlphaFold)”刷屏了,原因是前几年开发出“阿尔法狗(AlphaGo)”的DeepMind,采用新开发的阿尔法折叠又以显著优势赢得了蛋白质折叠的预测比赛,大有“一招鲜、吃遍天”的势头。消息一出,《自然》和《科学》等顶尖杂志都争相报道,称其为“一代人的科学进步(Once in a generation advance in science)”。当然也有人说“蛋白结构预测不是一个新鲜学科”,虽然进了一步,却不必大惊小怪。


蛋白质折叠:生命之基础


“蛋白质折叠”确实不是一门新鲜学科,当年我的博士论文就是这个研究方向的,题目是“与蛋白质折叠相关的非共价作用力的研究”。所以这才是我的老本行,做药是后来的事了。


美国生物学家Christian Anfinsen指出,蛋白质构象是由其多肽链的氨基酸序列决定的


蛋白质的多肽链折叠是生命现象中一个至关重要的过程,因为组成蛋白质的多肽链只有折叠成一定的三维空间结构(“构象”)才会有生物活性。1950年代中期,美国生物学家Christian Anfinsen取得了一系列突破性的研究成果之后发文指出:蛋白质构象是由其多肽链的氨基酸序列(蛋白质一级结构)决定的,因为许多蛋白质都可以自发地重新折叠成天然的、有生物活性的构象,为蛋白质折叠的“热力学假说”提供了有力的证据。1972年,Christian Anfinsen获得了诺贝尔化学奖。从那之后,研究多肽链如何折叠成有活性的蛋白质就成了基础生命科学研究领域的一个重要课题。


传统的研究方法是从分子力学(molecular mechanics)的角度出发,想办法搞清楚分子内的各种相互作用力(焓)与限制性因素(熵)。这些相互作用之间的平衡点决定了多肽链的热力学(最稳定与最可几的)构象,从而构建多肽链的局部折叠构象(蛋白质二级结构),并希望能扩展到有生物活性的整体构象(蛋白质三级结构)。 


这是一个从归纳(reduction)到演绎(deduction)的艰苦历程(一肚子苦水如果你想听的话)。  


计算机模拟:举一反三


从计算机进入化学领域的那一刻起,试图用分子力学的数值计算来分析多肽链构象,并预测该多肽链热力学构象的研究就没有停止过,也有好几十年了。在不断扩大的实验数据库的支持下,分子力学的参数场(Force Field)被不断地优化和迭代升级,并从1980年代末期就逐步进入了药物化学的实用性阶段,所谓的“计算机辅助药物设计(延伸阅读:《寻找十亿美元的分子》)讲的就是这个。 


在相当长的一段时间里,计算机可以根据已知同类蛋白质(比如许多激酶)的三级结构,通过分子力学的计算,模拟出该家族中氨基酸顺序不尽相同的新蛋白质(比如某个新发现的激酶)的三级结构模型,称为“同类模型(Homology Model)”,准确性已经不错,有相当的实用价值。 


那么,作为模拟起点的同类蛋白质的三级结构是哪里来的呢?当然是通过实验的方法测定的。过去这些年里,科学家们用单晶的X 射线衍射和新型的冷冻电子显微镜等实验手段,可以准确定位蛋白质中重原子在晶格中的相对位置,从而解出它的三维结构。获得2017年的诺贝尔化学奖的冷冻电镜技术就是这个方向上的重要突破。 


阿尔法折叠:从量变到质变


既然实验可以测定,计算机也可以模拟,那阿尔法折叠的革命性在哪里呢?


2017年,阿尔法狗刚刚打败李世石的时候,我写过一篇《阿尔法狗,不用找李世石,能赢“我”就好》(点击阅读)。在文章的最后我写到:“阿尔法狗背后的算法是狭义的还是广义的?如果是狭义的,那么阿尔法狗还只是一个能学习下围棋的机器;如果在跳棋、象棋、围棋各自的逻辑之下,存在着一个广义的算法……”结果很快,Deep Mind 就找到了这个广义的算法,开发出了阿尔法零(AlphaZero)。 


今天面对阿尔法折叠,我们可以问出同样的问题:它的底层逻辑是广义的还是狭义的? 


如果是狭义的,只能预测几个特殊的蛋白质构象,那么阿尔法折叠还只是AI在这个领域向前迈出的“一小步”,是量变;如果是广义的,能预测除了几个特殊之外的所有蛋白质构象,那么蛋白质科学就向前跨出了“一大步”,是质变。 


历史上第一次,我们可以根据阿尔法折叠算法的底层逻辑及它对某一个特定蛋白质构象预测所得出的计算结果,反过来研究这里各种相互作用力达到平衡时到底是怎样的关系,几代科学家苦苦构建的分子力学终极参数场应该就在这个算法里。 就像不会再有哪一个围棋天才会去挑战阿尔法狗一样,今天我们也大可不必去质疑阿尔法折叠预测的精度到底如何。


 2020年12月于上海


作者简介:

贵柏曾在默沙东新药研究院工作多年,潜心钻研药物化学,颇有建树。几年前回国加入药明康德,从事业务开发、项目管理和驻美运营。梁博士是《新药的故事》一书的作者。他以长期的积累、独特的视角和生动的文字,通过《老梁说药》栏目讲述新药研发“背后的故事”,令人耳目一新,脑洞大开。梁贵柏博士目前是偕怡制药联合创始人兼首席科学家,欢迎读者通过邮箱gbliang55@hotmail.com与梁博士联系。


文章关键字: “阿尔法折叠”
1781
谁阅读了此文章?
回复评论0
登录后回复评论,不超过1024个字(当前剩余字数:1024)
梁贵柏 个人用户

梁贵柏博士从事新药研发工作二十余年,经历了许多次失败,也有享受到了成功的喜悦。梁博士是药物化学专家,在先导化合物的发现、设计、和优化,以及临床候选药物推荐等领域都做出过重要的贡献,先后发表过多篇学术论文与发明专利。梁博士长期致力于中美医药界的交流与合作,近年来开始以中文发表医药与健康方面的文章,并在2014年出版了《新药研发的故事》一书,为推动中国医药健康事业的发展作出贡献。

联系方式

联系电话

电子邮箱

gbliang55@hotmail.com

公司名称

实宪生物医药咨询

公司网站

公司地址

进入主页
Copyright © 2016-2021 研发客.All Rights Reserved.   建议反馈: Support@PharmaDJ.com   备案/许可证编号:沪ICP备17054709号-1   联系电话:021 - 88194359
关于研发客 | 加入会员 | 联系我们| 知识产权声明