清华大学药学院副院长尹航为大家带来的演讲主题是:AI+药物设计:AI制药与产业前沿。它主要分为五部分:
谈到热门话题,人工智能与生物制药两个结合在一起可以说是热点中的热点。近期,我参与研发了一些从基础科研到产业转化的交叉项目,今天正好借此机会,同飞桨开发者进行交流。
WAVE SUMMIT+2021深度学习开发者峰会
我们课题组一直聚焦于基础研究领域的生物学问题,尤其关注细胞膜和细胞膜的形态,以及与免疫相关的信号传导工作。计算机一直是一个十分必要的研究手段,它可以通过多种算法解决实验中难以解决的问题,比如细胞膜分子动态很难用实验真正看到,我们可以通过计算机算法模拟细胞膜的分子动态模型。
第一,蛋白质折叠指的是氨基酸序列只有一个确定的三维结构。第二,如果蛋白质需要对所有不同种的可能构象都去尝试,那要花费的时间比宇宙形成还要长,这也就是著名的利文索尔佯谬(Levinthal's paradox)。最后可以确定的是,蛋白质在非常短的时间内能找到最终三维结构以实现生物学功能。
但是,这从理论上是讲不通的,所以自然界一定有一种办法,可以极其快速地找到蛋白序列的能量最低值。我们希望找到这唯一的方法:无论是借助人工智能,还是实验手段都可以。
第一,在蛋白质结构设计的领域里,美国西雅图华盛顿大学的David Baker教授是先驱,他发明了一个网络游戏——Foldit。这个游戏是通过人工智能计算加上人脑的三维认知。
他认为,人脑的三维认知对生物计算有增强作用,这个工作后来不但成为了一个网络游戏,而且发表在了《nature》的主刊上,其标题为:Predicting protein structures with a multiplayer online game, 而文章的作者也包括了成千上万的Foldit players.
第二,我们课题组利用类似的计算机方法解决了许多生物学问题,比如膜蛋白,它是重要的药物靶点。我们经常举例说,如果细胞是一个房间,膜蛋白是门或窗户,药物发挥作用,一定要通过门或窗户,即透过膜蛋白,因此研究膜蛋白对于药物研究来说非常重要。
第三,我们课题组发展了一种计算机膜蛋白设计方法,名为Computed Helical Anti-Membrane Proteins (CHAMP)。此方法可以设计多肽探针插入到细胞膜的细胞磷脂双分子层里,与跨膜蛋白相结合,通过计算机AI强有力的设计功能辅助膜蛋白获得功能。
这项技术在基础科研方面已经有应用。在癌症发展过程中,癌细胞非常狡猾,很多癌症的发病机理仍然不明确。病毒感染, 尤其是EBV病毒很可能就是重要的机理之一。
大约是五十年前,这个病毒首次在非洲被发现。它非常狡猾,因为它可以模拟免疫系统。就像感冒了会引起发烧,其实主要原因是由于外源的病原菌侵入,导致自身免疫系统激活了自身防御,而病毒模拟自身免疫信号,造成持续性炎症反应,就会引发癌症。类似于大家常说的炎症-癌症转换,比如多年的胃炎不治,那么胃炎就会转化为胃癌。
所以,我们通过人工智能计算可以清晰地看到细胞膜里膜蛋白的结合,同时解析了EBV造成的癌症机理。
在另一项研究中,我们与清华大学的施一公老师合作,解析了营养分子,即蛋白质氨基酸组成成分是怎么进入到细胞里面的,此类研究采用的方法也是通过人工智能计算,模拟分子在细胞膜中的变化,也就是用分子动力学方法解析分子机理。
第一,
关于AlphaFold 2和AI在制药方面的运用。
刚才提到的AlphaFold 2,他的名字其实出自于围棋软件AlphaGo。记忆犹新的是:2016年,在美国熬夜看李世石五局大战AlphaGo的直播,九段棋手一开始解说判断AlphaGo肯定不行,肯定下不过职业棋手,说你看看吧,职业棋手肯定不会下这样的棋。可是当比赛到一半,她们说我们数数AlphaGo输了多少,一数AlphaGo已经赢了!
没想到第一局是这样,第二局仍然是这样,不是职业棋手不懂棋,而是人工智能实在下得太好,就连人类的九段棋手也理解不了了,人工智能已经超越了人类智能了,这就太可怕了。当时李世石其实也赢了唯一的一局,在这一局里是李世石下出了“神之一手”。在最近几年里,我们都在期待着人工智能,包括飞桨能够下出这样的“神之一手”。
第二,资本市场对于人工智能药物设计也非常关注。
作为软银愿景基金的技术顾问,我参与了国内几十家关于人工智能的投资咨询。
就在去年一年多的时间里,我们进行了深度尽调,投了晶泰科技。
这家公司用自己的独特立场预测晶型,因为药物的不同晶型可以决定制剂,可以对药物知识产权进行保护,这是一个重要的应用方向。
当时软银愿景基金公司投了3亿1千万美元,这创造了人工智能制药风险投资的世界纪录。
今年,我们也投了Exscientia公司,这家公司在4月份进行了C轮投资,其后已于10月份在纳斯达克上市,现在的市值是34亿美元,是整个英国生物科技公司里市值最高的一家公司。Exscientia公司创始人霍普金斯也是药物化学信息学的鼻祖。
在设计药物时候,经常有一些常规设计手段,我们经常提到什么样的药物、化合物可以作为药物分子,经过研究发现,这都跟数字5有关,比如分子量小于500,溶解性在-1到5之间, 这个规则因此就叫里宾斯基五规则(Lipinski’s rule of 5)。
因此,这些方式都可以通过利用人工智能深度学习、神经网络计算来获取结果,而这些大家非常熟悉的技术已经在药物领域里得到了有效地应用。
在这个例子里,Besnard及团队通过利用人工智能,预测出了跟不同“同类家族蛋白质”的结合方式,计算得到的数据跟实验非常类似,而且不同Ki和迭代产生不同类型分子已经可以用人工智能进行优化。它的意义就是:传统方法需要用6个月到两年时间进行的PCC确认,现在人工智能可以在几天或几周之内完成,大大节省了药物技术研发的时间和投入成本。
今年6月,我参与了一次令我印象深刻的专业咨询。麦克是全球最大的投资公司中国总部的负责人,也是清华大学电子工程系的校友。在这次咨询中,麦克提出,现在的人工智能是否可以有效地设计出药物?我说结果还不知道。
AI药物设计和下围棋不一样,因为围棋知道胜负,而对于药物,则至今还没有临床结果,因为临床药物设计是一个周期相对比较长的过程,短期之内看不到结果。麦克接着提出那么你是否觉得人工智能可以使整个产业加速?如果可以我们就会关注。
其实,跟许多产业一样,对于生物制药行业来说,人工智能可以使整个产业加速,它属于一种范式调整。所以,现在资本市场对于人工智能的追捧,比如晶泰科技,现在手上现金已经有好几亿美元,在C轮投资的几个月之后就会达到了软银的退出节点。所以,这种加速技术的确对于生物制药领域有着非常大地革命性影响。
1. 此次合作关注的是外泌体技术,人与人之间需要通讯,而细胞之间也需要通讯,尤其是癌症,比如乳腺癌影响乳腺,也会影响肺和肝,远程通讯是由外泌体达成的。外泌体是非常微小的囊泡,直径只有30-100纳米,远远小于可见光的波长,所以显微镜下看不到外泌体。
2. 我们课题组发展了一些独特的技术,基于多肽探针对外泌体区分,包括取度和临值的组分,同时也进行了特异性探索。
3. 此次实验我们采用的是老鼠血液作为样本,实验中通过布朗运动看到大小不同的颗粒,通过多肽探针,对跟癌症转移最相关的大约在30-100纳米颗粒进行特异性标记。目前已在上海落地了癌症早筛公司,入组了1000例临床样本进行大数据分析,比如在癌症组、炎症组、正常组几组数据中,我们可以看到有一些癌症病人的外泌体数据库中,癌症经典通路得到了明显加强。
4. 我们也可以进行随访相同病人。从一期、二期、三期到四期进展过程中的不同表现,我们看到成百上千大量数据需要新型分析技术,而人工智能则提供了这样的出口。
5. 我们最近开始跟百度研究院的窦德景老师合作,希望利用飞桨技术平台以实现新型癌症早筛大数据分析。