\u200E
11分钟解决“世界性”难题!百度生物计算研究成果登顶《Nature》正刊
发布日期:2023-05-10T07:04:39.000+0000 浏览量:2148次

北京时间 5 月 2 日凌晨,国际顶级学术期刊《 Nature 》正刊发表了百度与合作单位在生物计算领域的重磅突破性成果——《 Algorithm for Optimized mRNA Design Improves Stability and Immunogenicity 》,提出 mRNA 序列优化算法 LinearDesign 。

这是中国科技企业首次以第一完成单位的身份在《 Nature 》杂志发表论文。鉴于论文对生物医学领域的重要性,Nature 杂志在正式排版之前先将预览版快车道上线 ( accelerated article preview ),这也是AI应用于mRNA领域的首篇 CNS 主刊论文。

mRNA 疫苗被公认为是遏制 COVID-19 的可行工具, 但 mRNA 疫苗和药物仍面临一些挑战。其中如何高效设计出稳定、成药性更好的 mRNA 序列,是 mRNA 疗法研究领域的难点之一。

百度运用自然语言处理中网格解析( Lattice Parsing )技术,对 mRNA 疫苗序列进行优化,提升疫苗稳定性和有效性。LinearDesign 算法巧妙地将序列设计的海量计算简化为自然语言处理中的经典问题,让“大海捞针”变成了“按图索骥”。

以新冠病毒 Spike 蛋白为例,若采用遍历法寻找一条稳定序列,需要查看 10 的 632 次方个 mRNA 序列。假如由一台超级计算机每秒计算一个序列,那么从宇宙诞生到现在的 138 亿年,连潜在 mRNA 序列的亿万分之一都无法计算完毕,而 LinearDesign 算法则能在短短 11 分钟之内找到最稳定的候选序列。

实验数据证明,LinearDesign 算法设计序列将有助于生物医药公司快速研发更有效的 mRNA 疫苗,缩短研发周期,降低研发成本。这一算法的有效性已经在新冠 mRNA 疫苗和带状疱疹 mRNA 疫苗两种疫苗中得到验证。与传统基准相比,百度的设计显著改善了体外 mRNA 半衰期和蛋白质表达,使体内抗体反应增强了高达 128 倍。

计算 RNA 生物学家戴夫·莫格 ( Dave Mauger ) 则认为,这种新方法“非常了不起”,他曾在美国 Moderna 公司工作,一家 mRNA 疫苗制造商。“计算效率确实令人印象深刻,而且比以往任何时候都更加复杂。”

截至目前,百度已打造完整的基于飞桨的生物计算平台-螺旋桨 PaddleHelix ,涵盖文心大模型-生物计算大模型,探索 AI 技术在小分子、蛋白/多肽、 RNA 等场景的应用。其中生物计算等大模型属于百度文心大模型家族中的一员。

据了解,百度文心大模型形成了系统性的大模型技术体系,包括自然语言处理、视觉、跨模态、生物计算等,最近火爆的文心一言就是百度自主研发的知识增强大语言模型。文心一言通过百度智能云对外提供服务,为企业构建自己的模型和应用,未来医疗、工业、金融等重点领域效率将会大幅提升,快速形成新产业空间。


关注【飞桨PaddlePaddle】公众号
获取更多技术内容~