用新一代分子模拟技术解决药物研发难题
张林峰先生2016年本科毕业于北京大学元培学院,2020年于普林斯顿大学获得博士学位,研究方向涉及科学计算、分子模拟和机器学习,及相关技术其在化学、生物、材料等方向的应用。2020年,张林峰及团队获得了国际高性能计算应用领域最高奖—戈登贝尔奖(ACM Gordon Bell Prize)。研究团队成员共同推动完成的工作成果—“Pushing the limit of molecular dynamics with ab initio accuracy to 100 million atoms with machine learning”,首次将具备量子力学精度的分子动力学模拟提升至数亿原子的规模,实现了分子动力学领域的重要突破。

从宏观层面来说,高性能计算技术和分布式计算、云计算以及网格计算等正建立日益密切的联系,彼此之间的融合也变得越来越深入。进入21世纪以来,计算模拟已成为继实验方法、理论方法之后的第三个重要的科学方法,对未来科学与技术的发展起着越来越重要的作用。当今人工智能(AI)领域的进步与高性能计算相结合,能够以前所未有的速度处理独特且具有挑战性的工作负载。
据了解,基于深度学习的分子动力学模拟通过多尺度建模、机器学习和高性能计算的有机结合,将精确的物理建模带入了更大尺度的材料和药物计算中,为微观世界模拟带来新的研究范式。与此同时以深度势能(Deep Potential)科学算法为基础的开源社区正在蓬勃发展,全球有千余个实验组正在运用该研究范式在化学、材料、生物乃至工程领域进行着重要的研究,相关成果已经陆续公开发表。未来在新范式与开源生态的共同驱动下,有望为更多领域解决实际问题发挥更大作用。
张林峰的研究成果正在生物计算方向快速实现落地——深势科技将物理建模、人工智能和高性能计算相结合,并将其应用于蛋白质结构预测与机制研究,以及活性药物的筛选、优化与设计中。中国科学院院士、北京大数据研究院院长鄂维南也担任了深势科技的科学顾问。同时,鄂维南院士也会亲临大会现场交流分享。
我们都知道,传统以高通量实验为基础的药物发现模式,正面临着研发周期不断增加、研发费用不断提高、探索空间有限的困局。而早期药物发现过程中所涉及的蛋白质结构解析、靶点发现和确证、虚拟筛选、先导物优化、药物作用机制研究等环节,均可定义为是典型的微观模拟问题,都离不开对药物小分子、多肽分子、蛋白质大分子等生物分子的精准建模、高效采样以及对彼此之间的相互作用的模拟计算。
长久以来,微观尺度模拟计算均面临着在“效率”与“精度”之间的权衡取舍,活性药物发现过程中的生物计算也不例外。以传统经验力场为基础的计算模拟,通用性差、整体精度不高,只可作为参考。以量化计算为基础的计算模拟,精度高,但计算模拟体系小、模拟时长短,无法满足实际应用需求。
深势科技通过将物理建模、人工智能和高性能计算相结合,很好地解决了精度与效率难以两全的问题。例如在以自由能微扰技术为代表的药物优化环节中,通过采样算法和高性能计算等方面的优化,实现了效率的大幅提升;结合Deep Potential的分子力场将有望大幅提升计算精度,实现效率和精度的统一提高。目前已经有较为成熟的方案供业界使用,并且相关软件工具仍在持续更新迭代中。

以深度学习为基础的RiD增强采样算法,能够对高维空间有效采样,应用于在蛋白质结构优化、蛋白-蛋白相互作用等问题领域,已经在多肽药物的理性设计、大分子药物的结构优化等场景领域实现技术重大突破。从而让计算模拟真正可以有效地提升药物研发的效率,缩短其研发周期,降低其研发成本。

在理论突破与软件开发的同时,通过利用高性能优化工作,大大减少模型训练、推理时所需的计算资源,通过结合云计算、高性能计算等高效的资源调度模式,真正赋能活性药物发现过程。
结合自身平台技术和科学数据分析和研究方法,张林峰将在大会现场为业内人士带来更加详细的观点分享。
与此同时,未来我们将以嘉宾快报的形式,持续为计划参会的嘉宾和观众介绍本次大会嘉宾在生物计算领域想要探讨的核心议题以及未来将重点解决哪些问题。在此共邀业内同仁亲临现场多方交流探讨,共同见证生物计算行业的每一步跃进。协作共赢,同谋发展。