新华网北京12月28日电(凌纪伟)党的二十大报告强调,加快实施创新驱动发展战略。以国家战略需求为导向,集聚力量进行原创性引领性科技攻关,坚决打赢关键核心技术攻坚战。
(资料图)
创新的根本在于底层技术突破。只有突破底层科学问题,才能破解上层产品受限的难题。而AI for science的本质就是用AI技术去解决一系列的底层科学问题。
深势科技创始人兼CEO孙伟杰在接受新华网采访时说,“AI for science是大家公认的发生在当下的科学革命。它对于底层科研,以及与基础学科密切相关的工业门类,都有着非常巨大的意义。”作为AI for Science科研范式的引领者和践行者,深势科技专注于打造微观尺度科学研究和工业研发的基础设施。孙伟杰坚信,中国在微观尺度的工业软件研发领域引领着全球的技术生态,完全可以打造出一批源自中国引领世界的工业研发平台。
AI算法驱动微观世界科研创新
以分子模拟为代表的科学计算被视为AI的新战场。几年前,在问题导向和需求导向的双驱动下,深势科技进入“AI+分子模拟”这条赛道。
“一方面我们掌握底层的AI for Science的算法,就是用AI去求解分子动力学的这套模型。另一方面,我们进入到这个领域,更关键的还是看到了下游在药物研发、材料研发这些工业研发领域存在着巨大的机会。”孙伟杰说。
在市场发展初期,痛点往往就预示着机会。孙伟杰和创始团队看到的机会,其实正是一直困扰行业用户的痛点。
人类文明发展至今,材料、能源等重要工业门类的研发范式基本上没有新变化。“AI for Science算法的突破,能够转变这些行业的研发模式,转变成像现在的飞机、汽车的研发一样,先做计算,再做非常少量的实验,去验证计算的结果就可以了。”正是看到了这个机会,看到了背后蕴藏的巨大市场,尤其是对下游产业颠覆性的变革契机,孙伟杰和创始团队决定用原创性的AI算法驱动微观世界的创新。
凭借创新的新一代分子模拟技术,深势科技团队核心成员曾获得2020年度高性能计算领域最高奖ACM戈登·贝尔奖。相关工作还入选了由两院院士评选的2020年中国十大科技进展,以及2020年全球人工智能十大科技进展。
“我们主要是用AI去求解电子、原子、分子等这些微观粒子之间的相互作用,然后进一步求解药物、材料、化工、能源等领域面临的关键工业问题。”孙伟杰说,公司希望为科学家们提供一套更有效率的科研工具,帮助大家更好地去探索未知世界,从而提升整个基础研究的创新步伐。
“AI+分子模拟”加速科研进程
自公司成立以来,深势科技的使命始终如一,就是让AI for Science这场发生在当下的科学革命成果,更快、更好的惠及一线科学家,以及更广泛的工业研发从业者。
为了践行这一初衷,深势科技相继推出了Hermite药物计算设计平台、Bohrium科学计算云平台等微尺度工业设计基础设施,颠覆了现有研发范式,打造“计算指导实验、实验反馈设计”的全新范式,为药物、材料领域带来极具突破性的计算模拟及设计工具。
过去,做科学计算,就要买服务器、买超算,再去部署相关软件,这种算力、算法、数据和模型等生产要素彼此割裂的现状束缚着科研人的脚步。孙伟杰介绍说,深势科技打造的AI for Science科学计算平台Bohrium,用一种SaaS化的形态,把这些最前沿的算力、算法、数据、模型都整合到了云平台上,科研人员可以开箱即用。
如果说Bohrium是给化学、生物、材料等应用学科的科学家们提供一整套“平台化”科研的基础设施,在AI for Science底层算法的发展上,深势则始终秉持开源开放的理念,团结DeepModeling社区的一批优秀开发者,共同打造新一代算法生态。“DeepModeling社区像是一个大集市,那些具有比较强的底层开发能力和理论功底的老师,其实有大量机会发现新的场景,并加入到整个AI for Science的基础设施建设中来。这个领域会诞生若干个像AlphaFold、DeePMD这样量级的应用。”
利器在手,攻坚无忧。正是得益于AI for Science科研基础设施的出现,过去用传统方法解决不了的重要问题现在有了破解之道。
新药研发可以说是一座风光无限的险峰,一方面耗时长、投入巨大,另一方面成功率往往很低。而 AI for Science 的科研新范式,有望成为征服这座险峰的关键抓手。
10月29日,深势科技发布药物设计平台Hermite的全新版本,Hermite®致力于为药物研发工作者提供在CADD中数据、算法、算力三位一体的一站式解决方案。Hermite®平台与市场上现有的产品相比具备了更多细节优势:基于AI、物理建模、高性能计算,在小分子药物设计领域提供了Uni Fold- 蛋白质结构预测与优化,Uni Docking- 苗头化合物的超高通量虚拟筛选,Uni IFD- 药靶结合模式的精确预测,以及Uni FEP- 基于自由能微扰的先导化合物优化。并为药物研发科学家打造了基于浏览器的全新体验,包括可视化、结构化分子,最大化操作区域,灵活调整窗口,跨窗口智能化协作。
除了平台,深势也运用自身的平台能力攻克难成药靶标。12月14日,深势科技首次公开RiDymo平台管线应用进展,公司基于“AI+分子模拟”成功模拟蛋白质在其生理状态下的动态效果。“蛋白质的生理功能很大程度上是由它的动态结构决定的,而动态结构之前靠实验手段、靠传统的计算方法没有办法去解析。”孙伟杰介绍说,通过基于AI for Science的分子模拟方法去模拟蛋白质的动态,深势的药物研发团队成功攻克了数个传统意义上的难成药的靶标,发现了一系列极具成药潜力的药物分子,并基于多种算法模块助力合作伙伴进行药物的快速发现和优化。
越来越多的行业用户向孙伟杰反馈着同一个感受,有了AI for Science这套方法之后,他们发现原来很多做不了的课题,很多用传统的理论计算工具算不了的东西,现在基本上都能算了,一下子打开了做研究的思路。
持续创新推动AI研发规模化应用
搞研发,照抄照搬不行。持续不断的创新,才能让企业葆有旺盛生命力。
在孙伟杰看来,只有持续创新、持续进化,才是科技公司最重要的核心竞争力。“这就要求整个团队保持开放,问题导向,具有强大的自我驱动力和追求卓越的精神。”他说,表面上看,深势科技的很多算法是领先于世界的,其实底层是持续创新、持续进化的能力,这种能力来源于整个团队打造的协作文化。
揭示微观世界的基本原理、精确模拟微观粒子的状态,不仅是人类一直以来的梦想,也是药物、材料、化工等产业走向理性设计的必由之路。其中,对原子间势函数的精确建模,是其中最核心的问题。
预训练模型是推动AI应用的重要基础设施,也是全球科技巨头竞相角逐的焦点。近日,由深势科技联合北京科学智能研究院共同研发的首个覆盖元素周期表近70种元素的深度势能原子间势函数预训练模型“DPA-1”正式发布。这一创新成果在模型覆盖范围、通用性、计算精度以及未来的AI生成等方面实现新突破,被视为AI for Science走向大规模应用的重要里程碑。
据孙伟杰介绍,预训练模型“DPA-1”通用性非常高,可避免开发人员重复进行大规模的训练。并且由于引入了更多的元素和微观构型,它的精度、泛化性能力都比单体小模型更好,对于科研人员来说是一个新的基础设施。
近期,一款全新的聊天机器人模型ChatGPT火爆全球。而“DPA-1”的存在,就像是自然科学领域的GPT。“好比用GPT模型可以生成对话、文章,未来当把世界上所有的元素和更丰富的微观构型都能涵盖进来后,我们基于这种描述原子间相互作用的预训练模型,不仅可以从原子尺度预测构成世间万物的基本材料的性质,还可以根据我们对物质的性质的需求,生成我们需要的物质组分和结构。”孙伟杰对“DPA-1”抱有一个美好期待,希望它能成为万物生成模型或者叫“上帝之手”,用它可以去造物。
AI for Science既具备AI自身快速迭代、快速发展的属性,同时它也必须遵循科学的基本规律和伦理。
深势科技一直倡导科技向善。孙伟杰阐释说,“善”是最终的人文关怀,“科”是科学精神,“技”是工程思维,“向”是产品的载体和视角,“科”和“技”必须通过“向”这个载体才能实现“善”。要想把创新做好,促进高质量发展,一定就要把这四个要素紧密地结合在一起。
瞄准需求助推基础研究变革
AI for Science已成为热点领域,业界对AI算法也提出了更高期待,如何推动从算法创新到应用落地的进一步实现?
结合多年来的实践经验,孙伟杰提出了科学实验算法的分级理论,即如何对算法设定合理的期望,怎样的算法可以大规模替代实验的工业级算法。他将科学实验算法分为L1模仿现实、L2预测现实、L3搜索现实三个级别。他认为,从现在到2025年,大家的目标是在各个领域研发出一系列L2级别,即工业级别的算法。
围绕这套算法分级理论,深势科技未来有何布局?孙伟杰表示,公司在药物活性优化、药物筛选、蛋白质动力学模拟等多个领域的算法水平都已接近L2级别。“我们的目标就是在2025年之前,把药物和材料研发主要环节涉及的算法都做到L2级别,那就意味着可以用计算替代大量非必要的实验。”
他举例说,药物的分子筛选原来可能要做几百万次实验,现在通过几十亿次计算,只需做50次到200次实验就可以筛选出目标分子。如果药物研发中的每一个环节都有L2级别的算法加持,那么整个药物研发的效率将大大提升。
工业软件被誉为“工业皇冠上的明珠”,过去一直是海外厂商占据的领域,随着AI时代的来临,工业软件行业正在发生一些趋势性变化。
“我们希望将公司的产品打造成为微观世界的‘达索’系统。”孙伟杰说,在微观领域,如何有效设计一款分子、一款材料的微观结构,AI for Science算法率先在这一领域取得突破。我们追求自主可控,更重要的是抓住真正能够源自中国、面向未来、引领世界的创新机会。
值得注意的是,深势科技的另一位创始人,兼CSO张林峰也表示过:前沿算法的开发并不只是做demo、发paper那么简单,还需要大量的算法工程比如数据工程、硬件适配、性能优化,跟云计算的结合也需要有大规模、高复杂度系统建设的能力体系;更重要的是,软件不是开发出来的而是被用出来的,以需求和反馈为导向持续优化才是工业软件的真正壁垒。工业软件是“物理内核+工程体系+研发经验”紧密结合的行业智慧结晶。
伴随整个AI for Science发展,化学、材料、生物学、药学等基础科研领域迎来变革机会。这一方法不仅改变了科学研究范式,也将大大缩短理论研究与解决实际问题之间的距离。
聚焦需求,才能有效推动高质量发展,AI for Science也不例外。孙伟杰认为,不应过度炒作AI for Science概念,而是要真抓实干,把握这个领域的精髓,提炼出一些真正适合用AI去求解的科学问题,持续交付产品,持续解决行业问题。
“微观尺度的科学研究和工业研发,涉及的面非常广泛,这其中存在巨大机会也存在巨大挑战。深势科技愿与学术界、产业界携手努力,共同打造好属于中国的科研和工业基础设施。”孙伟杰说。
关键词: 人工智能
责任编辑:Rex_28