本文作者:佛系玩家

合成化学研究新范式:当AI“大脑”遇上机器人“双手”

合成化学研究新范式:当AI“大脑”遇上机器人“双手”摘要: ...

·用人工智能(AI)来设计实验甚至在某些场合取代化学家的“直觉”,用机器人等自动化技术来高效做实验,部分解放化学家的双手,已经成为很多人眼中合成化学的未来愿景。

合成化学就是一门以原子和分子为“砖瓦”,在现实世界中创造新物质的基石学科。从化肥的基石合成氨,到开启材料革命的尼龙,再到拯救无数生命的青霉素,合成化学的每一次突破都在重塑我们的衣食住行和人类文明。然而,当今社会对新物质、新材料性能的要求日益严苛,传统的依赖化学家经验不断“试错”和手工“摇瓶子”的研发模式需要提升效率。

在6月29日闭幕的“合成化学研究新范式——机器人融合AI研讨会”上,中国科学院院士麻生明、中国工程院院士杨为民等顶尖学者与产业专家共同探讨了如何利用人工智能(AI)和机器人自动化这两股强大的技术浪潮,为合成化学学科注入新的活力。

化学家的困境:在无限的分子宇宙中“寻路”

合成化学是创造物质的科学,从化肥、塑料到为人类健康保驾护航的药物,都源于化学家和药物学家等在分子层面的精妙设计。中国科学院院士、复旦大学化学系教授麻生明介绍了其团队对联烯(allenes)的合成、反应、性质等方面近30年的研究,展现了化学家在寻找与构造分子、探究和优化反应路径上的求索。

这些工作的核心挑战在于化学空间的广袤无垠。浙江大学化学系研究员、博士生导师洪鑫在会上介绍道,理论上可合成的中小分子的数量高达10的60次方,这是一个远超宇宙中恒星数量的天文数字。在这片无限的“分子宇宙”中寻找具备特定功能的“新星”以及它们之间的关系,传统上依赖实验与理论两种路径。

第一种是“自上而下”(Top-down)的实验驱动模式。如同经验丰富的探险家,化学家依赖已有的知识地图和敏锐的直觉,在实践中不断调整路线。优秀的化学家可以基于有限的实验数据,通过调整催化剂或反应物的细微结构,“迭代”出性能优异的新反应。这种方式不仅依赖大量的实验与试错,有时候还依赖于科学家对实验结果的敏锐捕捉。

第二种“自下而上”(Bottom-up)的理论驱动模式是理论与计算化学家的路径。他们从量子力学的第一性原理出发,通过超级计算机模拟分子的相互作用,精算出反应的每一步能量变化,从而在原子层面揭示反应为何发生、选择性从何而来。

此法极为精准,但代价是极其高昂的计算成本和时间。洪鑫提到,如果要精确理解一个催化剂的作用机制和构效关系,背后可能需要成千上万的过渡态计算。这使得它难以及时指导实际场景的合成决策。

在浩瀚的分子空间面前,这两种路径一个依赖经验与直觉,一个依赖算力与理论,两者都面临着效率和普适性的巨大挑战,这为新工具的出现创造了迫切的需求。其中,用人工智能(AI)来设计实验甚至在某些场合取代化学家的“直觉”,用机器人等自动化技术来高效做实验,部分解放化学家的双手,已经成为很多人眼中合成化学的未来愿景。

新工具的实践:自动化的现实与AI的起步

让“不知疲倦”的机器人等自动化设备根据设定好的程序代替人去做实验,可以大大提升实验驱动的合成化学研究的效率。在产业界,对效率的追求早已将自动化推向了研发一线,远早于近年来生成式AI的突破。

中国工程院院士、中国石化上海石油化工研究院院长杨为民在演讲中提到,在石油化工领域,一个新催化剂的开发过去遵循着“十年磨一剑”的漫长周期。早在2010年左右,杨为民所在的中石化上海院便与美国公司合作,引入了高通量(High-throughput)技术平台,用机器人手臂和精密的流体控制系统,代替人工去执行海量的、并行的实验。

研究人员可以首先通过高通量计算系统性地设计上千种不同的催化剂配方,再让自动化平台快速筛选,从而发现传统“试错法”需要花费大量人力才能得到的规律和性能更优的材料。通过这样的工作模式,他们成功开发出一种纳米片状分子筛,解决了利用炼厂废气生产高价值化学品的难题,并已在全国多套工业装置上成功应用 。

在产业科研中,科研人员已经对目标反应规律和物质属性有大量的数据和明确的优化要求,这些成为自动化和高通量计算的基础。而对于前沿学术科研来说,相关数据非常缺乏,实验方向有待探索。在这些“无人区”中,新工具的使用似乎呈现另外一幅景象。

去年,在麻生明团队的指导下,晶泰科技为其实验室定制开发了能进行ATA反应研究的智能合成工作站。这个工作站能够同时做48个实验,大大提升了实验试错速度,加速催化剂的合成筛选研究,也高效提供标准化数据,是晶泰科技自主研发的智能自主实验平台在科研具体场景的应用。

晶泰科技的智能合成工作站。图片由主办方提供

他表示,用智能合成工作站这一自动化平台做实验的效率确实远远高于原来的研究模式,但这些实验结果的解读还无法依赖机器。“通过自动化,我们观察到了一些有意思的结果。但AI扮演的角色还很有限,有极大的发展空间。”

他强调,AI在化学领域的价值,目前更多是成为化学家高效的“帮手”,而非替代者。“很多人觉得AI会替代人脑,我个人感觉这是不可能的,”麻生明告诉澎湃科技,“化学发现很多时候是基于一些偶然性的发现”,而通过已有知识训练出来的机器的解读常常泯灭这种偶然性的发现。因此,最终的科学洞察仍需人脑来完成。

未来的化学:智能模型与自主化

谷歌公司开发的AI“AlphaFold”以超高的预测准确率解决了蛋白质结构预测问题,获得了2024年的诺贝尔化学奖。麻生明认为,在蛋白质结构领域,科学家多年来的探索已经积累了大量数据,如已知蛋白质的晶体结构和功能等,为训练AI创造了很好的条件。而在很多其它前沿领域,AI依然面临数据稀缺的问题。

洪鑫的探索为此提供了一条可能的路径。他指出,当探索一个全新的化学物质构效关系(分子结构与活性之间的关系)时,往往可能只有非常有限的实验数据,直接用这些“小样本”数据训练AI模型,模型难以泛化,无法获得具有化学意义的预测设计。

为此,他们设计了一种“层级学习”框架,让AI能够逐步逼近目标的构效空间,从而更好地进行建模预测。在开发一种新型的镍催化剂时,他们首先利用了大量机制上相关的钯催化剂文献数据,训练出“基础模型”,让AI学习到关于这类反应的整体选择性规律。然后,再用少量、珍贵的镍催化剂数据对这个模型进行“微调”和“校正”,使其适应新的目标体系。通过这种方式,他们成功地预测并合成出一种全新高效、高选择性的催化剂配体,展示了AI在“小数据”场景下实现创新发现的潜力。

除了使用“知识迁移”的方式训练更准确的AI知识模型,使用AI让自动化变得更加“聪明”也是未来提升合成化学效率的一条路径。晶泰科技联合创始人、首席执行官马健将其描述为自动化(automation)与自主化(self driving)之间的区别。

“自动化就好比大家出行的时候坐地铁、坐火车,”他解释说,“两点之间的路径非常的明确……大家一起上车,然后直接到目的地。”在化学领域,自动化平台擅长执行大规模、重复性的标准化流程,例如高通量的筛选,一次性测试上百种预设好的配方。这种模式效率极高,但缺乏灵活性。

而自主化,则更像是“自动驾驶汽车”。它不仅能执行任务,还能在过程中感知环境、分析数据、并作出下一步决策。马健将其称为“自动驾驶实验室”(Lab Auto-Driving)。这样的实验室在完成一次实验后,能立即分析结果,并自主设计和启动下一次、更优化的实验,形成一个快速迭代的“设计-执行-学习”闭环。

构建这样的“AI+机器人”自主实验室是包括晶泰科技在内的很多公司和科研机构的共同愿景。晶泰科技智能自主实验平台正在与科学家、产业从业者们深度合作,整合自动化实验执行和AI实验预测与设计,实现了高效的“干湿实验”(计算模拟与真实实验)迭代,已成功应用于生物医药、新材料、新能源等多个领域。

阅读
分享

发表评论

快捷回复:

验证码

评论列表 (暂无评论,1人围观)参与讨论

还没有评论,来说两句吧...