导语: 药物研发如同在浩瀚星空中寻找闪耀的星辰,耗时漫长且成本高昂。东京科学大学的研究团队近日发布了一项突破性成果,他们开发的TRACER框架,巧妙地将分子性质优化与合成路径生成融为一体,为药物发现领域带来了一场“反应感知”的智能革命。
北京,2025年2月27日 – 在药物研发的漫长征途中,时间和金钱往往是最大的拦路虎。据统计,一款新药从实验室走向市场,平均需要耗费12年,投入高达26亿美元。为了提高研发效率,人工智能,尤其是深度学习,近年来在分子生成领域崭露头角。然而,现有的大多数方法往往只关注“设计什么”,而忽略了“如何合成”这一至关重要的环节。
针对这一行业痛点,东京科学大学(Institute of Science Tokyo)的研究团队提出了一个名为TRACER的创新框架。该框架通过将分子性质优化与合成路径生成有机结合,实现了反应感知的化合物智能探索。这项研究成果以“Molecular optimization using a conditional transformer for reaction-aware compound exploration with reinforcement learning”为题,于2025年2月8日发表在《Communications Chemistry》上。
“生成能力”与“合成可行性”的鸿沟
当前分子生成模型面临的核心矛盾在于“生成能力”与“合成可行性”的割裂。主流方法,例如Molecule Chef等基于潜空间优化的模型,虽然能够通过反应数据集学习化学转化模式,但受限于单步反应处理和固定模板库(约100个反应类型),难以应对真实合成中复杂的区域选择性和化学选择性。传统的SA评分等拓扑方法虽能快速评估合成难度,却无法捕捉动态反应条件的影响。
更深层次的矛盾在于,现有模型要么像CasVAE一样依赖预定义模板库导致创新性受限,要么如DoG-Gen采用端到端架构牺牲了反应知识的显式建模。这种技术断层导致生成分子中仅17-43%具有实际合成价值。
TRACER:弥合鸿沟,开启新维度
TRACER的创新突破在于将1000种真实反应类型编码为条件令牌,使Transformer能够同时学习“生成什么”和“如何生成”,为药物发现开辟反应感知的分子设计新维度。
该框架的核心理念建立在“反应条件-结构转化-属性优化”的协同学习上。不同于传统潜空间模型将分子与反应信息压缩为连续向量,研究团队采用显式分离架构:图卷积网络(GCN)预测适用反应模板,条件Transformer执行具体转化,MCTS负责全局优化。这种解耦设计使模型能同时处理两类关键信息流——GCN从分子图中提取的拓扑特征与Transformer通过注意力机制捕捉的序列模式。
特别值得关注的是条件令牌的引入,将反应类型索引嵌入SMILES序列头部,使模型在训练时能区分胺化、偶联等不同转化类型。实验数据表明,加入反应条件使完美准确率从0.2跃升至0.6,证明条件信息能有效缩小化学空间搜索范围。
虚拟合成树的动态构建
在算法层面,TRACER通过四阶段MCTS实现分子优化与路径生成的闭环。选择阶段采用改进UCB公式平衡探索-利用矛盾,其中价值函数Q(s)整合QSAR预测值和合成复杂度评估。扩展阶段的双重过滤机制是关键创新:GCN首轮筛选出10个最相关反应模板(top-5准确率77.1%),随后通过子结构匹配剔除30%不适用方案。Transformer在束宽10-50条件下生成候选产物,其独特的多步推理能力可处理Friedel-Crafts酰化等复杂转化。
实验显示,相较于无约束Transformer仅43.3%的母核保留率,TRACER达到94.5%,证明其能有效维持药物分子关键骨架。
实验验证:跨越三个靶点的性能突破
在DRD2、AKT1、CXCR4靶点的对比实验中,TRACER展现出独特优势。当束宽优化至30时,对USPTO库外分子的生成比例达99.8%,Fréchet ChemNet距离14.3,远超Molecule Chef(2.60)和SynFlowNet(17.0)。更值得注意的是,从ZINC数据库筛选的初始分子(QSAR≈0)出发,经过3-4步虚拟合成即可获得活性值>0.5的化合物,其与已知配体的Tanimoto相似度最高达0.838。在合成可行性方面,生成分子平均SA评分2.52与基准模型相当,但分子量分布更接近上市药物(412 vs 465 Da)。这些数据验证了TRACER在探索性(生成新颖结构)与实用性(保证可合成性)之间的精妙平衡。
未来展望:AI药物发现的加速器
TRACER框架的突破性价值在于首次实现了分子属性优化与合成路径生成的耦合学习,将AI药物发现从“纸上谈兵”推向了“实战演练”。 这一创新框架有望显著缩短药物研发周期,降低研发成本,并加速新药的发现进程。
参考文献:
- Molecular optimization using a conditional transformer for reaction-aware compound exploration with reinforcement learning. Communications Chemistry, 8, Article number: 24 (2025). https://www.nature.com/articles/s42004-025-01437-x
(完)
Views: 0