药物设计虚拟筛选工具
收藏国家基础学科公共科学数据中心2026-01-03 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=6952a5ae195d266fa53fe86f&type=1
下载链接
链接失效反馈官方服务:
资源简介:
Uni-RXN 数据集围绕“无模板化学反应建模与分子生成”构建,是支持 Uni-RXN 模型训练与评估的核心数据资源,聚焦由 C、H、O、N、S、P 及卤素等元素组成的小分子有机反应。原始数据来源于公开有机合成反应数据库和文献记录,经过标准化处理后,每条反应均被统一表示为规范反应式,并拆分为反应物、试剂、催化剂和产物等组件,同时标注反应类别、产率等关键信息。随后,分子被进一步转换为 SELFIES/SMILES 等分子字符串以及对应的图结构表示,构建多层次的“反应级图 + 分子级编码”数据,用于自监督反应表征学习和下游分子生成任务。数据组织上,数据集以示例原始反应文件(如 example_rxn.txt)、标准化 reaction 对象及大规模缓存图数据的形式保存,既保留原始化学语义,又兼顾高效读写和重复实验需求。研究者可基于该数据集训练反应编码器,评估模型对反应中心与反应类型的识别能力,并在给定起始结构或可购试剂库条件下,利用 Uni-RXN 进行分子生成和虚拟筛选,为可合成分子设计和化学空间探索提供高质量、结构化的基础数据支撑。
提供机构:
北京大学



