ToxiMol

github2025-06-18 更新2025-06-19 收录

下载链接：

https://github.com/DeepYoke/ToxiMol

下载链接

链接失效反馈

官方服务：

资源简介：

ToxiMol是第一个专门用于结构级分子毒性修复任务的基准数据集，包含11个毒性修复任务和560个有毒分子。它还提供了一个评估框架（ToxiEval）来评估毒性减少、结构有效性、药物相似性等相关属性。

ToxiMol is the first benchmark dataset specifically designed for structural-level molecular toxicity repair tasks, encompassing 11 toxicity repair tasks and 560 toxic molecules. It also provides an evaluation framework (ToxiEval) to assess properties such as reduction in toxicity, structural validity, and drug similarity.

创建时间：

2025-05-31

原始信息汇总

ToxiMol 数据集概述

数据集简介

名称: ToxiMol
类型: 分子毒性修复基准测试
目的: 评估多模态大语言模型(MLLMs)在分子结构层面进行毒性修复的能力
特点:
- 首个专注于分子毒性修复任务的基准测试
- 包含560个有毒分子
- 涵盖11种毒性修复任务类型

数据集结构

数据集	任务类型	分子数量	描述
AMES	二元分类	50	Ames试验的致突变性测试
Carcinogens	二元分类	50	致癌性预测
ClinTox	二元分类	50	临床试验中的毒性
DILI	二元分类	50	药物性肝损伤
hERG	二元分类	50	hERG通道抑制(心脏毒性)
hERG_Central	二元分类	50	大规模hERG数据库
hERG_Karim	二元分类	50	多源整合hERG数据集
LD50_Zhu	回归	50	急性毒性致死剂量预测
Skin Reaction	二元分类	50	皮肤过敏反应
Tox21	二元分类(12子任务)	60	核受体和应激反应通路
ToxCast	二元分类(10子任务)	50	多种毒性通路

评估框架(ToxiEval)

指标	描述	范围	成功阈值
安全分数	基于TxGemma-Predict的毒性缓解指标	0-1或二元	=1(二元)或>0.5(LD50任务)
QED	药物相似性评分	0-1	≥0.5
SAS	合成可行性评分	1-10	≤6
Lipinski规则	违反Lipinski规则的数量	≥0	≤1
结构相似性	原始与修复分子的支架相似性	0-1	≥0.4

数据获取

Hugging Face地址: https://huggingface.co/datasets/DeepYoke/ToxiMol-benchmark
加载方式: python from datasets import load_dataset dataset = load_dataset("DeepYoke/ToxiMol-benchmark", data_dir="ames", split="train", trust_remote_code=True)

相关资源

论文: arXiv:2506.10912
GitHub仓库: https://github.com/DeepYoke/ToxiMol

搜集汇总

数据集介绍

构建方式

ToxiMol数据集的构建基于Therapeutics Data Commons (TDC)平台中的单实例毒性预测任务，系统性地定义了11种毒性修复任务。研究人员从Tox21和ToxCast等权威数据源中精心筛选了560个有毒分子，涵盖了从二元分类到回归分析的多种毒性机制。每个样本均配备了结构解毒提示和全面的评估元数据，通过专家标注的机制感知提示注释流程，为通用模型和化学专业模型提供了针对性支持。

使用方法

用户可通过Hugging Face平台直接加载特定任务数据，或通过提供的Python脚本进行批量处理。实验部分支持OpenAI GPT系列和开源多模态大语言模型两类方案，包含完整的运行参数配置和结果输出规范。评估阶段使用ToxiEval框架对生成分子进行自动化多指标验证，包括毒性降低程度、结构有效性等关键维度。高级用法允许自定义生成参数和分子处理流程，配套的示例命令和输出结构说明确保了研究可复现性。

背景与挑战

背景概述

ToxiMol是由澳门科技大学、上海交通大学、中国科学院自动化研究所和上海人工智能实验室的研究团队于2025年联合推出的首个面向分子结构毒性修复任务的多模态大语言模型（MLLM）基准测试集。该数据集聚焦药物发现与化学信息学领域的关键挑战——分子毒性消除，包含560个有毒分子样本，覆盖AMES致突变性检测、致癌性预测、药物性肝损伤等11类毒性修复任务。研究团队创新性地构建了机制感知提示标注管道（Mechanism-Aware Prompt Annotation Pipeline），并开发了ToxiEval多维度评估框架，为分子结构优化与毒性消除研究提供了标准化测试平台。

当前挑战

在领域问题层面，ToxiMol需解决分子毒性修复中保持药效与消除毒性的平衡难题，包括功能基团保留、特定毒性终点消除等复杂需求。数据集构建过程中面临三大核心挑战：毒性机制标注需要融合化学专家知识；分子结构有效性验证依赖RDKit等工具链的精确计算；多模态模型评估需统一文本描述与分子图表征的交互标准。此外，合成可行性评分（SAS）、类药性定量估计（QED）等跨维度指标的同步优化，进一步增加了评估体系的复杂性。

常用场景

经典使用场景

在药物发现与毒理学研究中，ToxiMol数据集为评估多模态大语言模型（MLLMs）在分子结构层面的毒性修复能力提供了标准化测试平台。其经典应用场景包括：研究人员利用该数据集对模型进行系统性验证，通过输入有毒分子结构，要求模型生成结构修饰方案以降低毒性，同时保持药物相似性和合成可行性。这一过程涉及11种毒性修复任务类型，涵盖从致癌性到心脏毒性的广泛毒性机制，为模型在分子优化领域的性能提供了全面评估。

解决学术问题

ToxiMol有效解决了药物化学领域长期存在的关键问题：如何通过计算手段快速识别并修复分子的毒性结构特征。该数据集通过整合560个涵盖11类毒性机制的分子样本，为研究者提供了系统评估模型在保持分子有效性同时消除毒性的能力。其意义在于建立了首个面向结构级分子解毒的基准测试，填补了传统毒性预测与分子生成研究之间的空白，推动了AI在药物安全性优化中的应用发展。

实际应用

在实际药物研发流程中，ToxiMol数据集可显著加速先导化合物优化阶段。制药企业可利用该数据集训练的模型，对候选药物分子进行毒性预测和结构优化，降低后期临床试验失败风险。特别是在规避hERG心脏毒性、肝毒性(DILI)等常见药物警戒问题时，该数据集提供的多维度评估指标能有效指导药物化学家进行结构修饰决策，缩短药物开发周期并降低研发成本。

数据集最近研究