five

CYP Data Engine

收藏
github2026-03-04 更新2026-03-06 收录
下载链接:
https://github.com/OpenADMET/Octant_CYP_blog_post
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含用于在CYP Data Engine博客文章中重现图形的代码和数据。数据集包括CYP3A4和CYP2J2反应性筛选的原始Echo-MS峰面积、CYP3A4 pIC50值、QC标志和SMILES、CYP3A4抑制DRC拟合的孔级荧光数据、电离比较数据、代谢清除时间过程数据示例、时间依赖性抑制(TDI)测定的拟合剂量-反应曲线、拟合DRC参数、原始DRC测量点以及TDI化合物的pIC50偏移估计等。

This dataset contains code and data for reproducing figures in blog posts hosted on the CYP Data Engine platform. The dataset includes raw Echo-MS peak areas obtained from CYP3A4 and CYP2J2 reactivity screening, CYP3A4 pIC50 values, quality control (QC) flags and corresponding SMILES strings, well-level fluorescence data for CYP3A4 inhibition dose-response curve (DRC) fitting, ionization comparison data, example datasets of metabolic clearance time-course assays, fitted dose-response curves for time-dependent inhibition (TDI) assays, fitted DRC parameters, raw DRC measurement points, and pIC50 offset estimates for TDI compounds.
创建时间:
2026-02-11
原始信息汇总

CYP Data Engine 数据集概述

数据集来源

  • 数据集详情页面地址:https://github.com/OpenADMET/Octant_CYP_blog_post

数据集目的

  • 用于复现CYP Data Engine博客文章中的图表。

数据文件详情

  • reactivity.tsv:CYP3A4和CYP2J2反应性筛选的原始Echo-MS峰面积数据(对照与处理,每个化合物/重复),共19,344行。
  • inhibition.tsv:CYP3A4抑制筛选的pIC50值、QC标志和SMILES,共1,340行。
  • inhibition_wells.tsv:用于CYP3A4抑制剂量反应曲线拟合的孔水平荧光数据,共16,931行。
  • willitfly.tsv:电离比较数据(1 mM氟化铵 vs 5 mM甲酸铵缓冲液),共11,353行。
  • clearance_snippet.tsv:示例代谢清除时间过程数据,共292行。
  • tdi_drc_curves.tsv:时间依赖性抑制(TDI)实验的拟合剂量反应曲线数据,共3,012行。
  • tdi_drc_params.tsv:TDI化合物的拟合剂量反应曲线参数(pIC50、Hill斜率、置信区间),共12行。
  • tdi_drc_points.tsv:TDI化合物的原始剂量反应曲线测量点数据,共144行。
  • tdi_pic50_shift.tsv:TDI化合物的pIC50偏移估计(±预孵育),共6行。
  • inhibition_drc-plots/:用于图3工具提示的剂量反应曲线图像(1,343个PNG文件)。

实验方案

  • CYP反应性实验:通过SCIEX Echo MS+ ZenoTOF 7600进行CYP3A4/CYP2J2反应性筛选。
  • CYP3A4抑制实验:通过荧光读数进行CYP3A4抑制(主动预孵育)实验。
搜集汇总
数据集介绍
main_image_url
构建方式
在药物代谢研究领域,CYP Data Engine数据集的构建依托于严谨的实验流程与标准化协议。该数据集通过CYP3A4/CYP2J2反应性筛选实验与CYP3A4抑制活性预孵育实验生成原始数据,采用SCIEX Echo MS+ ZenoTOF 7600质谱系统与荧光检测技术采集峰值面积与抑制活性读数。实验数据经过系统化整理,以制表符分隔的文本格式存储,涵盖反应性、抑制性、电离比较及时间依赖性抑制等多个维度的测量结果,确保了数据来源的可追溯性与实验条件的一致性。
特点
该数据集在药物代谢酶研究方面展现出多模态与高维度的特点。其核心优势在于整合了反应性筛选、抑制活性测定、电离效率比较及时间依赖性抑制曲线等多类实验数据,提供了从原始峰值到拟合参数的完整数据链条。数据集包含超过数万行记录,不仅囊括了化合物水平的汇总指标,还保留了孔板级别的原始荧光读数与剂量反应曲线图像,为深入分析代谢稳定性、酶抑制机制及化合物结构活性关系提供了丰富的底层信息。
使用方法
研究人员可通过配套的代码与工具链高效利用该数据集。使用前需配置Quarto文档渲染环境、R语言与Python分析栈,并通过renv与uv工具分别恢复R包依赖与同步Python虚拟环境。数据集文件存放于data目录下,用户可运行quarto render命令生成博客版本或笔记本版本的交互式分析报告,从而复现研究中的可视化图表。实验协议文档详细说明了数据生成过程,支持用户基于原始数据开展自定义的代谢动力学建模、剂量反应曲线拟合或交叉实验验证等深度分析。
背景与挑战
背景概述
CYP Data Engine 数据集聚焦于药物代谢酶细胞色素P450(CYP)的研究,该酶系在药物代谢和毒性评估中具有核心地位。该数据集由相关研究团队于近期构建,旨在通过高通量实验数据,系统探究CYP3A4和CYP2J2等关键亚型的反应性与抑制活性。其核心研究问题在于量化化合物与CYP酶的相互作用,为药物早期研发中的代谢稳定性与药物-药物相互作用风险提供数据支撑。这一数据资源的建立,显著增强了计算化学与药物设计领域对代谢性质预测的实证基础,推动了体外高通量筛选与计算模型之间的协同发展。
当前挑战
在领域层面,CYP Data Engine 致力于应对药物代谢预测中化合物-CYP酶相互作用定量化的挑战,尤其是时间依赖性抑制(TDI)等复杂动力学行为的准确表征。数据构建过程中,面临多重技术难题:高通量质谱与荧光检测产生海量原始信号,需精细的数据清洗与归一化以消除实验变异;剂量-反应曲线(DRC)的拟合要求稳健的算法处理非线性响应与噪声干扰;同时,整合多源实验协议(如反应性筛选与抑制测定)需确保数据格式与度量标准的一致性,以实现跨assay的可靠比较与联合分析。
常用场景
经典使用场景
在药物代谢与毒理学领域,CYP Data Engine数据集为评估化合物与细胞色素P450酶的相互作用提供了标准化实验数据。该数据集通过高通量筛选技术,系统性地记录了CYP3A4和CYP2J2的酶活性反应、抑制效应及时间依赖性抑制曲线,为研究人员构建预测模型或验证计算模拟结果奠定了数据基础。其经典应用场景包括药物早期研发阶段的代谢稳定性评估,帮助识别可能因酶抑制而产生药物相互作用的候选分子。
实际应用
在实际药物研发流程中,CYP Data Engine数据集被广泛应用于先导化合物优化与临床前安全性评估。制药企业及研究机构可利用其包含的抑制常数(pIC50)和反应活性数据,快速筛选出代谢特性优良的候选药物,避免因CYP酶抑制导致的潜在毒性或疗效丧失。同时,数据集提供的标准化实验协议与原始测量数据,支持了体外-体内外推模型的校准,助力于更准确地预测人体内的药物清除率,从而加速药物开发进程并降低临床失败风险。
衍生相关工作
基于CYP Data Engine数据集,已衍生出多项经典研究工作,特别是在计算化学与人工智能交叉领域。例如,研究人员利用其酶抑制数据训练了图神经网络模型,用于预测未知化合物对CYP3A4的抑制活性;另有研究结合该数据集的反应动力学参数,开发了基于生理的药代动力学模型,以模拟时间依赖性抑制在体内的动态变化。这些工作不仅拓展了数据集的科学价值,还促进了开源工具包的开发,使得更广泛的研究社区能够进行可重复的代谢预测分析。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作