five

Drug Combo dataset

收藏
github2025-01-23 更新2025-01-25 收录
下载链接:
https://github.com/langli-lab/drugcombo-data
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了对已发表的抗癌药物组合试验的手动整理数据,数据来源于PubMed搜索的出版物。数据集包括多个CSV文件,如trial.csv、drug.csv等,每个文件都有详细的列描述,如PMID、NCTID、Trial_Type等。

This dataset contains manually curated data from published anti-cancer drug combination trials, sourced from publications retrieved via PubMed searches. The dataset includes multiple CSV files such as trial.csv, drug.csv, and others, each with detailed column descriptions including PMID, NCTID, Trial_Type, and other related fields.
创建时间:
2025-01-21
原始信息汇总

数据集概述

数据集名称

Drug Combo dataset

数据来源

数据集来源于PubMed搜索的出版物。

数据文件

数据集包含以下文件:

  • trial.csv:包含试验的一般信息,如PMID、试验注册号、癌症亚型、试验招募标准等。
  • drug.csv:包含试验中使用的药物信息,如药物名称、配方、给药途径等。
  • schema.csv:包含试验的统计设计信息。
  • dlt_definition.csv:包含试验中剂量限制性毒性(DLT)的定义。
  • dose_level.csv:包含详细的剂量设计信息。
  • mtd.csv:包含最大耐受剂量(MTD)信息。
  • observed_dlt.csv:包含出版物中报告的DLT信息。

数据字典

trial.csv

列名 描述
PMID PubMed唯一标识符。文件可以通过PMID链接
NCTID 注册ID,通常为NCT ID(clinicaltrials.gov)
Trial_Type 指示是单药试验还是药物组合试验。由数据整理者分配
protocol 是否提供了详细的试验方案
population 试验涉及的癌症亚型
Trial_Inclusion 试验纳入标准
Trial_Exclusion 试验排除标准
DLT_EVA DLT评估的时间窗口
comments 数据整理者提供的附加信息

drug.csv

列名 描述
PMID PubMed唯一标识符。文件可以通过PMID链接
NCTID 注册ID,通常为NCT ID(clinicaltrials.gov)
CombnID 用于区分同一试验中的多个药物组合或药物剂量的随机数
Drug_Name 药物名称(如品牌名、通用名或内部名称)
Admin_Route 给药途径。i.v. - 静脉注射 sc - 皮下注射
Dose_Form 药物配方
comments 数据整理者提供的附加信息

schema.csv

列名 描述
PMID PubMed唯一标识符。文件可以通过PMID链接
NCTID 注册ID,通常为NCT ID(clinicaltrials.gov)
ES Escalation - 从低剂量开始并增加剂量<br>De-escalation - 从高剂量开始并减少剂量
DesignType 统计设计方法
schema 如何达到最大剂量

dlt_definition.csv

列名 描述
PMID PubMed唯一标识符。文件可以通过PMID链接
NCTID 注册ID,通常为NCT ID(clinicaltrials.gov)
CombnID 用于区分同一试验中的多个药物组合或药物剂量的随机数
DLT_Name 剂量限制性毒性术语或表达
Grade DLT的严重程度
Duration 不良药物事件(ADE)发生的时间及其持续时间
DLT_Exculsion 是否应将该DLT_Name排除在DLT之外
comments 数据整理者提供的附加信息

dose_level.csv

列名 描述
PMID PubMed唯一标识符。文件可以通过PMID链接
NCTID 注册ID,通常为NCT ID(clinicaltrials.gov)
CombnID 用于区分同一试验中的多个药物组合或药物剂量的随机数
Drug_Name 药物名称(如品牌名、通用名或内部名称)
Dose_Level 用于区分同一试验中不同剂量的标识符
Dose_Vaule 剂量数值
Dose_Unit 剂量单位
Frequency 药物在一天或一周内使用的次数
Schedule 药物在一个周期或一周内给药的天数
comments 数据整理者提供的附加信息

mtd.csv

列名 描述
NCTID 注册ID,通常为NCT ID(clinicaltrials.gov)
CombnID 用于区分同一试验中的多个药物组合或药物剂量的随机数
Drug_Name 药物名称(如品牌名、通用名或内部名称)
MTD_Value 剂量数值
MTD_Uint 剂量单位
Frequency 药物在一天或一周内使用的次数
Schedule 药物在一个周期或一周内给药的天数
comments 数据整理者提供的附加信息

observed_dlt.csv

列名 描述
PMID PubMed唯一标识符。文件可以通过PMID链接
NCTID 注册ID,通常为NCT ID(clinicaltrials.gov)
CombnID 用于区分同一试验中的多个药物组合或药物剂量的随机数
DLT 参与者发生的DLT
Grade DLT的严重程度
Duration DLT持续的时间
At_level 参与者发生DLT时的剂量
Observed_Frequency 发生DLT的参与者数量
Total 特定剂量下的参与者总数
Occurence DLT发生的具体日期
comments 数据整理者提供的附加信息
combined_dose_info 从dose_lvel.csv映射的详细剂量信息

许可证

该数据集采用MIT许可证

引用

如果使用该数据集,请引用以下文献:

Lei Wang, Lai Wei, Shijun Zhang, Lijun Cheng, Aditi Shendre, Williams Carson, James L. Chen, Dwight Owen, Megan Gregory, Lang Li; An Informatics Bridge to Improve the Design and Efficiency of Phase I Clinical Trials for Anticancer Drug Combinations. Cancer Research Communications 2 September 2022; 2 (9): 929–936. https://doi.org/10.1158/2767-9764.CRC-22-0160

联系方式

如有任何问题,请联系Lei Wang,邮箱:Lei.Wang2@osumc.edu。

搜集汇总
数据集介绍
main_image_url
构建方式
Drug Combo数据集的构建基于PubMed中发表的I期抗癌药物试验文献的手工整理。数据整理遵循详细的指南,确保从文献中提取的关键数据元素(如剂量水平、药物组合信息等)准确无误。通过PMID标识符,数据集中的多个文件可以相互关联,形成一个完整的试验信息网络。
使用方法
使用Drug Combo数据集时,研究者可以通过PMID标识符将多个文件进行关联,从而获取完整的试验信息。数据集中的每个文件都提供了详细的列描述,便于用户理解和使用。例如,trial.csv文件包含试验的基本信息,drug.csv文件记录药物信息,而dlt_definition.csv则详细描述了剂量限制性毒性的定义。通过结合这些文件,研究者可以进行药物组合疗效与毒性的深入分析。
背景与挑战
背景概述
Drug Combo数据集由Lei Wang等研究人员于2022年创建,旨在通过系统整理已发表的I期抗癌药物临床试验数据,推动抗癌药物组合的研发与优化。该数据集的核心研究问题聚焦于药物组合的剂量限制性毒性(DLT)和最大耐受剂量(MTD)的评估,为临床试验设计提供了重要的数据支持。其数据来源主要为PubMed中的相关文献,涵盖了试验设计、药物信息、剂量水平及毒性事件等多维度信息。该数据集的发布为抗癌药物组合研究领域提供了宝贵的资源,显著提升了临床试验设计的效率与科学性。
当前挑战
Drug Combo数据集在构建与应用过程中面临多重挑战。首先,数据来源的多样性与文献格式的不一致性增加了数据整理的难度,尤其是在提取剂量水平、毒性定义等关键信息时,需依赖人工校对与标准化处理。其次,药物组合试验的复杂性使得数据整合与分析更具挑战性,例如不同试验设计的统计方法差异可能导致数据可比性降低。此外,数据集在应用过程中还需解决数据完整性与一致性问题,以确保其在药物研发中的实际效用。这些挑战不仅影响了数据集的构建效率,也对后续的数据分析与模型开发提出了更高的要求。
常用场景
经典使用场景
Drug Combo数据集在抗癌药物组合的早期临床试验研究中扮演了关键角色。该数据集通过整合来自PubMed的已发表I期临床试验数据,为研究人员提供了一个全面的药物组合试验信息库。数据集中的文件如trial.csv和drug.csv详细记录了试验的基本信息和药物使用情况,而schema.csv和dlt_definition.csv则提供了试验设计和剂量限制性毒性(DLT)的定义,使得研究人员能够深入分析药物组合的安全性和有效性。
解决学术问题
Drug Combo数据集解决了抗癌药物组合研究中数据分散、难以整合的问题。通过系统化的数据整理和标准化,该数据集为研究人员提供了一个统一的平台,用于分析不同药物组合的剂量反应关系、毒性特征以及最大耐受剂量(MTD)。这不仅加速了药物组合的筛选过程,还为优化临床试验设计提供了数据支持,显著提升了抗癌药物研发的效率。
实际应用
在实际应用中,Drug Combo数据集被广泛用于指导抗癌药物组合的临床试验设计。通过分析数据集中的剂量水平和毒性数据,研究人员能够更准确地预测药物组合的安全性和疗效,从而优化试验方案。此外,该数据集还为药物监管机构提供了重要的参考依据,帮助评估新药组合的潜在风险和收益,推动抗癌药物的快速审批和上市。
数据集最近研究
最新研究方向
近年来,抗癌药物组合的临床试验数据在药物研发领域引起了广泛关注。Drug Combo数据集通过系统整理已发表的I期抗癌药物试验数据,为研究人员提供了宝贵的资源。该数据集不仅涵盖了药物剂量、给药途径、剂量限制性毒性(DLT)等关键信息,还详细记录了试验设计和患者招募标准。这些数据为药物组合的剂量优化、毒性评估以及临床试验设计提供了重要参考。特别是在精准医疗和个体化治疗日益受到重视的背景下,该数据集为探索药物组合的协同效应和安全性提供了新的研究视角。此外,随着人工智能和机器学习技术在药物研发中的应用日益广泛,该数据集也为开发预测模型和优化算法提供了丰富的数据基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作