ABCi_data
收藏github2025-09-05 更新2025-09-06 收录
下载链接:
https://github.com/ruthkeogh/ABCi_data
下载链接
链接失效反馈官方服务:
资源简介:
ABCi是一个基准因果推断数据集,包含基于2型糖尿病患者的时变治疗、混杂因素和结果的模拟数据。数据集以R数据文件ABCi_data.RData形式提供,包含数据生成代码和使用示例代码
ABCi is a benchmark causal inference dataset comprising simulated data focused on time-varying treatments, confounders, and outcomes derived from patients with type 2 diabetes mellitus. The dataset is provided as the R data file ABCi_data.RData, which includes both the data generation code and example usage code.
创建时间:
2025-08-18
原始信息汇总
ABCi数据集概述
数据集名称
ABCi: A benchmark causal inference data set
数据集描述
基于2型糖尿病患者模拟的时变治疗、混杂因素和结果的基准因果推断数据集。
数据文件
- ABCi_data.RData(R数据文件)
相关代码文件
数据生成
- ABCi_data_generate.R(数据生成代码)
数据描述
- data_descriptives.R(生成数据描述性信息)
应用示例
- master_Q1.R(示例问题1的分析实现文件)
- 示例问题2、3、4的类似代码即将发布
参考文献
基于论文草案《A benchmark causal inference (ABCi) data set: simulated data on time-varying treatments, confounders and outcomes based on patients with type 2 diabetes》(作者:Ruth Keogh, Nan van Geloven, Daniala Weir)
搜集汇总
数据集介绍

构建方式
在因果推断研究领域,ABCi数据集通过模拟2型糖尿病患者的临床轨迹构建而成。其生成过程依托于R脚本ABCi_data_generate.R,该脚本基于真实疾病进展机制,采用时间序列模型动态生成治疗变量、时变混杂因子和临床结局指标。数据生成严格遵循因果图框架,确保治疗暴露与结局变量间的关联反映真实世界中的复杂因果关系,同时通过参数化控制实现数据可重现性。
特点
该数据集的核心价值在于同时包含时变治疗变量、多维度混杂因子和纵向结局指标,完美契合因果推断中边际结构模型和逆概率加权方法的应用需求。数据采用RData格式存储,包含数千名患者的完整治疗史和临床指标序列,且每个变量均附带详细的元数据描述。其独特之处在于严格遵循非参数结构方程模型生成机制,既保留真实临床数据的复杂性,又具备仿真数据的透明生成逻辑。
使用方法
研究人员可通过加载ABCi_data.RData文件直接获取结构化数据集,配合data_descriptives.R脚本可快速生成变量分布和时序特征的描述性统计。针对具体因果问题,参考master_Q1.R等示例代码可实现边际结构模型、逆概率加权和g公式等先进因果分析方法的完整实现。数据集设计支持多种分析流程验证,包括时间依赖性混杂控制、治疗策略对比和敏感性分析,为评估不同因果推断方法提供标准化基准。
背景与挑战
背景概述
因果推断作为统计学与流行病学交叉领域的核心方法论,其验证需依托高质量基准数据集。ABCi_data由伦敦卫生与热带医学院Ruth Keogh团队于2025年创建,专注于模拟2型糖尿病患者在时变治疗、混杂因素与结局变量间的复杂因果路径。该数据集通过精确复现真实临床场景的数据生成机制,为评估边际结构模型、结构嵌套模型等先进因果推断方法的性能提供标准化测试平台,显著推进了医疗决策科学化进程。
当前挑战
数据集着力解决时变治疗场景下因果效应估计的三大核心挑战:一是存在时变混杂因素时传统回归方法产生的偏倚问题,二是治疗决策与历史结局变量间反馈循环导致的识别复杂性,三是长期追踪数据中不可避免的截断与缺失机制。在构建过程中,团队需通过医学文献系统量化生物标志物演变规律,设计多参数联合分布模型保持变量间临床合理性,并利用逆概率加权技术确保数据生成过程符合因果图理论要求。
常用场景
经典使用场景
在因果推断研究领域,ABCi数据集通过模拟2型糖尿病患者的时序治疗数据,为评估时变处理效应估计方法提供了标准化测试平台。研究者可借助该数据集验证边际结构模型、结构嵌套模型等方法的有效性,特别是在存在时变混杂变量的复杂场景下,系统检验不同因果推断技术的性能表现与稳定性。
衍生相关工作
基于ABCi数据集已衍生出多项因果推断前沿研究,包括时变加权模型的改进、双重稳健估计量的优化以及机器学习和因果推断的融合应用。这些工作显著提升了动态治疗效应估计的精度与鲁棒性,推动了因果人工智能在医疗健康领域的方法论创新与实证研究进展。
数据集最近研究
最新研究方向
在因果推断领域,ABCi数据集作为模拟2型糖尿病患者时间变化治疗、混杂因素和结果的基准数据,正推动动态治疗策略与纵向 confounding 控制的前沿探索。该数据集支持边际结构模型和结构嵌套模型的实证比较,为观察性研究中时变暴露的因果效应估计提供验证平台。其高度可控的生成机制已成为评估新兴因果发现算法鲁棒性的热点工具,特别是在医疗人工智能领域,为个性化治疗方案的因果验证奠定了方法论基础。
以上内容由遇见数据集搜集并总结生成



