T1D Semi-Supervised Change Point Detection Benchmark
收藏T1D Semi-Supervised Change Point Detection Benchmark
数据集元数据
| 属性 | 值 |
|---|---|
| 名称 | T1D Semi-Supervised Change Point Detection Benchmark |
| URL | https://github.com/Blood-Glucose-Control/t1d-change-point-detection-benchmark |
| sameAs | https://github.com/Blood-Glucose-Control/t1d-change-point-detection-benchmark |
| 描述 | |
| 引用 | |
| 许可证 |
数据目录结构
1. data/raw
包含直接从 simglucose 模拟器生成的数据。
特征:
- 每位患者的持续时间:90天
- 30名患者(10名成人,10名儿童和10名青少年)
- 来源:Jinyu Xie. Simglucose v0.2.1 (2018)
- 参考:https://github.com/jxx123/simglucose
2. data/processed
包含从 data/raw 派生的处理数据。
文件命名约定
模式:{patientNum}_{cgmName}_{insulinPumpName}_{startDate}_{endDate}.csv
示例:ado001_Dexcom_Cozmo_2024-02-01_2024-04-30
| 组件 | 描述 | 示例 |
|---|---|---|
| patientNum | 患者名称的前3个和后3个字符的连接 | ado001 (adolescent#001) |
| cgmName | CGM设备名称 | Dexcom |
| insulinPumpName | 胰岛素泵设备名称 | Cozmo |
| startDate | 生成数据的第一天 | 2024-02-01 |
| endDate | 生成数据的最后一天 | 2024-04-30 |
3. data/obfuscated
包含从 data/processed 派生的混淆数据,以模拟人类行为。
文件命名约定
模式:{patientNum}_{cgmName}_{insulinPumpName}_{startDate}_{endDate}_{loggingBehaviour}_{loggingTiming}.csv
示例:ado001_Dexcom_Cozmo_2024-02-01_2024-04-30_all_normal.csv
| 组件 | 描述 | 示例 |
|---|---|---|
| patientNum | 患者名称的前3个和后3个字符的连接 | ado001 (adolescent#001) |
| cgmName | CGM设备名称 | Dexcom |
| insulinPumpName | 胰岛素泵设备名称 | Cozmo |
| startDate | 生成数据的第一天 | 2024-02-01 |
| endDate | 生成数据的最后一天 | 2024-04-30 |
日志行为类型
| 文件名指示符 | 类型 | 描述 | 分布 |
|---|---|---|---|
| all | 所有餐食 | 记录每餐 | 20% |
| top2 | 每天多次餐食 | 记录1-2次最大餐食(平均每天1.8次记录) | 25% |
| once | 每天一次 | 仅记录最大餐食 | 20% |
| weekly | 每周几次 | 不规则记录(平均每周3次记录) | 20% |
| none | 从不 | 无记录 | 15% |
注意:分布百分比可能会更改
日志时间模式
| 文件名指示符 | 模式 | 描述 | 分布 |
|---|---|---|---|
| late | 左偏 | 健忘的记录者(伽马分布) | 38% |
| early | 右偏 | 匆忙的记录者(伽马分布) | 23% |
| average | 正态分布 | 以餐食开始时间为中心 | 28% |
| punctual | 不变 | 在餐食开始时准确记录 | 11% |
注意:分布百分比可能会更改
注意:伽马/分布的参数可能会更改
伽马/正态分布的日志时间
每个图表包含50条随机生成的曲线
平均记录者:

迟记录者:

早记录者:

安装
可以使用 pip 安装包:
bash pip install t1d-cpd-benchmark
使用
该包提供了三个主要函数来加载不同类型的数据:
load_raw_data(): 加载原始CGM数据load_processed_data(): 加载处理后的CGM数据load_obfuscated_data(): 加载混淆的CGM数据
每个函数都可以通过索引加载单个患者的数据或加载所有患者的数据。
示例
python from t1d_cpd_benchmark.datasets import load_raw_data, load_processed_data, load_obfuscated_data
加载第一个患者的原始数据
load_raw_data 的索引可以是 0 到 29
data = load_raw_data(index=0) print(data.head())
加载第一个患者的处理数据
load_processed_data 的索引可以是 0 到 179
data = load_processed_data(index=0) print(data.head())
加载第一个患者的混淆数据
load_obfuscated_data 的索引可以是 0 到 59
data = load_obfuscated_data(index=0) print(data.head())
加载所有患者的数据
返回所有患者数据的连接 DataFrame
all_data = load_raw_data()
数据类型
- 原始数据: 原始CGM测量值
- 处理数据: 清洗和预处理的CGM数据
- 混淆数据: 匿名的CGM数据
许可证
该项目采用 MIT 许可证 - 详情请参阅 LICENSE 文件。




