DT_Lung_Demo_Data
收藏Hugging Face2025-07-31 更新2025-08-01 收录
下载链接:
https://huggingface.co/datasets/SageLabUHN/DT_Lung_Demo_Data
下载链接
链接失效反馈官方服务:
资源简介:
数字肺双胞胎演示数据集,包含四个临床体外人肺案例的演示数据,数据类型涵盖肺生理学、生物化学、X射线图像衍生特征、蛋白质标记物、转录组标记物以及每呼吸时间序列数据。
创建时间:
2025-07-26
原始信息汇总
数据集概述
基本信息
- 数据集名称: Digital Twins of Ex Vivo Human Lungs Demo Dataset
- 许可证: CC-BY-NC-ND-4.0
- 语言: 英语 (en)
- 模型仓库: Published Models
- 项目仓库: Digital Twin of Ex Vivo Human Lungs Project
- 更新时间: 2025年7月
数据集内容
- 数据来源: 四个临床离体人类肺案例的演示数据
- 数据类型: 多模态数据,包括肺生理学、生物化学、X射线图像衍生特征、蛋白质标记、转录组标记和每次呼吸的时间序列数据
数据集结构
配置文件
-
1st Hour per-breath Data
- 特征:
- Case ID (int64)
- Breath Number (string)
- Dynamic Compliance (mL/cmH₂O) (float64)
- Mean Airway Pressure (cmH₂O) (float64)
- Peak Airway Pressure (cmH₂O) (float64)
- Expiratory Volume (mL) (float64)
- 训练集:
- 大小: 10564字节
- 样本数: 200
- 特征:
-
2nd Hour per-breath Data
- 特征: 同1st Hour per-breath Data
- 训练集: 同1st Hour per-breath Data
-
3rd Hour per-breath Data
- 特征: 同1st Hour per-breath Data
- 训练集: 同1st Hour per-breath Data
-
Hourly Lung Function Data
- 特征:
- Case ID (int64)
- Parameter (string)
- 1st Hour (float64)
- 2nd Hour (float64)
- 3rd Hour (float64)
- 训练集:
- 大小: 5524字节
- 样本数: 92
- 特征:
-
Lung Image Data
- 特征:
- Case ID (int64)
- Xray PC# (string)
- 1st Hour (float64)
- 3rd Hour (float64)
- 训练集:
- 大小: 1644字节
- 样本数: 40
- 特征:
-
Protein Data
- 特征:
- Case ID (int64)
- Protein (string)
- 1st Hour (float64)
- 90 Minutes (float64)
- 110 Minutes (float64)
- 2nd Hour (float64)
- 130 Minutes (float64)
- 150 Minutes (float64)
- 3rd Hour (float64)
- 训练集:
- 大小: 1436字节
- 样本数: 16
- 特征:
-
Transcriptomics Data
- 特征:
- Case ID (int64)
- Pathway (string)
- Pre-perfusion (float64)
- Post-perfusion (float64)
- 训练集:
- 大小: 11272字节
- 样本数: 208
- 特征:
文件结构
DT_Lung_Demo_Data/ ├── DT Lung Demo Case 1.xlsx ├── DT Lung Demo Case 2.xlsx ├── DT Lung Demo Case 3.xlsx ├── DT Lung Demo Case 3.xlsx
下载方式
-
推荐方式: python from huggingface_hub import snapshot_download dataset_dir = snapshot_download( repo_id="SageLabUHN/DT_Lung_Demo_Data", repo_type="dataset", local_dir="DT_Lung/Data" )
-
手动下载:
- 点击Excel文件并下载
- 将文件放置在"work_dir/DT_Lung/Data"目录下
使用目的
- 测试研究中的推理流程和演示
- 展示数字孪生建模的数据结构
- 复现示例
注意事项
- 不适用于模型训练或临床决策
- 禁止商业用途
搜集汇总
数据集介绍

构建方式
在呼吸系统医学研究领域,DT_Lung_Demo_Data数据集通过精心设计的实验方案构建而成。该数据集采集了四个离体人类肺器官案例的多维度数据,采用分时段连续监测策略,以Excel文件为载体结构化存储。数据收集过程严格遵循临床研究规范,涵盖呼吸力学参数、蛋白质标记物、转录组学特征等多模态信息,每个案例独立存储并采用分页签形式区分不同数据类型。
特点
该数据集展现了显著的跨模态特性,整合了呼吸生理学、生物化学和影像学等多源数据。其核心价值在于提供分钟级精度的呼吸力学时序记录,包括动态顺应性、气道压力等关键指标,同时配套X射线影像特征和分子水平标记物数据。数据采用分层存储结构,既包含原始监测值也提供标准化处理后的衍生变量,为数字孪生建模提供多维参考。
使用方法
研究人员可通过HuggingFace Hub的snapshot_download接口实现自动化下载,或手动下载Excel文件至指定目录。数据集主要支持数字孪生模型的推理流程验证,建议配合官方提供的Colab演示环境使用。使用时应严格遵循CC-BY-NC-SA 4.0许可协议,禁止将数据用于商业用途或临床决策。数据加载后需按照案例ID进行索引,不同模态数据通过Excel工作簿的分页签实现逻辑隔离。
背景与挑战
背景概述
DT_Lung_Demo_Data数据集由SageLabUHN团队于2025年发布,作为离体人类肺数字孪生项目的重要组成部分。该数据集旨在为研究人员提供多模态临床数据,涵盖肺生理学、生物化学、X射线图像衍生特征、蛋白质标记物、转录组学标记物以及每呼吸时间序列数据。其核心研究问题聚焦于如何通过数字孪生技术精确模拟离体人类肺的功能状态,为器官移植评估和呼吸系统疾病研究提供量化工具。该数据集的建立标志着计算生物学与临床医学的深度交叉融合,为复杂器官系统的数字化建模设立了新的基准。
当前挑战
该数据集面临的主要挑战体现在两个维度:在领域问题层面,如何从高维度异质性数据中提取有效特征以构建精准的肺功能预测模型,这涉及动态顺应性、气道压力等复杂生理参数的时序关联分析;在构建过程中,多源数据的时间分辨率不一致(如每小时呼吸数据与分钟级蛋白标记数据)导致时序对齐困难,同时X射线图像特征与分子标记数据的跨模态融合也面临特征空间异构性的技术瓶颈。
常用场景
经典使用场景
在呼吸医学与数字孪生技术交叉领域,DT_Lung_Demo_Data数据集通过提供离体人类肺部多模态生理数据,为构建高保真肺部数字孪生模型提供了基准测试平台。其逐次呼吸记录的动态顺应性、气道压力等时间序列指标,被广泛用于验证机械通气模拟算法的精确性,尤其在评估不同通气策略对肺泡复张效果的影响研究中具有不可替代的价值。
实际应用
在临床前研究中,该数据集支持呼吸治疗设备的算法优化,特别是用于测试智能通气系统对异常呼吸波形的识别能力。医疗机构借助其标准化的X射线影像特征数据,可快速验证新型肺功能评估工具在急性呼吸窘迫综合征早期诊断中的效能。
衍生相关工作
基于该数据集衍生的代表性研究包括《基于多模态融合的离体肺动态特性预测》等系列论文,这些工作构建了从分子标记到器官功能的跨尺度预测模型。在IEEE Transactions on Biomedical Engineering等期刊上,研究者利用该数据集开发了结合图神经网络与生理方程的新型数字孪生架构。
以上内容由遇见数据集搜集并总结生成



