DiaTrend
收藏arXiv2023-04-04 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2304.06506v1
下载链接
链接失效反馈官方服务:
资源简介:
DiaTrend数据集由穿戴式医疗设备产生的密集纵向数据组成,包括来自54名糖尿病患者的27,561天连续血糖监测数据和8,220天胰岛素泵数据。该数据集有助于开发新的分析解决方案,以减轻糖尿病患者疾病负担,并增加对门诊慢性病管理的知识。
The DiaTrend Dataset consists of dense longitudinal data generated by wearable medical devices, including 27,561 days of continuous glucose monitoring data and 8,220 days of insulin pump data from 54 diabetic patients. This dataset facilitates the development of novel analytical solutions to alleviate the disease burden of diabetic patients and enhance the understanding of outpatient chronic disease management.
创建时间:
2023-04-04
搜集汇总
数据集介绍

构建方式
在糖尿病管理领域,连续血糖监测仪和胰岛素泵等先进技术正逐步改变临床护理标准,但相关数字数据的开放获取仍面临挑战。DiaTrend数据集的构建依托两项独立研究:一项聚焦于开发糖尿病自我管理的计算工具,另一项评估针对年轻1型糖尿病患者的数字干预措施。研究团队从54名1型糖尿病患者中收集了回顾性设备数据,通过第三方应用程序下载并整合了总计27,561天的连续血糖监测数据和8,220天的胰岛素泵数据。所有参与者均签署知情同意书,授权将其数据开放给更广泛的研究社区使用,确保了数据来源的合规性与伦理性。
特点
DiaTrend数据集在糖尿病研究领域展现出独特的价值,其核心特征体现在数据规模与多样性上。该数据集涵盖了来自54名患者的长期纵向数据,平均每位患者提供510天的连续血糖监测记录和152天的胰岛素泵数据,时间跨度从31天至1885天不等。数据内容不仅包括每5分钟采样的血糖值,还整合了胰岛素泵的基底与推注剂量、碳水化合物摄入日志以及胰岛素-碳水化合物比率等关键参数。此外,数据集附有详细的人口统计学和临床特征信息,如年龄、性别、种族及糖化血红蛋白水平,为多维度分析提供了坚实基础。这种高粒度的时间序列数据与丰富临床背景的结合,为探索血糖控制模式、设备使用依从性及个性化治疗策略创造了条件。
使用方法
为促进糖尿病数据驱动研究的进展,DiaTrend数据集通过Synapse平台向科研人员开放访问,并设立了规范的使用流程。研究者需首先注册Synapse账户并完成认证用户验证,随后提交数据使用意图声明,并同意相关使用条款。这些条款强调保护参与者隐私,禁止任何形式的身份再识别行为,要求数据保持机密与安全,且不得用于商业广告或直接联系参与者。在学术成果中,使用者需明确致谢数据贡献者及本研究论文。数据集以Excel文件格式存储,每位受试者单独成文件,包含连续血糖监测、胰岛素推注及部分患者的基底输注数据表,便于直接导入分析工具进行血糖预测、不良事件检测或行为模式挖掘等研究任务。
背景与挑战
背景概述
随着连续血糖监测仪和胰岛素泵等先进糖尿病管理技术的普及,实时监测与治疗数据为糖尿病研究提供了前所未有的机遇。然而,临床级设备产生的客观数字数据在开源领域极为稀缺,严重阻碍了数据驱动解决方案的开发。在此背景下,由达特茅斯学院等机构的研究人员于2023年创建的DiaTrend数据集应运而生,旨在通过整合54名1型糖尿病患者长达27,561天的连续血糖监测数据和8,220天的胰岛素泵数据,为糖尿病管理中的关键问题,如血糖预测、不良事件预警及胰岛素输送算法优化,提供大规模、高质量的纵向数据资源。该数据集不仅推动了糖尿病个体化治疗的研究,也为慢性病门诊管理的知识积累与技术创新奠定了坚实基础。
当前挑战
DiaTrend数据集致力于解决糖尿病管理领域内数据驱动分析的若干核心挑战,包括血糖水平的精准预测、未告知餐食的检测以及个性化胰岛素输送算法的开发。这些挑战的复杂性源于血糖动态的个体差异性与多重影响因素的交织。在数据集构建过程中,研究人员面临数据对齐的难题,即连续血糖监测数据与胰岛素泵数据之间存在时间序列上的不完全同步,部分源于胰岛素泵存储容量限制导致的回顾性数据缺失。此外,数据集中存在人口统计学不平衡现象,例如种族以白人为主、年龄分布偏向年轻群体,这反映了现实世界中先进糖尿病技术获取与使用的差异,可能影响算法模型的泛化能力。
常用场景
经典使用场景
在糖尿病管理领域,连续血糖监测与胰岛素泵数据的融合为开发精准预测模型提供了关键资源。DiaTrend数据集以其大规模纵向数据特性,常被用于构建血糖水平预测算法,研究者利用其时间序列数据训练机器学习模型,以提前预判患者血糖波动趋势。这种应用不仅验证了数据驱动的健康管理可行性,更为个性化治疗方案的制定奠定了实证基础。
解决学术问题
该数据集有效解决了糖尿病研究中临床级设备数据稀缺的核心难题。通过提供长达数万天的同步监测记录,它使学者能够深入探究血糖异常事件的发生机制,并开发低血糖预警系统。其多维数据特征支持对未申报餐食的自动检测研究,同时为胰岛素输送算法的优化提供了真实世界验证场景,显著推进了闭环人工胰腺系统的研发进程。
衍生相关工作
该数据集催生了多项标志性研究,例如基于神经生理模型的血糖预测框架和用于不良血糖事件预测的循环神经网络架构。在行为分析方向,学者利用其探索了节假日期间血糖控制的时间模式。此外,针对设备依从性缺失数据的建模研究,以及面向糖尿病管理的交互式可视化系统开发,都成为该领域备受关注的经典工作。
以上内容由遇见数据集搜集并总结生成



