TILES-2018 Sleep Benchmark Dataset
收藏arXiv2025-07-04 更新2025-07-09 收录
下载链接:
https://tiles-data.isi.edu/
下载链接
链接失效反馈官方服务:
资源简介:
TILES-2018 Sleep Benchmark 数据集是一个纵向可穿戴睡眠数据集,收集了139名医院员工在10周内的睡眠记录,包含超过6000个独特的睡眠记录。数据集还包括参与者自我报告的调查数据,涉及睡眠质量、压力和焦虑等测量。该数据集为研究睡眠行为建模提供了宝贵的资源,支持了自然环境中使用可穿戴传感器进行睡眠研究。
The TILES-2018 Sleep Benchmark Dataset is a longitudinal wearable sleep dataset. It compiles sleep records from 139 hospital employees across a 10-week period, encompassing over 6,000 unique sleep recordings. Additionally, the dataset includes self-reported survey data from the participants, covering measurements such as sleep quality, stress, and anxiety. This dataset serves as a valuable resource for sleep behavior modeling research, supporting sleep studies using wearable sensors in naturalistic environments.
提供机构:
南加州大学维特比工程学院
创建时间:
2025-07-04
搜集汇总
数据集介绍

构建方式
TILES-2018睡眠基准数据集通过纵向研究设计,采用Fitbit Charge 2可穿戴设备连续采集139名医院工作人员为期10周的睡眠数据。研究团队通过严格的招募流程筛选全职医护人员,在入组阶段收集人口统计学资料,并通过标准化问卷获取匹兹堡睡眠质量指数(PSQI)等主观睡眠评估。数据采集过程采用多模态方法,同步记录心率变异性、睡眠阶段划分及元数据,最终形成包含6,012条高质量睡眠记录的数据集。
特点
该数据集的核心价值在于其真实场景下的纵向睡眠监测特性,包含光电容积图(PPG)连续心率数据、设备标注的睡眠阶段(清醒、浅睡、深睡、REM)及详细的元数据记录。区别于实验室环境下的睡眠研究,该数据捕获了医护人员在轮班工作制下的自然睡眠模式,尤其包含22.3%的夜班工作者数据。数据集特别标注了5,178条高完整性记录(含90%以上心率数据及完整睡眠阶段),为研究昼夜节律失调提供了独特资源。
使用方法
研究者可利用该数据集开展三类核心任务:基于LSTM或TimesNet等时序模型进行睡眠阶段分类;通过随机森林等算法预测PSQI睡眠质量评分;分析人口统计学特征与睡眠模式的关联性。数据集已预分割为训练集(TILES-2018)和测试集(TILES-2018 Sleep Benchmark),支持端到端模型验证。使用时需注意设备固有误差,建议结合Shap等可解释性工具分析特征重要性,并考虑通过集成学习方法提升预测性能。
背景与挑战
背景概述
TILES-2018睡眠基准数据集由南加州大学的研究团队于2018年创建,旨在通过可穿戴设备在自然生活环境中研究睡眠行为。该数据集收集了139名医院工作人员长达10周的睡眠数据,包括超过6,000条独特的睡眠记录和自评睡眠质量调查。数据集的核心研究问题聚焦于医疗工作者的睡眠模式分析,特别是轮班工作对睡眠质量的影响。该数据集因其纵向设计和真实环境数据采集,在睡眠研究和医疗健康领域具有重要影响力,为理解轮班工作者的睡眠障碍提供了宝贵资源。
当前挑战
TILES-2018数据集面临的主要挑战包括:1) 在领域问题方面,医疗工作者的轮班制度导致睡眠模式高度不规则,增加了睡眠阶段分类和行为建模的复杂性;2) 在数据构建过程中,可穿戴设备(如Fitbit Charge 2)的精度限制,特别是在睡眠阶段分类上的误差,以及数据丢失和噪声问题,对数据质量提出了挑战。此外,缺乏每日细粒度的自评睡眠质量数据也限制了模型训练的精度。
常用场景
经典使用场景
在医疗健康与行为科学研究领域,TILES-2018睡眠基准数据集为探索轮班工作对睡眠模式的影响提供了独特视角。该数据集通过可穿戴设备连续采集医院工作人员10周的自然睡眠数据,结合匹兹堡睡眠质量指数(PSQI)等主观评估,成为分析昼夜节律紊乱、睡眠阶段转换及职业压力相关睡眠障碍的黄金标准。其超过6,000条睡眠记录尤其适用于研究ICU护士等高风险群体的睡眠碎片化问题,填补了传统多导睡眠图(PSG)在真实场景中长期监测的空白。
解决学术问题
该数据集显著解决了三大核心学术问题:一是验证了轮班制(尤其是夜班)与睡眠质量下降的量化关联,通过心率变异性与睡眠阶段数据证实夜班工作者REM睡眠减少19.9%至18.4%(p<0.01);二是建立了可穿戴设备数据与临床睡眠评估的桥梁,其Fitbit Charge 2采集的PPG信号与PSQI评分结合,为无创睡眠监测算法提供了验证基准;三是揭示了职业因素(如ICU工作环境)对睡眠连续性的影响,通过5,178条高质量睡眠记录量化了不同科室工作人员的睡眠效率差异,推动了个性化睡眠干预策略的研究。
衍生相关工作
该数据集催生了多个标志性研究:其一为Feng等人开发的3层LSTM睡眠阶段分类模型(宏F1 0.529),其混淆矩阵成为后续研究的基准对比框架;其二催生了跨模态分析范式,如结合环境传感器数据探究ICU噪音与睡眠中断的关联;其三推动了BioMistral等医疗大语言模型的零样本测试,尽管其PSQI预测仅0.284 F1,但揭示了生理信号与NLP结合的挑战。值得注意的是,基于该数据集的随机森林特征分析(SHAP值)重新定义了睡眠预测中时序特征与人口统计特征的权重分配标准。
以上内容由遇见数据集搜集并总结生成



