TILES-2018 Sleep Benchmark Dataset

Name: TILES-2018 Sleep Benchmark Dataset
Creator: 南加州大学维特比工程学院
Published: 2025-07-04 20:16:52
License: 暂无描述

arXiv2025-07-04 更新2025-07-09 收录

下载链接：

https://tiles-data.isi.edu/

下载链接

链接失效反馈

官方服务：

资源简介：

TILES-2018 Sleep Benchmark 数据集是一个纵向可穿戴睡眠数据集，收集了139名医院员工在10周内的睡眠记录，包含超过6000个独特的睡眠记录。数据集还包括参与者自我报告的调查数据，涉及睡眠质量、压力和焦虑等测量。该数据集为研究睡眠行为建模提供了宝贵的资源，支持了自然环境中使用可穿戴传感器进行睡眠研究。

The TILES-2018 Sleep Benchmark Dataset is a longitudinal wearable sleep dataset. It compiles sleep records from 139 hospital employees across a 10-week period, encompassing over 6,000 unique sleep recordings. Additionally, the dataset includes self-reported survey data from the participants, covering measurements such as sleep quality, stress, and anxiety. This dataset serves as a valuable resource for sleep behavior modeling research, supporting sleep studies using wearable sensors in naturalistic environments.

提供机构：

南加州大学维特比工程学院

创建时间：

2025-07-04

搜集汇总

数据集介绍

构建方式

TILES-2018睡眠基准数据集通过纵向研究设计，采用Fitbit Charge 2可穿戴设备连续采集139名医院工作人员为期10周的睡眠数据。研究团队通过严格的招募流程筛选全职医护人员，在入组阶段收集人口统计学资料，并通过标准化问卷获取匹兹堡睡眠质量指数(PSQI)等主观睡眠评估。数据采集过程采用多模态方法，同步记录心率变异性、睡眠阶段划分及元数据，最终形成包含6,012条高质量睡眠记录的数据集。

特点

该数据集的核心价值在于其真实场景下的纵向睡眠监测特性，包含光电容积图(PPG)连续心率数据、设备标注的睡眠阶段(清醒、浅睡、深睡、REM)及详细的元数据记录。区别于实验室环境下的睡眠研究，该数据捕获了医护人员在轮班工作制下的自然睡眠模式，尤其包含22.3%的夜班工作者数据。数据集特别标注了5,178条高完整性记录(含90%以上心率数据及完整睡眠阶段)，为研究昼夜节律失调提供了独特资源。

使用方法

研究者可利用该数据集开展三类核心任务：基于LSTM或TimesNet等时序模型进行睡眠阶段分类；通过随机森林等算法预测PSQI睡眠质量评分；分析人口统计学特征与睡眠模式的关联性。数据集已预分割为训练集(TILES-2018)和测试集(TILES-2018 Sleep Benchmark)，支持端到端模型验证。使用时需注意设备固有误差，建议结合Shap等可解释性工具分析特征重要性，并考虑通过集成学习方法提升预测性能。

背景与挑战

背景概述

TILES-2018睡眠基准数据集由南加州大学的研究团队于2018年创建，旨在通过可穿戴设备在自然生活环境中研究睡眠行为。该数据集收集了139名医院工作人员长达10周的睡眠数据，包括超过6,000条独特的睡眠记录和自评睡眠质量调查。数据集的核心研究问题聚焦于医疗工作者的睡眠模式分析，特别是轮班工作对睡眠质量的影响。该数据集因其纵向设计和真实环境数据采集，在睡眠研究和医疗健康领域具有重要影响力，为理解轮班工作者的睡眠障碍提供了宝贵资源。

当前挑战

TILES-2018数据集面临的主要挑战包括：1) 在领域问题方面，医疗工作者的轮班制度导致睡眠模式高度不规则，增加了睡眠阶段分类和行为建模的复杂性；2) 在数据构建过程中，可穿戴设备（如Fitbit Charge 2）的精度限制，特别是在睡眠阶段分类上的误差，以及数据丢失和噪声问题，对数据质量提出了挑战。此外，缺乏每日细粒度的自评睡眠质量数据也限制了模型训练的精度。

常用场景

经典使用场景

在医疗健康与行为科学研究领域，TILES-2018睡眠基准数据集为探索轮班工作对睡眠模式的影响提供了独特视角。该数据集通过可穿戴设备连续采集医院工作人员10周的自然睡眠数据，结合匹兹堡睡眠质量指数（PSQI）等主观评估，成为分析昼夜节律紊乱、睡眠阶段转换及职业压力相关睡眠障碍的黄金标准。其超过6,000条睡眠记录尤其适用于研究ICU护士等高风险群体的睡眠碎片化问题，填补了传统多导睡眠图（PSG）在真实场景中长期监测的空白。

解决学术问题

该数据集显著解决了三大核心学术问题：一是验证了轮班制（尤其是夜班）与睡眠质量下降的量化关联，通过心率变异性与睡眠阶段数据证实夜班工作者REM睡眠减少19.9%至18.4%（p<0.01）；二是建立了可穿戴设备数据与临床睡眠评估的桥梁，其Fitbit Charge 2采集的PPG信号与PSQI评分结合，为无创睡眠监测算法提供了验证基准；三是揭示了职业因素（如ICU工作环境）对睡眠连续性的影响，通过5,178条高质量睡眠记录量化了不同科室工作人员的睡眠效率差异，推动了个性化睡眠干预策略的研究。

衍生相关工作

该数据集催生了多个标志性研究：其一为Feng等人开发的3层LSTM睡眠阶段分类模型（宏F1 0.529），其混淆矩阵成为后续研究的基准对比框架；其二催生了跨模态分析范式，如结合环境传感器数据探究ICU噪音与睡眠中断的关联；其三推动了BioMistral等医疗大语言模型的零样本测试，尽管其PSQI预测仅0.284 F1，但揭示了生理信号与NLP结合的挑战。值得注意的是，基于该数据集的随机森林特征分析（SHAP值）重新定义了睡眠预测中时序特征与人口统计特征的权重分配标准。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集