GLOBEM Dataset

arXiv2023-03-05 更新2024-08-06 收录

下载链接：

http://arxiv.org/abs/2211.02733v2

下载链接

链接失效反馈

官方服务：

资源简介：

包含超过700用户年和497个独特用户的数据，这些数据来自移动和可穿戴传感器，以及一系列广泛的福祉指标。该数据集支持对行为建模算法在不同用户和年份间的泛化能力进行多种跨数据集评估。

This dataset contains data covering over 700 user-years and 497 unique users, collected from mobile and wearable sensors as well as a comprehensive suite of well-being metrics. It supports diverse cross-dataset evaluations to assess the generalization capabilities of behavior modeling algorithms across different users and years.

创建时间：

2022-11-05

搜集汇总

数据集介绍

构建方式

在纵向人类行为建模领域，GLOBEM数据集通过为期四年的连续研究构建而成，每年进行为期十周的数据采集。研究招募了497名独特参与者，累计覆盖705人年，通过智能手机应用和可穿戴设备被动收集多模态传感器数据，包括位置、手机使用、通话记录、蓝牙扫描、身体活动和睡眠行为。同时，参与者每周完成简短调查及两次综合性问卷调查，涵盖心理健康、社会福祉等多维度指标，这些自我报告数据作为行为建模的地面真实标签。数据采集过程遵循严格的伦理审查，并采用RAPIDS开源平台进行特征提取，确保了数据的可重复性与一致性。

特点

GLOBEM数据集的核心特点在于其跨年份、跨用户的纵向多模态数据集成，涵盖了广泛的人口统计学多样性，包括性别、种族、移民背景和残障状况的均衡代表。数据集不仅捕捉了日常行为模式，还通过前后COVID-19时期的数据对比，揭示了社会环境变化对行为特征的显著影响。此外，数据集提供了丰富的特征工程处理，包括时间分段聚合、个体化归一化和离散化，以应对数据缺失和分布偏移的挑战。其独特的跨数据集评估框架支持多种泛化任务，如留一数据集出、疫情前后对比和重叠用户分析，为算法鲁棒性验证提供了坚实基础。

使用方法

GLOBEM数据集的使用主要围绕纵向行为建模算法的开发与评估展开。研究人员可利用提供的特征数据和地面真实标签，构建以抑郁检测为代表的心理健康预测模型。数据集支持多种实验设置，包括单数据集内部验证和跨数据集泛化测试，通过平衡准确率等指标评估模型性能。开源平台GLOBEM集成了18种基准算法，为算法比较提供了统一框架。此外，数据集的多维度标签支持扩展至其他行为建模任务，如压力检测、情绪监测和社会孤独感评估。使用过程中需遵循数据共享协议，确保隐私保护，并可通过PhysioNet平台获取凭证访问数据。

背景与挑战

背景概述

GLOBEM数据集由华盛顿大学的研究团队于2022年发布，旨在解决纵向人类行为建模领域缺乏公开、多年度基准数据集的空白。该数据集汇集了2018年至2021年连续四年收集的移动与可穿戴设备传感数据，涵盖497名独特参与者的705人年记录，并整合了广泛的心理健康指标。其核心研究问题聚焦于评估行为建模算法在不同用户与时间跨度上的跨数据集泛化能力，为机器学习社区提供了一个探索可泛化纵向行为模型的开放测试平台，显著推动了泛化时间序列分析在健康监测等实际应用中的发展。

当前挑战

GLOBEM数据集面临的挑战主要体现在两个方面：在领域问题层面，其旨在解决的抑郁症检测等心理健康建模任务具有标签稀疏性、行为模式个体差异大以及时间分布偏移等固有难题，导致现有算法在跨数据集泛化时性能显著下降；在构建过程中，研究团队需应对长期数据采集带来的高缺失率、多源传感器数据同步与标准化处理，以及保护参与者隐私与数据安全的伦理要求，这些因素共同增加了数据集构建的复杂性与技术门槛。

常用场景

经典使用场景

在纵向人类行为建模领域，GLOBEM数据集作为首个跨年度、多模态的公开测试平台，其经典使用场景聚焦于评估行为建模算法的跨数据集泛化能力。通过整合智能手机与可穿戴设备采集的连续传感器数据，该数据集支持研究者针对同一用户在不同年份、不同用户在不同年份等多种交叉验证任务，系统检验模型在时间推移与人群差异下的稳健性。例如，在抑郁症检测任务中，研究者可利用该数据集进行留一数据集出、疫情前后对比等实验设计，深入探究算法在真实世界复杂环境中的适应性。

衍生相关工作

围绕GLOBEM数据集，已衍生出一系列重要的相关研究工作。数据集本身集成了对18种现有算法的基准测试，包括9种传统抑郁症检测算法（如Canzian等人的轨迹分析模型、Saeb等人的逻辑回归模型）和9种深度学习领域泛化算法（如DANN、IRM、Mixup等）。尤为重要的是，基于该数据集提出的Reorder算法，通过自监督的序列重排预训练任务，在跨数据集泛化性能上取得了显著提升。这些工作共同构成了纵向行为建模领域泛化研究的基础框架，并激发了后续在时序表征学习、个性化建模等方面的进一步探索。

数据集最近研究