HAROOD

Name: HAROOD
Creator: 威廉与玛丽学院
Published: 2025-12-12 00:52:50
License: 暂无描述

arXiv2025-12-12 更新2025-12-13 收录

下载链接：

https://github.com/AIFrontierLab/HAROOD

下载链接

链接失效反馈

官方服务：

资源简介：

HAROOD是由独立研究员与威廉与玛丽学院联合构建的传感器人类活动识别基准数据集，涵盖6个公开时序传感器数据集，支持跨人、跨位置、跨设备和跨时间四种分布偏移场景的评估。数据集通过整合多源传感器数据（如加速度计、陀螺仪等），构建了包含16种对比方法和两种模型选择协议的测试平台，总数据量未明确披露但覆盖多样化真实场景。其采用模块化设计实现数据标准化处理，重点解决活动识别模型在未知环境下的泛化性能退化问题，为医疗监测、智能家居等领域的鲁棒算法开发提供评估基础。

HAROOD is a benchmark dataset for sensor-based human activity recognition, jointly constructed by independent researchers and the College of William & Mary. It covers six publicly available time-series sensor datasets and supports evaluation across four distribution shift scenarios: cross-subject, cross-location, cross-device, and cross-time. The dataset integrates multi-source sensor data (e.g., accelerometers, gyroscopes, etc.) and builds a testbed with 16 comparative methods and two model selection protocols. The total data volume is not explicitly disclosed, but the dataset covers diverse real-world scenarios. It adopts a modular design to achieve data standardization, focusing on addressing the generalization performance degradation of activity recognition models in unknown environments, and provides an evaluation foundation for the development of robust algorithms in fields such as medical monitoring and smart home.

提供机构：

威廉与玛丽学院

创建时间：

2025-12-12

原始信息汇总

HAROOD 数据集概述

数据集简介

HAROOD 是一个用于研究基于传感器的人类活动识别（HAR）中泛化问题的模块化、可复现的基准测试框架。它统一了预处理流程，标准化了四个现实的分布外（OOD）场景，并实现了涵盖CNN和Transformer架构的16种代表性算法。

核心特性

数据集：包含6个公开的HAR数据集。
OOD场景：支持5种现实的分布外泛化场景（跨人、跨位置、跨数据集、跨时间、跨设备）。
算法：实现了16种泛化算法。
模型骨干：支持CNN和Transformer架构。
数据划分：提供标准化的训练/验证/测试集划分。
可扩展性：易于扩展新的数据集和算法。

数据集获取与结构

数据下载地址：https://huggingface.co/datasets/AIFrontierLab/HAROODdata
数据结构：下载并解压后，数据集文件夹应包含 x.npy（窗口化传感器数据，形状为 (N, T, C)）和 y.npy（每个窗口的标签，包括活动类别、位置标签和传感器类型标签）文件。

支持的算法

数据操纵

Mixup
DDLearn

表征学习

ERM
DANN
CORAL
MMD
VREx
LAG

学习策略

MLDG
RSC
GroupDRO
ANDMask
Fish
Fishr
URM
ERM++

项目结构

harood/ │── alg/ # 16种OOD方法 │── network/ # CNN & Transformer 模型 │── datautil/ # 数据集加载器 │── analys/ # 性能分析

使用方法

通过YAML配置文件运行。
通过Python字典配置运行。
支持在运行时覆盖配置参数（如学习率、最大训练轮数）。

扩展指南

添加新算法：在 alg/algs 目录下添加文件，实现包含 __init__、update、predict 方法的类，并进行注册。
添加新数据集：遵循标准预处理流程（统一滑动窗口分割、生成 x.npy 和 y.npy 文件、保存至指定结构目录），并在 util.py 中注册数据集。

致谢

本工具借鉴了 DomainBed 和 DeepDG 的工作，并进行了简化和功能增强。

搜集汇总

数据集介绍

构建方式

在传感器数据驱动的行为识别领域，分布偏移问题长期制约着模型的泛化能力。为系统评估算法在真实场景中的鲁棒性，HAROOD数据集通过整合六个公开可用的时序传感器数据集，构建了一个覆盖多维度分布偏移的综合性基准。其构建过程首先对原始数据进行滑动窗口分割与归一化预处理，随后依据四种典型偏移场景——跨个体、跨位置、跨数据集与跨时间——将数据划分为不同的域。每个场景均模拟了实际部署中可能遇到的分布差异，例如跨个体场景通过随机划分受试者形成独立域，跨位置场景则利用同一数据集中不同佩戴位置的传感器数据作为独立域，从而在统一框架下实现了对分布偏移的系统化建模与评估。

使用方法

研究者可通过HAROOD提供的统一代码库，便捷地开展分布外泛化实验。使用前需配置实验参数，如指定算法类型、骨干网络、批次大小与学习率等，随后调用训练接口即可自动完成数据加载、模型训练与评估全流程。该框架支持对四种偏移场景的任意组合进行测试，并允许用户自定义超参数搜索空间以优化模型性能。实验结束后，系统将输出各算法在目标域上的平均准确率及排名，同时提供混淆矩阵、特征可视化等分析工具，助力深入理解算法行为。用户亦可遵循模块化设计规范，轻松集成新的数据集或算法，以拓展基准的覆盖范围与评估能力。

背景与挑战

背景概述

传感器基人体活动识别（HAR）作为普适计算与健康监测的核心技术，其模型在现实部署中常因个体差异、设备异构、环境变迁及时间漂移等因素遭遇分布偏移问题，导致性能显著下降。为系统评估分布外（OOD）泛化方法在HAR领域的有效性，独立研究员Wang Lu、Yao Zhu与威廉玛丽学院的Jindong Wang于2018年共同提出了HAROOD基准。该基准整合了六个公开时序传感器数据集，并定义了跨人、跨位置、跨数据集与跨时间四类现实分布偏移场景，旨在通过统一的实验框架全面检验OOD算法的泛化能力。HAROOD的建立填补了该领域缺乏标准化评估体系的空白，为后续研究提供了可复现、可扩展的测试平台，显著推动了鲁棒性人体活动识别系统的发展。

当前挑战

HAROOD基准致力于解决传感器基人体活动识别中的分布外泛化难题，其核心挑战体现在两方面：在领域问题层面，模型需克服由个体生理特征、传感器佩戴位置、数据采集设备及时序非平稳性引发的复杂分布偏移，确保在未知场景下的稳定识别性能；在构建过程中，研究团队面临多源数据集异构整合、四类偏移场景的合理定义、十六种对比算法在CNN与Transformer架构上的公平实现，以及训练域验证与Oracle选择两种模型评估协议的设计等挑战。这些挑战共同构成了一个全面而严谨的基准测试环境，为OOD-HAR方法的深入探索与性能提升奠定了坚实基础。

常用场景

经典使用场景

在传感器人类活动识别领域，分布外泛化是模型部署的核心挑战，HAROOD数据集通过整合六个公开传感器数据集并定义四种现实分布偏移场景，为算法评估提供了标准化测试平台。该数据集最经典的使用场景在于系统性地评估不同OOD算法在跨人、跨位置、跨数据集和跨时间场景下的泛化性能，研究者可基于统一代码库对比十六种算法在CNN与Transformer架构上的表现，从而揭示算法在不同偏移模式下的鲁棒性边界。

解决学术问题

HAROOD数据集解决了传感器人类活动识别中分布偏移评估体系缺失的关键学术问题。传统研究常局限于单一偏移场景或私有数据集，导致算法比较缺乏一致性与可复现性。该数据集通过构建多场景基准，首次系统回答了OOD算法在HAR领域的必要性、最优算法选择及架构适配性等核心问题，其意义在于推动领域从零散验证转向标准化评估范式，为分布不变特征学习、元学习策略等研究方向提供了可量化的进步标尺。

实际应用

在实际应用层面，HAROOD数据集直接服务于医疗监护、智能家居、运动追踪等需要高鲁棒性活动识别系统的场景。例如在老年人跌倒检测中，模型需克服用户生理差异、设备佩戴位置变化及长期使用带来的传感器漂移问题。该数据集通过模拟真实分布偏移，帮助开发者筛选出在跨设备、跨用户场景下保持稳定的算法，从而降低模型在新环境中的部署风险，提升穿戴式设备在动态场景中的实用性与可靠性。

数据集最近研究