UniMiB SHAR

Name: UniMiB SHAR
Creator: Università degli Studi di Milano-Bicocca
License: 暂无描述

arXiv2025-09-30 收录

下载链接：

http://www.sal.disco.unimib.it/technologies/unimib-shar/

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集名为UniMiB SHAR，包含了沿三个轴向（X轴、Y轴、Z轴）的加速度值以及加速度的总体幅度，旨在用于人类活动识别。此外，该数据集被用于评估基于加速度数据的卷积神经网络在识别人类活动方面的效率。该数据集的主要任务是进行人类活动识别。

The dataset named UniMiB SHAR contains acceleration values along three axial directions (X-axis, Y-axis, Z-axis) as well as the overall magnitude of acceleration, and is designed for human activity recognition tasks. Furthermore, this dataset is utilized to evaluate the performance of acceleration data-based convolutional neural networks (CNNs) in human activity recognition. The primary task of this dataset is human activity recognition.

提供机构：

Università degli Studi di Milano-Bicocca

搜集汇总

数据集介绍

构建方式

在人类活动识别与跌倒检测领域，数据集的构建需兼顾多样性与标准化。UniMiB SHAR数据集通过精心设计的采集流程，使用三星Galaxy Nexus智能手机内置的BMA220三轴加速度传感器，以50Hz采样率记录加速度数据。采集过程涉及30名年龄介于18至60岁的受试者，其中女性占多数，以弥补现有数据集的性别不平衡。受试者将手机置于前裤袋中，执行9类日常生活活动与8类跌倒动作，每项活动均通过拍手声进行音频标记以辅助精确分段。数据预处理采用3秒窗口围绕加速度峰值进行分割，并利用巴特沃斯低通滤波器去除重力分量，最终生成包含11,771个样本的标准化数据集，每个样本包含151个时间点的三轴加速度值。

特点

UniMiB SHAR数据集的核心特点在于其精细的类别划分与丰富的元数据信息。数据集涵盖17个细粒度类别，包括9类日常生活活动与8类跌倒类型，样本总量达11,771个，其中日常生活活动样本7,579个，跌倒样本4,192个。每个样本均关联受试者的详细属性，如年龄、性别、身高与体重，支持基于多维度标准的样本筛选。数据集的样本分布经过平衡处理，减少了因活动时长差异导致的类别偏差，同时保留了原始未平衡版本供研究使用。此外，数据集通过标准化格式存储，确保加速度数据与标注信息的一致性，为跨研究比较提供了可靠基础。

使用方法

该数据集适用于人类活动识别与跌倒检测算法的开发与评估。研究者可依据实验需求，从四个分类任务中选择相应子集：AF-17涵盖全部17类活动与跌倒的细粒度识别；AF-2专注于跌倒与非跌倒的二分类问题；A-9针对9类日常生活活动的区分；F-8则用于8类跌倒类型的鉴别。数据集支持主体依赖与主体独立的评估策略，前者采用5折交叉验证，后者使用留一主体交叉验证，以检验算法的泛化能力。特征提取可直接使用原始三轴加速度数据或计算信号幅值，结合k近邻、支持向量机、人工神经网络或随机森林等分类器进行模型训练与性能验证。数据集的元数据支持个性化研究，例如基于受试者生理特征的子集分析，有助于探索算法在不同人群中的适应性。

背景与挑战

背景概述

在智能手机与可穿戴设备日益普及的背景下，基于加速度传感器的人类活动识别与跌倒检测成为健康监测领域的研究热点。UniMiB SHAR数据集由意大利米兰比可卡大学信息学、系统与通信系的Daniela Micucci、Marco Mobilio和Paolo Napoletano团队于2016年创建，旨在通过智能手机采集的加速度数据，为日常活动识别与跌倒检测提供高质量的标注数据资源。该数据集聚焦于解决现有公开数据集中样本多样性不足、受试者特征信息缺失等问题，通过纳入30名年龄跨度为18至60岁的受试者，采集了9类日常活动与8类跌倒行为的11,771个样本，并详细记录了受试者的年龄、性别、身高等元数据，为算法个性化评估与跨领域比较提供了坚实基础。其发布显著推动了基于智能手机的感知计算研究，尤其在老年人健康监护与行为分析领域产生了广泛影响。

当前挑战

UniMiB SHAR数据集致力于解决人类活动识别与跌倒检测中的核心挑战：在复杂运动模式中实现高精度分类，尤其是区分细微的跌倒类型。具体而言，数据集的构建面临双重挑战：在领域问题层面，跌倒行为的多样性与个体差异导致分类模型在区分不同跌倒类型时表现显著弱于日常活动识别，例如前向跌倒与保护性策略跌倒的混淆；在构建过程中，需克服受试者招募的局限性，如平衡性别与年龄分布以弥补现有数据集的偏差，同时确保数据采集协议的标准化与安全性，例如在模拟跌倒时使用防护措施。此外，数据预处理中需消除重力干扰并统一采样频率，而样本不平衡问题也要求对原始数据进行筛选以提升数据集质量。

常用场景

经典使用场景

在人类活动识别与跌倒检测领域，UniMiB SHAR数据集凭借其精细标注的加速度数据，成为评估机器学习算法性能的基准工具。该数据集通过智能手机内置传感器采集了30名受试者执行9类日常活动与8类跌倒动作的样本，共计11,771条记录，涵盖了从行走、上下楼梯到前倾跌倒、晕厥等多种场景。其经典应用体现在为研究者提供了标准化的数据源，用于训练和测试分类模型，特别是在区分精细动作类别（如不同类型跌倒）的挑战性任务中，数据集通过5折交叉验证与留一受试者交叉验证方案，系统评估了k近邻、支持向量机等算法的表现，揭示了动作个性化对识别精度的影响。

衍生相关工作

UniMiB SHAR数据集自发布以来，催生了多类经典研究工作，主要集中在算法优化与跨数据集比较领域。例如，研究者利用其细粒度标注探索了深度学习模型（如卷积神经网络）在跌倒细分识别中的性能提升，并针对数据个性化问题提出了自适应学习框架。同时，该数据集常与MobiAct、UMA Fall等公开数据集结合，用于大规模对比分析，以评估不同特征提取方法（如原始数据与信号幅值）在跨设备识别中的稳定性。这些衍生工作不仅推动了人类活动识别领域的算法进步，还促进了标准化评估协议的形成，为后续多模态传感器融合研究提供了参考范式。

数据集最近研究