smartphone-and-smartwatch-activity-and-biometrics-15m6
收藏Hugging Face2025-08-31 更新2025-09-01 收录
下载链接:
https://huggingface.co/datasets/mnemoraorg/smartphone-and-smartwatch-activity-and-biometrics-15m6
下载链接
链接失效反馈官方服务:
资源简介:
这是一个包含156万样本的多设备时间序列语料库,捕捉了51名志愿者在执行18种活动时智能手机和智能手表上的3轴加速度计和陀螺仪读数。每位参与者在佩戴智能手机和智能手表的情况下,每种活动进行三分钟,产生了同步的传感器数据流,采样率为20赫兹。每条记录格式为:- subject-id:唯一标识符(1600-1650)- activity-code:表示18种活动的单个字母代码(A-S,不包括N,例如:走路、刷牙)- timestamp:Unix时间戳(秒)- x, y, z:给定轴的原始传感器值。数据集分为四个目录(phone-acc、phone-gyro、watch-acc、watch-gyro),每个目录包含51个每个参与者的文件。提供了原始数据以及10秒滑动窗口特征向量,可用于活动识别和行为生物特征建模。
This is a multi-device time-series corpus containing 1.56 million samples, which captures 3-axis accelerometer and gyroscope readings from smartphones and smart watches worn by 51 volunteers while they performed 18 distinct activities.
Each participant wore both a smartphone and a smart watch, and completed each activity for 3 minutes, generating synchronized sensor data streams with a sampling rate of 20 Hz.
Each record follows the format:
- subject-id: Unique identifier (ranging from 1600 to 1650)
- activity-code: Single-letter code (A-S, excluding N) representing the 18 activities (e.g., walking, brushing teeth)
- timestamp: Unix timestamp (in seconds)
- x, y, z: Raw sensor values for the respective axes.
The dataset is divided into four directories: phone-acc, phone-gyro, watch-acc and watch-gyro, each of which contains 51 files, one per participant.
Both raw sensor data and 10-second sliding window feature vectors are provided, which can be used for activity recognition and behavioral biometric modeling.
创建时间:
2025-08-30
原始信息汇总
Smartphone and Smartwatch Activity and Biometrics 15m6 数据集概述
基本信息
- 许可证:ecl-2.0
- 任务类别:文本分类、特征提取
- 语言:英语
- 标签:公共、文本、表格、教育、多变量、时间序列
- 数据集名称:Smartphone and Smartwatch Activity and Biometrics 15m6
- 数据规模:100万至1000万样本
数据内容
- 样本数量:1560万
- 数据来源:51名志愿者
- 采集设备:智能手机和智能手表
- 传感器类型:三轴加速度计和陀螺仪
- 采样频率:20 Hz
- 活动类型:18种活动(A-S,排除N),例如行走、刷牙
- 记录格式:
- subject_id:唯一标识符(1600-1650)
- activity_code:单字母代码A-S(排除N)
- timestamp:Unix时间戳(秒)
- x, y, z:原始传感器数值
数据结构
- 目录组织:
- phone_csv/accel/:手机加速度计数据
- phone_csv/gyro/:手机陀螺仪数据
- 数据文件:每个受试者单独文件,共51个文件
- 数据特征:包含原始数据和10秒滑动窗口特征向量
应用场景
- 活动识别
- 行为生物特征建模
数据来源
- 原始数据来源:https://archive.ics.uci.edu/dataset/507/wisdm+smartphone+and+smartwatch+activity+and+biometrics+dataset
搜集汇总
数据集介绍

构建方式
在移动健康监测领域,多模态传感器数据的采集对行为识别研究至关重要。该数据集通过51名受试者佩戴智能手机与智能手表设备,以20Hz采样率同步采集三轴加速度计与陀螺仪数据,每名受试者需完成18类日常活动(如行走、刷牙等),每项活动持续3分钟,最终形成包含1560万条样本的时序数据 corpus。数据按设备类型与传感器类别划分为四个独立目录,原始数据文件采用CSV格式存储,并附带10秒滑动窗口生成的特征向量。
特点
该数据集的核心价值体现在其多设备同步采集架构与精细的元数据标注。所有样本均包含受试者编号、活动类型字母编码、时间戳及三轴传感器数值,活动类别涵盖A至S(排除N)共18种人类日常行为。数据规模达千万级别,且提供原始时序信号与预处理后的特征向量双版本,既支持端到端的深度学习建模,也满足传统机器学习对特征工程的需求。跨设备传感器数据的对齐特性为对比研究提供了天然实验条件。
使用方法
研究者可通过加载四个传感器模态目录下的CSV文件直接访问原始数据,每个文件对应单一受试者的全部记录。对于行为识别任务,建议采用10秒滑动窗口分割时序数据,结合活动标签构建监督学习样本。生物特征识别研究则可利用同一受试者的多活动数据建立身份验证模型。数据集兼容PyTorch或TensorFlow等框架的时序数据加载器,亦可通过pandas进行 exploratory 分析。需注意设备类型差异对模型泛化能力的影响。
背景与挑战
背景概述
随着可穿戴计算技术的迅猛发展,智能手机与智能手表等多模态传感器成为人类日常行为监测的重要工具。该数据集由美国福特汉姆大学无线传感器数据挖掘实验室(WISDM)于2019年创建,旨在通过同步采集51名志愿者在18种日常活动中的加速度计与陀螺仪数据,构建大规模、多设备的时间序列语料库。其核心研究问题聚焦于跨设备行为识别与生物特征建模,为人类活动识别、连续身份认证等领域提供了关键数据支撑,显著推动了感知计算与行为信息学的发展。
当前挑战
该数据集致力于解决多设备环境下人类活动识别与生物特征提取的复杂问题,其挑战体现在传感器异构性、数据同步精度以及个体行为差异性等方面。在构建过程中,研究团队需克服多源设备采样率对齐、运动伪影滤除、大规模数据标注一致性等关键技术难题,同时确保在15.6百万样本规模下数据质量的统一性与时效性。
常用场景
经典使用场景
在移动计算与普适感知研究领域,该数据集为人类活动识别提供了多模态传感器数据支撑。研究者通过智能手机与智能手表的同步加速度计和陀螺仪读数,能够精确建模18种日常活动的运动模式特征,包括行走、刷牙等精细动作的时序变化规律。
解决学术问题
该数据集有效解决了行为生物特征建模中的跨设备协同感知难题,为连续身份认证研究提供了真实多源数据基础。其大规模样本规模与精细标注突破了传统活动识别数据集的规模限制,显著提升了模型在复杂环境下的泛化能力与鲁棒性评估可靠性。
衍生相关工作
基于该数据集衍生的经典研究包括跨设备传感器融合的深度神经网络架构、基于注意力机制的多模态时序建模方法,以及行为生物特征识别中的对抗样本防御方案。这些工作显著推动了可穿戴计算与隐私保护协同发展的研究进程。
以上内容由遇见数据集搜集并总结生成



