five

lendt_adults_2024

收藏
Hugging Face2026-04-15 更新2026-04-16 收录
下载链接:
https://huggingface.co/datasets/josefheidler/lendt_adults_2024
下载链接
链接失效反馈
官方服务:
资源简介:
lendt_adults_2024 数据集包含健康成年人佩戴于大腿的加速度计数据(SENS motion,12.5 Hz,±4 g),并附有视频标注的活动真实标签。数据集覆盖了实验室协议和约1小时的自由活动标注数据,共涉及35名实验室参与者和32名自由活动参与者。数据经过标准化处理,每个原始加速度计样本对应一行数据,并以1 Hz的活动标签进行标注。数据集适用于从大腿佩戴的加速度计信号预测活动类型(22类或简化的5类)的人类活动识别(HAR)任务。数据集包含6.9百万个样本,其中40%(2.76百万)被标注。每个样本包含三轴加速度数据(acc_x, acc_y, acc_z)、时间戳、活动标签和条件(实验室或自由活动)。数据集采用CC-BY-4.0许可,可通过HuggingFace加载。
创建时间:
2026-04-14
原始信息汇总

lendt_adults_2024 数据集概述

基本信息

  • 数据集名称: lendt_adults_2024
  • 完整名称: Lendt et al. 2024 — thigh-worn accelerometry, healthy adults
  • 许可证: CC-BY-4.0
  • 语言: 英语
  • 任务类别: 表格分类、其他
  • 规模类别: 1M < n < 10M
  • 标签: 加速度测量、可穿戴设备、人类活动识别、时间序列分类、大腿佩戴、身体活动、运动行为、时间序列

数据来源与协议

  • 原始论文: Lendt C. et al. (2024). Thigh-worn accelerometry: a comparative study of two no-code classification methods for identifying physical activity types. IJBNPA 21:77. DOI: 10.1186/s12966-024-01627-1
  • 原始数据: Zenodo 记录 12704412 (https://zenodo.org/records/12704412)
  • 参与者: 招募38人(30.8 ± 9.6岁,53%女性);实验室环境纳入35人,自由生活环境纳入32人。
  • 传感器: SENS motion(SENS Innovation, Denmark)。三轴加速度计,±4 g,固定采样率12.5 Hz。通过粘性贴片佩戴于右大腿外侧,膝盖外侧上10厘米处。
  • 实验室协议: 每名受试者约46分钟,涵盖14个子条件(每个3-5分钟),包括6种活动类型(站立;坐;仰卧/lie[supine]、侧卧/lie[side]、俯卧/lie[prone];跑步机步行0.5 / 0.8 / 1.2 m·s⁻¹;跑步机跑步1.8 / 2.3 / 2.8 m·s⁻¹;自行车测力计50 W/40 rpm, 75 W/60 rpm, 100 W/80 rpm)。子条件之间的转换和等待期未标记。
  • 自由生活协议: 每名受试者约60分钟不受限制的活动(鼓励骑自行车),全程进行视频标注。
  • 队列范围标记参考: 61.3小时(26.8小时实验室 + 34.6小时自由生活)。

数据模式与内容

  • 时间戳: 所有时间戳均包含时区信息(欧洲/柏林,记录地当地时间)。
  • 数据格式: 数据集已从原始Zenodo版本统一为每个受试者的parquet文件,每行代表一个原始加速度计样本,并通过asof-join关联了1 Hz的活动标签。
  • 数据行: 共690万样本,其中40%(276万)被标记。每个受试者的标记比例从约17%到75%不等。
  • 数据列:
    • subject: 字符串类型,匿名化别名,例如 happy-otter
    • timestamp: 时间戳类型(纳秒精度,欧洲/柏林时区),约80毫秒的节奏(12.5 Hz)。
    • acc_x: float64类型,前大腿ActiPASS坐标系,单位 = g。
    • acc_y: float64类型,前大腿ActiPASS坐标系,单位 = g。
    • acc_z: float64类型,前大腿ActiPASS坐标系,单位 = g。
    • activity: 字符串类型(可为空),活动标签;对于任何标记窗口之外的样本,此值为空。
    • condition: 字符串类型(可为空),laboratory | free-living;当activity为空时,此值也为空。

活动标签词汇表(22个值)

  • 仅实验室环境(12个标签——受控强度/姿势): bicycle[fast], bicycle[moderate], bicycle[slow], lie[supine], lie[prone], lie[side], run[fast], run[moderate], run[slow], walk[fast], walk[moderate], walk[slow]
  • 仅自由生活环境(8个标签——非受控变体): bicycle[pedalling-seated], bicycle[pedalling-standing], bicycle[coasting], lie, run, shuffle, stairs, walk
  • 两种环境共有: sit, stand
  • 论文合并类别: 论文将这些标签合并为5个分析类别:久坐、站立、步行、跑步、骑行。

坐标系与数据转换

  • 输出坐标系: 数据已转换为前大腿ActiPASS坐标系,这是大腿佩戴加速度测量的标准约定。
  • 物理传感器位置: 传感器实际佩戴于右大腿外侧
  • 转换步骤: 原始SENS原生数据经过两次校正转换为输出坐标系:1. 对所有轴取反;2. 绕x轴旋转90°。
  • 重力方向: 在安静站立时,重力在+x轴上约为+1 g。

使用目的与评估

  • 主要用途: 用于基于大腿佩戴加速度测量的人类活动识别,即从acc_x/y/z信号预测activity(22类或合并的5类)。
  • 标准评估协议: 鉴于有35名受试者,标准评估方案是留一受试者交叉验证:在34人上训练,在1人上测试,重复进行。应避免随机行级分割,以防止跨折叠泄露时间和受试者层面的上下文信息。

加载方式

  • 文件结构: 每个受试者存储为harmonized/目录下的独立parquet文件。文件名是匿名化别名(例如happy-otter.parquet, clever-lynx.parquet)。

  • 加载全部受试者: python from datasets import load_dataset ds = load_dataset("josefheidler/lendt_adults_2024") df = ds["train"].to_pandas()

  • 加载单个受试者: python import pandas as pd df = pd.read_parquet("hf://datasets/josefheidler/lendt_adults_2024/harmonized/happy-otter.parquet")

引用

bibtex @article{lendt2024thigh, author = {Lendt, Christoph and others}, title = {Thigh-worn accelerometry: a comparative study of two no-code classification methods for identifying physical activity types}, journal = {International Journal of Behavioral Nutrition and Physical Activity}, volume = {21}, pages = {77}, year = {2024}, doi = {10.1186/s12966-024-01627-1} }

搜集汇总
数据集介绍
main_image_url
构建方式
在可穿戴传感与人类活动识别领域,lendt_adults_2024数据集的构建体现了严谨的实验设计。该数据集采集了35名健康成年人在实验室环境及32名参与者在自由生活场景下的数据。实验采用SENS motion三轴加速度计,以12.5赫兹的采样频率固定于参与者右大腿外侧。实验室阶段包含站立、坐、卧、不同速度的步行与跑步以及不同功率的骑行等14种子条件,每项持续3至5分钟。自由生活阶段则鼓励参与者进行包括骑行在内的无限制活动,时长约一小时。所有活动的真实标签均通过视频记录与人工标注获得,实验室数据通过自定义应用记录时间戳,自由生活数据则由单一评分者使用ELAN软件进行逐帧标注,并经过严格的评分者间一致性检验。原始数据从Zenodo平台获取后,经过坐标轴转换与格式统一处理,最终以每位参与者独立的Parquet文件形式发布。
特点
该数据集的核心特征在于其高质量、多场景的标注数据与标准化的数据表示。数据集总计包含约690万个加速度计样本,其中40%的样本带有精确到秒的活动标签,涵盖了实验室受控条件与自由生活自然场景,为模型泛化能力评估提供了坚实基础。数据采用标准化的“前大腿ActiPASS坐标系”表示,确保了与同类大腿佩戴加速度计数据集的一致性,便于跨研究数据融合。标签体系设计精细,共包含22个活动类别,实验室条件区分了活动强度(如walk[slow]),自由生活则记录了更自然的活动变体(如bicycle[pedalling-standing])。数据集中明确区分了标注样本与未标注的过渡时段,研究者可通过筛选轻松获取纯净的监督学习数据。
使用方法
该数据集主要应用于基于大腿佩戴加速度计的人类活动识别任务。典型的使用方法是利用加速度计三轴信号(acc_x, acc_y, acc_z)预测对应的活动标签。鉴于数据来源于多个独立个体,为规避数据泄露并评估模型的个性化泛化能力,推荐采用留一受试者交叉验证作为标准评估协议。数据加载灵活便捷,可通过Hugging Face的`datasets`库一次性加载所有参与者的数据,亦可使用pandas单独或批量读取每位参与者的Parquet文件。进行模型训练前,建议先过滤掉`activity`列为空值的行,以仅保留带有真实标签的样本。研究者可根据需要,将原始的22类标签按照论文建议的方案,合并为久坐、站立、步行、跑步、骑行这五个分析大类进行研究。
背景与挑战
背景概述
在可穿戴传感与人类活动识别领域,大腿佩戴式加速度计因其能够精确捕捉下肢运动模式而备受关注。lendt_adults_2024数据集由Christoph Lendt等人于2024年构建并发布,其核心研究问题聚焦于通过大腿佩戴的加速度数据,实现精细化的体力活动类型识别。该数据集采集了35名健康成年人在实验室与自由生活场景下的三轴加速度数据,并辅以视频标注的真实活动标签,旨在为开发无需编码的分类方法提供高质量基准。作为国际期刊《International Journal of Behavioral Nutrition and Physical Activity》的配套数据资源,该数据集推动了可穿戴传感在行为营养与体力活动研究中的应用,为算法验证与跨研究比较奠定了重要基础。
当前挑战
该数据集致力于解决人类活动识别中,基于大腿佩戴加速度计进行多类别体力活动分类的挑战。具体而言,其需要区分包括站立、坐姿、躺卧、步行、跑步和骑行在内的多种活动类型,并进一步辨识不同强度或姿态变体,例如不同速度的步行或不同卧姿。在数据构建过程中,研究团队面临多重挑战:首先,需确保传感器数据与视频标注时间的高精度同步,通过脚跟敲击等物理事件实现毫秒级对齐;其次,原始传感器数据位于侧大腿位置且坐标系与标准框架不一致,必须经过复杂的坐标变换,统一至前大腿ActiPASS标准框架以保障数据可比性;此外,自由生活场景下的活动标注依赖单一评分者进行逐帧视频分析,尽管通过部分视频的双重编码验证了较高的一致性,但标注过程依然耗时且需严格控制主观偏差。
常用场景
经典使用场景
在可穿戴传感与人类活动识别领域,lendt_adults_2024数据集为基于大腿佩戴加速度计的活动分类研究提供了标准化的基准。该数据集最经典的使用场景是开发与评估机器学习模型,特别是用于时间序列分类任务,以从三轴加速度信号中自动识别如站立、坐姿、行走、跑步和骑行等日常活动。研究通常采用留一受试者交叉验证协议,确保模型泛化能力,避免因个体差异或时间依赖性导致的数据泄露,从而在实验室与自由生活场景下验证算法的鲁棒性与准确性。
衍生相关工作
围绕该数据集已衍生出多项经典研究工作,主要集中在比较不同无代码分类方法在活动识别任务中的性能,如原始研究论文中探讨的基于阈值的启发式算法与机器学习方法。后续研究常利用该数据集作为基准,测试深度学习方法如卷积神经网络或长短时记忆网络在时间序列分类上的有效性。此外,该数据集常被用于多数据集融合研究,与其他大腿佩戴加速度数据集结合,以构建更通用、稳健的活动识别模型,推动了领域内模型迁移学习与跨数据集验证方法的发展。
数据集最近研究
最新研究方向
在可穿戴传感与人类活动识别领域,lendt_adults_2024数据集凭借其大腿佩戴加速度计采集的高质量视频标注数据,正推动着算法泛化能力与个性化建模的前沿探索。研究焦点集中于利用其包含实验室与自由生活场景的独特设计,开发能够跨越不同环境与个体差异的鲁棒性识别模型。该数据集支持对坐、站、行走、跑步、骑行等基本活动及其强度变体的精细分类,促进了基于深度学习的时序分类方法在真实世界健康监测中的应用。相关热点事件包括将此类传感器数据整合至数字健康平台,以支持慢性病管理与公共卫生干预,其影响在于为行为营养与体力活动研究提供了标准化、可复现的基准数据源,加速了从受控实验到日常行为分析的范式转变。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作