lendt_adults_2024
收藏lendt_adults_2024 数据集概述
基本信息
- 数据集名称: lendt_adults_2024
- 完整名称: Lendt et al. 2024 — thigh-worn accelerometry, healthy adults
- 许可证: CC-BY-4.0
- 语言: 英语
- 任务类别: 表格分类、其他
- 规模类别: 1M < n < 10M
- 标签: 加速度测量、可穿戴设备、人类活动识别、时间序列分类、大腿佩戴、身体活动、运动行为、时间序列
数据来源与协议
- 原始论文: Lendt C. et al. (2024). Thigh-worn accelerometry: a comparative study of two no-code classification methods for identifying physical activity types. IJBNPA 21:77. DOI: 10.1186/s12966-024-01627-1
- 原始数据: Zenodo 记录 12704412 (https://zenodo.org/records/12704412)
- 参与者: 招募38人(30.8 ± 9.6岁,53%女性);实验室环境纳入35人,自由生活环境纳入32人。
- 传感器: SENS motion(SENS Innovation, Denmark)。三轴加速度计,±4 g,固定采样率12.5 Hz。通过粘性贴片佩戴于右大腿外侧,膝盖外侧上10厘米处。
- 实验室协议: 每名受试者约46分钟,涵盖14个子条件(每个3-5分钟),包括6种活动类型(站立;坐;仰卧/
lie[supine]、侧卧/lie[side]、俯卧/lie[prone];跑步机步行0.5 / 0.8 / 1.2 m·s⁻¹;跑步机跑步1.8 / 2.3 / 2.8 m·s⁻¹;自行车测力计50 W/40 rpm, 75 W/60 rpm, 100 W/80 rpm)。子条件之间的转换和等待期未标记。 - 自由生活协议: 每名受试者约60分钟不受限制的活动(鼓励骑自行车),全程进行视频标注。
- 队列范围标记参考: 61.3小时(26.8小时实验室 + 34.6小时自由生活)。
数据模式与内容
- 时间戳: 所有时间戳均包含时区信息(欧洲/柏林,记录地当地时间)。
- 数据格式: 数据集已从原始Zenodo版本统一为每个受试者的parquet文件,每行代表一个原始加速度计样本,并通过asof-join关联了1 Hz的活动标签。
- 数据行: 共690万样本,其中40%(276万)被标记。每个受试者的标记比例从约17%到75%不等。
- 数据列:
subject: 字符串类型,匿名化别名,例如happy-otter。timestamp: 时间戳类型(纳秒精度,欧洲/柏林时区),约80毫秒的节奏(12.5 Hz)。acc_x: float64类型,前大腿ActiPASS坐标系,单位 = g。acc_y: float64类型,前大腿ActiPASS坐标系,单位 = g。acc_z: float64类型,前大腿ActiPASS坐标系,单位 = g。activity: 字符串类型(可为空),活动标签;对于任何标记窗口之外的样本,此值为空。condition: 字符串类型(可为空),laboratory|free-living;当activity为空时,此值也为空。
活动标签词汇表(22个值)
- 仅实验室环境(12个标签——受控强度/姿势):
bicycle[fast],bicycle[moderate],bicycle[slow],lie[supine],lie[prone],lie[side],run[fast],run[moderate],run[slow],walk[fast],walk[moderate],walk[slow]。 - 仅自由生活环境(8个标签——非受控变体):
bicycle[pedalling-seated],bicycle[pedalling-standing],bicycle[coasting],lie,run,shuffle,stairs,walk。 - 两种环境共有:
sit,stand。 - 论文合并类别: 论文将这些标签合并为5个分析类别:久坐、站立、步行、跑步、骑行。
坐标系与数据转换
- 输出坐标系: 数据已转换为前大腿ActiPASS坐标系,这是大腿佩戴加速度测量的标准约定。
- 物理传感器位置: 传感器实际佩戴于右大腿外侧。
- 转换步骤: 原始SENS原生数据经过两次校正转换为输出坐标系:1. 对所有轴取反;2. 绕x轴旋转90°。
- 重力方向: 在安静站立时,重力在+x轴上约为+1 g。
使用目的与评估
- 主要用途: 用于基于大腿佩戴加速度测量的人类活动识别,即从
acc_x/y/z信号预测activity(22类或合并的5类)。 - 标准评估协议: 鉴于有35名受试者,标准评估方案是留一受试者交叉验证:在34人上训练,在1人上测试,重复进行。应避免随机行级分割,以防止跨折叠泄露时间和受试者层面的上下文信息。
加载方式
-
文件结构: 每个受试者存储为
harmonized/目录下的独立parquet文件。文件名是匿名化别名(例如happy-otter.parquet,clever-lynx.parquet)。 -
加载全部受试者: python from datasets import load_dataset ds = load_dataset("josefheidler/lendt_adults_2024") df = ds["train"].to_pandas()
-
加载单个受试者: python import pandas as pd df = pd.read_parquet("hf://datasets/josefheidler/lendt_adults_2024/harmonized/happy-otter.parquet")
引用
bibtex @article{lendt2024thigh, author = {Lendt, Christoph and others}, title = {Thigh-worn accelerometry: a comparative study of two no-code classification methods for identifying physical activity types}, journal = {International Journal of Behavioral Nutrition and Physical Activity}, volume = {21}, pages = {77}, year = {2024}, doi = {10.1186/s12966-024-01627-1} }




