five

wanfall

收藏
Hugging Face2025-10-28 更新2025-10-29 收录
下载链接:
https://huggingface.co/datasets/simplexsigil2/wanfall
下载链接
链接失效反馈
官方服务:
资源简介:
WanFall是一个大规模的合成活动识别数据集,专注于跌倒检测和相关日常生活活动。数据集包含约12,000个视频剪辑,每个视频剪辑都有密集的时间段注释。视频是计算机生成的,并展示了在受控虚拟环境中执行各种活动的人类演员。数据集包括16个活动类别,包括动态动作和静态状态。数据分为80%的训练、10%的验证和10%的测试集,默认随机分割(种子42)。存储库分为“标签”和“分割”目录,包含CSV文件,其中包含每个分割的时间段注释和视频路径。数据集用英文描述,README没有提供中文描述。

WanFall is a large-scale synthetic activity recognition dataset focused on fall detection and related daily living activities. The dataset contains approximately 12,000 video clips, each with dense temporal annotations. The videos are computer-generated, depicting human performers executing various activities in a controlled virtual environment. The dataset encompasses 16 activity categories, including dynamic actions and static states. The data is split into 80% training, 10% validation, and 10% test sets with a default random split (seed 42). The repository is divided into "labels" and "splits" directories, containing CSV files that hold temporal annotations and video paths for each split. The dataset is described in English, and no Chinese description is provided in the README.
创建时间:
2025-10-28
原始信息汇总

WanFall数据集概述

基本信息

  • 数据集名称: WanFall: A Synthetic Activity Recognition Dataset
  • 许可证: CC BY-NC 4.0
  • 任务类别: 视频分类
  • 语言: 英语
  • 标签: 合成数据、活动识别、跌倒检测
  • 数据规模: 10K<n<100K

数据集特性

  • 视频数量: 12,000个视频片段
  • 时间片段总数: 19,228个
  • 视频时长: 5.0625秒/片段
  • 帧数: 81帧/视频
  • 帧率: 16 fps
  • 注释格式: 时间分割(开始/结束时间戳)

活动类别

动态动作(过渡)

  • 0. walk - 行走运动,包括慢跑和跑步
  • 1. fall - 跌倒动作
  • 2. fallen - 跌倒后状态
  • 3. sit_down - 从站立到坐下的过渡
  • 4. sitting - 静止坐姿
  • 5. lie_down - 有意躺下
  • 6. lying - 静止躺姿
  • 7. stand_up - 站起动作
  • 8. standing - 静止站姿
  • 9. other - 其他动作
  • 10. kneel_down - 跪下的过渡
  • 11. kneeling - 静止跪姿
  • 12. squat_down - 蹲下的过渡
  • 13. squatting - 静止蹲姿
  • 14. crawl - 爬行运动
  • 15. jump - 跳跃动作

数据集结构

配置

  • labels配置: 包含所有视频的时间片段标签
  • random配置: 随机80/10/10训练/验证/测试分割

文件组织

  • labels/wanfall.csv - 数据集的所有时间片段
  • labels/label2id.csv - 活动名称到整数ID的映射
  • splits/train.csv - 训练集视频路径(80%)
  • splits/val.csv - 验证集视频路径(10%)
  • splits/test.csv - 测试集视频路径(10%)

数据格式

标签格式

  • path: 视频相对路径
  • label: 类别ID(0-15)
  • start: 片段开始时间(秒)
  • end: 片段结束时间(秒)
  • subject: 受试者ID(-1表示无受试者跟踪)
  • cam: 摄像机视图ID(-1表示单视图)
  • dataset: 数据集名称(wanfall)

分割格式

  • 包含每个分区中包含的视频路径列表

技术规格

视频规格

  • 分辨率: 可变(合成生成)
  • 格式: MP4(不包含在此数据集中,需单独获取视频文件)

注释属性

  • 时间精度: 亚秒级
  • 覆盖范围: 大多数帧都有标签
  • 活动序列: 自然过渡

运动类型

  • 动态运动: 从运动开始的第一帧标记,在达到静止状态时结束
  • 静态状态: 当人在该姿势中静止时开始,持续到下一个运动开始

默认分割

  • 训练集: 9,600个视频
  • 验证集: 1,200个视频
  • 测试集: 1,200个视频
  • 分割方式: 随机80/10/10分割(种子42)
搜集汇总
数据集介绍
main_image_url
构建方式
在计算机视觉与行为识别研究领域,WanFall数据集通过合成生成技术构建而成,采用虚拟环境下的计算机生成视频,模拟人类日常活动与跌倒行为。该数据集包含约12,000个视频片段,每个片段时长5.0625秒并以16帧每秒的速率录制,通过密集时间分割标注方式记录16类活动状态,涵盖行走、跌倒及姿态转换等动态与静态行为。数据生成过程在受控虚拟场景中进行,确保了场景多样性与标注精度,所有标注以时间戳形式精确标记起始与结束时刻。
特点
WanFall数据集以其合成生成特性与精细时间标注著称,视频内容涵盖16种活动类别,包括动态动作如跌倒、行走及静态状态如坐卧姿态。每个视频均配备帧级时间分割标签,支持高精度行为定位分析。数据集采用标准划分策略,按80:10:10比例分为训练、验证与测试集,确保了模型评估的可靠性。其合成数据特性有效规避了真实场景中的数据隐私与采集限制,为行为识别研究提供了丰富且可控的实验样本。
使用方法
该数据集可通过HuggingFace平台直接加载,支持使用datasets库调用标注文件与数据划分。用户可结合PyTorch等框架构建自定义数据加载器,实现视频帧与时间标签的同步处理。典型应用包括时间行为检测、帧级分类任务,通过合并标注文件与划分路径可获取各视频段的详细活动信息。数据加载时需指定视频存储根目录,并利用内置转换函数将时间分割标签映射至帧级,以适应不同粒度行为分析需求。
背景与挑战
背景概述
随着人口老龄化趋势加剧,跌倒检测成为计算机视觉与健康监护领域的关键研究方向。WanFall作为专注于人体姿态识别与跌倒检测的大规模合成数据集,通过计算机生成技术构建了约1.2万段包含16类日常活动的视频片段,每段视频以16帧率持续5.0625秒并配备精确到帧级的时间段标注。该数据集通过虚拟环境控制实现了人体动作序列的多样化呈现,为动作识别模型提供了具有时序标注特性的训练基准,显著推进了智能监护系统中行为分析算法的研究进程。
当前挑战
在跌倒检测领域,真实场景中存在的环境干扰、遮挡问题及动作连续性识别构成主要技术瓶颈。WanFall在构建过程中面临合成数据与现实场景的域适应挑战,需通过虚拟环境模拟复杂光照变化与多角度视角。同时,密集时间段标注要求精确界定动作起始边界,特别是处理‘行走-跌倒-倒地-起身’等连续动作转换时的时序重叠问题。合成数据还需克服人体运动建模的真实性验证,确保姿态过渡符合生物力学规律。
常用场景
经典使用场景
在计算机视觉与行为分析领域,WanFall数据集主要应用于跌倒检测算法的开发与验证。该数据集通过合成生成的视频序列,精确标注了人体姿态转换的时间边界,为时序动作识别模型提供了标准化的训练基准。其密集的帧级标注特性使得研究者能够针对跌倒行为的起始、持续与结束阶段进行细粒度分析,特别适用于评估模型在复杂姿态转换场景中的时序定位能力。
解决学术问题
该数据集有效解决了真实场景跌倒数据稀缺导致的模型泛化难题,通过合成数据生成技术突破了隐私保护与数据采集成本限制。在学术层面,它为动作分割、时序行为检测等任务提供了标准化评估基准,显著推进了基于深度学习的行为识别方法在长尾分布问题上的研究进展。其精心设计的姿态转换序列更成为研究人体运动动力学与行为模式演变的理想载体。
衍生相关工作
基于该数据集标注体系,学界衍生出多模态行为理解框架与跨域适应方法。部分研究通过迁移学习将合成数据特征映射至真实场景,解决了域差异导致的性能衰减问题。另有工作结合图神经网络建模姿态转换关系,构建了时空协同的行为预测模型。这些探索不仅拓展了合成数据的应用边界,更为视频理解领域的标注效率提升提供了创新范式。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作