ToddlerAct

Name: ToddlerAct
Creator: 华盛顿大学
Published: 2024-08-31 12:31:46
License: 暂无描述

arXiv2024-08-31 更新2024-09-06 收录

下载链接：

https://github.com/ipl-uw/ToddlerAct

下载链接

链接失效反馈

官方服务：

资源简介：

ToddlerAct是由华盛顿大学创建的一个针对幼儿粗大运动发展评估的动作识别数据集。该数据集包含495个视频，总计超过70,000帧，涵盖了幼儿在三岁以下常见的粗大运动活动。数据集的创建过程包括视频录制、专家标注和数据特征描述。ToddlerAct旨在通过提供高质量的数据集，促进早期儿童发展研究，特别是帮助识别和评估幼儿的粗大运动技能，从而及时发现和干预发展延迟或障碍。

ToddlerAct is an action recognition dataset developed for assessing gross motor development in toddlers, created by the University of Washington. This dataset comprises 495 videos totaling over 70,000 frames, covering common gross motor activities performed by children under three years old. The dataset creation process includes video recording, expert annotation, and data feature characterization. ToddlerAct aims to promote early childhood development research by providing a high-quality dataset, specifically to assist in identifying and evaluating toddlers' gross motor skills, thus enabling timely detection and intervention for developmental delays or disabilities.

提供机构：

华盛顿大学

创建时间：

2024-08-31

搜集汇总

数据集介绍

构建方式

ToddlerAct数据集的构建基于真实世界中对三岁以下儿童常见粗大运动活动的视频录制。数据收集过程包括使用YOLOv8和ByteTrack进行目标跟踪，以获取每个视频中的儿童边界框和跟踪ID。随后，通过专家对视频中的跟踪ID和动作对进行手动检查和标注。数据集包含495个视频，556个动作轨迹对和70,235帧，均由专家标注了动作类别。数据集的构建过程共耗时约300个人工小时。

特点

ToddlerAct数据集的特点在于其真实性和多样性，包含多种粗大运动活动，如独立坐、爬行、辅助站立、辅助行走、独立站立和独立行走。该数据集是目前计算机视觉领域中规模最大的儿童相关研究数据集，帧总数和分辨率均超过以往的数据集。此外，数据集中的所有儿童面部都经过遮盖处理，以保护隐私。

使用方法

使用ToddlerAct数据集的方法包括基于图像的方法和基于骨架的方法。基于图像的方法使用预训练的CLIP模型作为基础，提取视频帧的特征，并通过不同的分类头设计进行动作识别。基于骨架的方法则利用人体关节和骨骼的结构信息，通过ST-GCN和PoseConv3D等模型进行动作识别。数据集已被分为训练集和测试集，方便研究人员进行实验和评估。

背景与挑战

背景概述

儿童动作识别领域的研究对于理解儿童的身体发展以及早期发现潜在的发育迟缓或障碍至关重要。传统的评估方法主要依赖于临床医生的主观观察，这不仅耗时且容易受到主观偏差的影响。为了解决这一问题，华盛顿大学的研究团队提出了ToddlerAct数据集，旨在促进早期儿童发展研究。ToddlerAct是一个包含婴幼儿粗大运动动作的视频记录数据集，涵盖了三岁以下婴幼儿常见的粗大运动活动。该数据集的创建填补了现有动作识别数据集在婴幼儿领域的空白，为研究婴幼儿动作识别和发育评估提供了重要的数据资源。

当前挑战

婴幼儿动作识别领域面临着一些挑战。首先，收集高质量的数据集存在困难，因为涉及儿童的研究必须仔细考虑伦理和隐私问题。其次，婴幼儿动作的固有变异性给模型开发带来了挑战。与成年人相比，婴幼儿的运动模式和速度范围更广，受其发育阶段、情绪和环境的影响。这种变异性使得开发能够在不同个体和场景中良好泛化的模型变得困难。此外，目前预训练的动作识别模型通常专注于成人动作识别，数据的稀缺性也使得婴幼儿动作识别模型难以获得更好的性能。为了应对这些挑战，ToddlerAct数据集的创建者提出了一种基于CLIP基础模型的婴幼儿动作识别基准，并通过收集超过500个视频动作对和70,000帧的视频数据，为婴幼儿动作识别研究提供了有价值的资源和基准。

常用场景

经典使用场景

ToddlerAct数据集在儿童运动发展评估领域具有广泛应用，尤其适合研究婴幼儿的大肌肉群和全身运动技能。该数据集包含超过500个视频-动作对和7万帧，涵盖了婴幼儿常见的六种粗大运动技能，包括独立坐、手膝爬行、辅助站立、辅助行走、独立站立和独立行走。这些视频经过专家标注，为研究者提供了丰富的数据资源，有助于开发更准确、客观的评估模型。

衍生相关工作

ToddlerAct数据集的引入激发了相关领域的研究，推动了婴幼儿动作识别技术的发展。基于该数据集，研究人员可以开发更准确、高效的婴幼儿动作识别模型，从而提高婴幼儿运动发展评估的准确性和可靠性。此外，该数据集还可以用于开发智能监测系统、儿童康复训练系统等，为婴幼儿的健康成长提供更多的支持。

数据集最近研究