ToddlerAct
收藏arXiv2024-08-31 更新2024-09-06 收录
下载链接:
https://github.com/ipl-uw/ToddlerAct
下载链接
链接失效反馈官方服务:
资源简介:
ToddlerAct是由华盛顿大学创建的一个针对幼儿粗大运动发展评估的动作识别数据集。该数据集包含495个视频,总计超过70,000帧,涵盖了幼儿在三岁以下常见的粗大运动活动。数据集的创建过程包括视频录制、专家标注和数据特征描述。ToddlerAct旨在通过提供高质量的数据集,促进早期儿童发展研究,特别是帮助识别和评估幼儿的粗大运动技能,从而及时发现和干预发展延迟或障碍。
ToddlerAct is an action recognition dataset developed for assessing gross motor development in toddlers, created by the University of Washington. This dataset comprises 495 videos totaling over 70,000 frames, covering common gross motor activities performed by children under three years old. The dataset creation process includes video recording, expert annotation, and data feature characterization. ToddlerAct aims to promote early childhood development research by providing a high-quality dataset, specifically to assist in identifying and evaluating toddlers' gross motor skills, thus enabling timely detection and intervention for developmental delays or disabilities.
提供机构:
华盛顿大学
创建时间:
2024-08-31
搜集汇总
数据集介绍

构建方式
ToddlerAct数据集的构建基于真实世界中对三岁以下儿童常见粗大运动活动的视频录制。数据收集过程包括使用YOLOv8和ByteTrack进行目标跟踪,以获取每个视频中的儿童边界框和跟踪ID。随后,通过专家对视频中的跟踪ID和动作对进行手动检查和标注。数据集包含495个视频,556个动作轨迹对和70,235帧,均由专家标注了动作类别。数据集的构建过程共耗时约300个人工小时。
特点
ToddlerAct数据集的特点在于其真实性和多样性,包含多种粗大运动活动,如独立坐、爬行、辅助站立、辅助行走、独立站立和独立行走。该数据集是目前计算机视觉领域中规模最大的儿童相关研究数据集,帧总数和分辨率均超过以往的数据集。此外,数据集中的所有儿童面部都经过遮盖处理,以保护隐私。
使用方法
使用ToddlerAct数据集的方法包括基于图像的方法和基于骨架的方法。基于图像的方法使用预训练的CLIP模型作为基础,提取视频帧的特征,并通过不同的分类头设计进行动作识别。基于骨架的方法则利用人体关节和骨骼的结构信息,通过ST-GCN和PoseConv3D等模型进行动作识别。数据集已被分为训练集和测试集,方便研究人员进行实验和评估。
背景与挑战
背景概述
儿童动作识别领域的研究对于理解儿童的身体发展以及早期发现潜在的发育迟缓或障碍至关重要。传统的评估方法主要依赖于临床医生的主观观察,这不仅耗时且容易受到主观偏差的影响。为了解决这一问题,华盛顿大学的研究团队提出了ToddlerAct数据集,旨在促进早期儿童发展研究。ToddlerAct是一个包含婴幼儿粗大运动动作的视频记录数据集,涵盖了三岁以下婴幼儿常见的粗大运动活动。该数据集的创建填补了现有动作识别数据集在婴幼儿领域的空白,为研究婴幼儿动作识别和发育评估提供了重要的数据资源。
当前挑战
婴幼儿动作识别领域面临着一些挑战。首先,收集高质量的数据集存在困难,因为涉及儿童的研究必须仔细考虑伦理和隐私问题。其次,婴幼儿动作的固有变异性给模型开发带来了挑战。与成年人相比,婴幼儿的运动模式和速度范围更广,受其发育阶段、情绪和环境的影响。这种变异性使得开发能够在不同个体和场景中良好泛化的模型变得困难。此外,目前预训练的动作识别模型通常专注于成人动作识别,数据的稀缺性也使得婴幼儿动作识别模型难以获得更好的性能。为了应对这些挑战,ToddlerAct数据集的创建者提出了一种基于CLIP基础模型的婴幼儿动作识别基准,并通过收集超过500个视频动作对和70,000帧的视频数据,为婴幼儿动作识别研究提供了有价值的资源和基准。
常用场景
经典使用场景
ToddlerAct数据集在儿童运动发展评估领域具有广泛应用,尤其适合研究婴幼儿的大肌肉群和全身运动技能。该数据集包含超过500个视频-动作对和7万帧,涵盖了婴幼儿常见的六种粗大运动技能,包括独立坐、手膝爬行、辅助站立、辅助行走、独立站立和独立行走。这些视频经过专家标注,为研究者提供了丰富的数据资源,有助于开发更准确、客观的评估模型。
衍生相关工作
ToddlerAct数据集的引入激发了相关领域的研究,推动了婴幼儿动作识别技术的发展。基于该数据集,研究人员可以开发更准确、高效的婴幼儿动作识别模型,从而提高婴幼儿运动发展评估的准确性和可靠性。此外,该数据集还可以用于开发智能监测系统、儿童康复训练系统等,为婴幼儿的健康成长提供更多的支持。
数据集最近研究
最新研究方向
ToddlerAct数据集的最新研究方向主要集中在利用计算机视觉技术对幼儿粗大运动技能进行客观评估。该数据集通过收集幼儿的粗大运动视频,并对其进行专家标注,为研究幼儿的运动发展提供了宝贵的数据资源。目前,该领域的前沿研究热点包括使用CLIP等预训练模型进行动作识别,以及基于骨架的动作识别方法。这些方法在ToddlerAct数据集上的实验结果表明,骨架-based方法在处理幼儿动作识别任务时表现出更高的准确率。未来的研究将着重于解决数据集不平衡问题,进一步优化模型性能,并探索人类-物体交互方法以提高预测准确性。此外,纵向研究也是未来的重要方向,通过跟踪幼儿粗大运动技能的发展,可以更深入地理解运动技能的习得过程,并为早期干预提供依据。
相关研究论文
- 1ToddlerAct: A Toddler Action Recognition Dataset for Gross Motor Development Assessment华盛顿大学 · 2024年
以上内容由遇见数据集搜集并总结生成



