five

FineDiving-Pose Dataset|姿态估计数据集|动作质量评估数据集

收藏
arXiv2025-01-07 更新2025-01-09 收录
姿态估计
动作质量评估
下载链接:
https://github.com/Lumos0507/HP-MCoRe
下载链接
链接失效反馈
资源简介:
FineDiving-Pose Dataset是由北京邮电大学网络与交换技术国家重点实验室创建的一个用于动作质量评估(AQA)的数据集,特别针对跳水运动中的姿态估计。该数据集包含12,722条人工标注的姿态标签和288,000条通过自动标注管道生成的姿态标签,总计300,722条数据。数据集的创建过程结合了人工标注和自动生成技术,旨在提高现有低质量人体姿态标签的精度。数据集的应用领域主要集中在计算机视觉中的动作质量评估,特别是跳水等体育运动的自动化评分和姿态分析,旨在解决现有方法在捕捉细微姿态差异和动作连续性方面的不足。
提供机构:
北京邮电大学网络与交换技术国家重点实验室
创建时间:
2025-01-07
AI搜集汇总
数据集介绍
main_image_url
构建方式
FineDiving-Pose数据集的构建结合了手动标注与自动生成的方法。首先,研究人员从FineDiving数据集中筛选出367个视频,并手动标注了12,722帧图像,提取了2D人体关键点和边界框标签。随后,通过自动标注方法,进一步标注了3,000个视频和288,000帧图像,确保了数据集的多样性和规模。自动标注部分使用了HRNet模型进行姿态估计,并通过最近邻算法进行目标跟踪,以解决高速运动和极端姿态下的模糊问题。
特点
FineDiving-Pose数据集的特点在于其精细的人体姿态标注,涵盖了跳水运动中的多种复杂动作,如腾空、翻转和入水等。数据集不仅提供了2D关键点标注,还通过多尺度融合和关节插值技术,确保了姿态信息的完整性和准确性。此外,数据集的标注遵循MPII标准,包含16个关键点,能够有效捕捉运动员在高速运动中的细微姿态变化。
使用方法
FineDiving-Pose数据集主要用于动作质量评估(AQA)任务,特别是跳水运动的自动化评分。研究人员可以通过该数据集训练多模态融合模型,结合视觉和骨骼特征,捕捉动作的时空细节。数据集的分阶段标注使得模型能够对每个子动作进行独立评分,从而提升整体评估的准确性。此外,数据集还可用于姿态估计、动作分割等相关研究,推动计算机视觉领域的发展。
背景与挑战
背景概述
FineDiving-Pose数据集由北京邮电大学的Mengshi Qi等人于2024年提出,旨在解决动作质量评估(AQA)中的关键问题。该数据集专注于体育领域中的跳水动作,提供了精细的人体姿态标注,涵盖了12,722帧手动标注和288,000帧自动标注的姿态数据。FineDiving-Pose的创建是为了弥补现有数据集在姿态标注质量上的不足,特别是在高速运动和复杂姿态变化的情况下。通过结合视觉和骨骼模态,该数据集为AQA任务提供了更丰富的特征表示,推动了动作质量评估领域的研究进展。
当前挑战
FineDiving-Pose数据集面临的挑战主要体现在两个方面。首先,在领域问题上,跳水动作的快速变化和细微的姿态差异使得模型难以捕捉到精细的时空特征,导致评估精度受限。其次,在数据构建过程中,高速运动导致的视频模糊以及复杂姿态的精确标注是主要难点。尽管采用了自动标注与人工标注相结合的方式,但在极端姿态和复杂背景干扰下,姿态估计的准确性仍然难以保证。此外,跳水动作的多阶段特性要求模型能够动态分割视频,而现有方法在处理不同阶段的时间连续性时仍存在显著挑战。
常用场景
经典使用场景
FineDiving-Pose数据集在动作质量评估(AQA)领域中被广泛用于捕捉运动员在跳水等体育项目中的精细姿态变化。通过结合视觉和骨骼信息,该数据集能够有效捕捉运动员在不同动作阶段的时空特征,从而为动作质量的自动评估提供支持。其多模态融合框架和分阶段对比学习回归方法使得该数据集在评估复杂动作时表现出色。
实际应用
FineDiving-Pose数据集在实际应用中具有广泛的价值,尤其是在体育竞技和康复训练领域。例如,在跳水比赛中,该数据集可以用于自动化评分系统,帮助裁判更准确地评估运动员的表现。此外,它还可以用于康复训练中的动作纠正,通过分析患者的动作质量,提供个性化的训练建议,从而加速康复进程。
衍生相关工作
FineDiving-Pose数据集的推出催生了一系列相关研究工作,尤其是在多模态学习和动作质量评估领域。例如,基于该数据集的研究提出了分阶段对比学习回归方法,显著提升了动作质量评估的准确性。此外,该数据集还推动了基于骨骼信息的动作分析技术的发展,如层次化骨骼编码器和多模态融合模块的应用,进一步丰富了动作质量评估的研究方向。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

MMAUD

MMAUD数据集是由南洋理工大学电气与电子工程学院创建,专注于小型无人机的检测、分类和轨迹估计。该数据集结合了多种传感器输入,包括立体视觉、多种激光雷达、雷达和音频阵列,以高保真度模拟真实世界场景。MMAUD提供了由Leica生成的精确地面实况数据,增强了数据集的可信度,并支持算法的精确和高效开发。数据集的应用领域包括无人机威胁检测、分类和轨迹估计,旨在解决现代微型无人机威胁带来的挑战。

arXiv 收录

RAVDESS

情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。

OpenDataLab 收录

微博与抖音评论数据集

数据集源自微博平台与抖音平台的评论信息,基于两个热点事件来对评论等信息进行爬取收集形成数据集。原数据一共3W5条,但消极评论与中立评论远远大于积极评论。因此作特殊处理后,积极数据2601条,消极数据2367条,中立数据2725条,共7693条数据。

github 收录