Yoga-82

Name: Yoga-82
Creator: 大阪大学, 印度理工学院甘地讷格尔分校
Published: 2020-04-22 09:43:44
License: 暂无描述

arXiv2020-04-22 更新2024-06-21 收录

下载链接：

https://sites.google.com/view/yoga-82/home

下载链接

链接失效反馈

官方服务：

资源简介：

Yoga-82是由大阪大学和印度理工学院甘地讷格尔分校合作创建的大型瑜伽姿势识别数据集，包含82个类别，总计超过28,400张图像。该数据集通过Bing搜索引擎从网络下载，并手工清理和标注，每张图片包含一个或多个执行相同瑜伽姿势的人。数据集的创建旨在通过细粒度的层次化姿势分类，解决现有数据集在姿势多样性、物体遮挡和视角方面的不足。Yoga-82通过提供基于身体配置的层次化标签，包括身体位置、身体位置的变化和实际姿势名称，来解决复杂姿势的精细标注问题。该数据集的应用领域包括视觉监控、行为分析、辅助生活和智能驾驶辅助系统等。

Yoga-82 is a large-scale yoga pose recognition dataset co-created by Osaka University and Indian Institute of Technology Gandhinagar. It contains 82 categories and a total of over 28,400 images. This dataset is downloaded from the web via Bing Search Engine, followed by manual cleaning and annotation. Each image includes one or more people performing the same yoga pose. The dataset is developed to address the shortcomings of existing datasets in terms of pose diversity, object occlusion and viewing angles through fine-grained hierarchical pose classification. Yoga-82 solves the problem of fine annotation for complex poses by providing hierarchical labels based on body configuration, which cover body positions, variations of body positions and actual pose names. The application fields of this dataset include visual surveillance, behavior analysis, assisted living, intelligent driving assistance systems and other related areas.

提供机构：

大阪大学, 印度理工学院甘地讷格尔分校

创建时间：

2020-04-22

搜集汇总

数据集介绍

构建方式

Yoga-82数据集通过从网络中下载瑜伽姿势图像构建，使用Bing搜索引擎进行数据采集。数据集包含了82种瑜伽姿势，涵盖了28,400多张图像，每种姿势的图像数量从64到1133不等，平均每种姿势有347张图像。为了应对复杂姿势难以精细标注的问题，数据集采用了三层层次标签结构，包括身体位置、身体位置的变体以及具体的姿势名称。这种层次结构不仅简化了标注过程，还为模型提供了更丰富的信息，有助于提升分类的准确性。

特点

Yoga-82数据集的显著特点在于其层次化的标签结构和多样化的瑜伽姿势。数据集包含了82种复杂的瑜伽姿势，这些姿势在视觉上具有高度的相似性，因此需要精细的分类。通过三层层次标签，数据集能够更好地捕捉姿势的细微差异，从而提高分类的准确性。此外，数据集中的图像来自不同的视角、光照条件和背景，增加了数据的真实性和挑战性。

使用方法

Yoga-82数据集适用于基于卷积神经网络（CNN）的细粒度人体姿势分类任务。研究者可以使用该数据集训练模型，利用其层次化的标签结构进行多层次的分类。数据集提供了训练集和测试集的划分，便于模型评估和比较。此外，研究者还可以根据数据集的层次结构，设计特定的网络架构，如DenseNet的变体，以充分利用层次标签信息，提升模型在复杂姿势分类中的表现。

背景与挑战

背景概述

瑜伽姿态识别作为计算机视觉领域的一个重要问题，近年来随着深度学习技术的进步取得了显著进展。然而，现有的姿态数据集在姿态多样性、物体遮挡和视角变化等方面存在不足，限制了模型的泛化能力和应用范围。为了应对这一挑战，Manisha Verma、Sudhakar Kumawat等研究人员于2020年提出了Yoga-82数据集，旨在通过细粒度的层次化姿态分类来解决复杂瑜伽姿态的识别问题。该数据集包含了82种瑜伽姿态，并通过三层层次结构进行标注，涵盖了身体位置、位置变化和具体姿态名称。Yoga-82的提出不仅为姿态识别领域提供了新的挑战，还为研究者提供了丰富的层次化标签，推动了姿态分类模型的进一步发展。

当前挑战

Yoga-82数据集的构建面临多重挑战。首先，瑜伽姿态的多样性和复杂性使得传统的姿态标注方法难以适用，尤其是在面对多视角、遮挡和分辨率变化时，细粒度的关键点标注变得极为困难。其次，数据集的层次化标注要求对姿态进行多层次的分类，这不仅增加了标注的复杂性，还对模型的学习能力提出了更高的要求。此外，不同姿态之间的相似性极高，例如某些姿态在视觉上几乎无法区分，这使得分类任务变得异常困难。最后，数据集的构建过程中，研究人员需要从网络中获取大量图像，并进行手动清理和标注，这一过程耗时且容易引入人为误差。这些挑战使得Yoga-82成为姿态识别领域中一个极具挑战性的基准数据集。

常用场景

经典使用场景

Yoga-82数据集的经典使用场景主要集中在细粒度人体姿态分类任务中。该数据集通过提供82种瑜伽姿态的多样化样本，支持了复杂姿态的识别与分类。其层次化的标签结构使得模型能够在不同层次上学习姿态的特征，从而提升分类的准确性。通过使用Yoga-82数据集，研究人员可以训练卷积神经网络（CNN）模型，以实现对复杂瑜伽姿态的高精度识别，尤其是在姿态多样性、视角变化和遮挡等挑战性场景下表现出色。

实际应用

Yoga-82数据集在实际应用中具有广泛的潜力。首先，它可以应用于瑜伽教学和健身指导系统，通过识别用户的瑜伽姿态，提供实时反馈和纠正建议，帮助用户正确掌握瑜伽动作。其次，该数据集还可用于行为分析和监控系统，特别是在需要识别复杂姿态的场景中，如体育训练、康复治疗等。此外，Yoga-82的层次化标签结构为人体姿态的自动分类提供了新的思路，未来可应用于智能驾驶、虚拟现实等领域，提升人机交互的自然性和准确性。

衍生相关工作

Yoga-82数据集的提出激发了大量相关研究工作。首先，基于该数据集的层次化标签结构，研究人员提出了多种改进的卷积神经网络架构，如DenseNet的层次化变体，以更好地利用层次化信息进行姿态分类。其次，Yoga-82的成功应用也启发了其他领域对复杂姿态数据集的构建，推动了姿态估计技术的进一步发展。此外，该数据集还为细粒度分类任务提供了新的研究方向，促进了多层次分类模型的设计与优化。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集