ckotait/ATRDataset

Name: ckotait/ATRDataset
Creator: ckotait
Published: 2023-12-04 15:01:15
License: 暂无描述

Hugging Face2023-12-04 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/ckotait/ATRDataset

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: pixel_values dtype: image - name: label dtype: image splits: - name: train num_bytes: 674327851.666 num_examples: 16706 - name: validation num_bytes: 46935738.0 num_examples: 1000 - name: test num_bytes: 16859858.0 num_examples: 200 download_size: 813600043 dataset_size: 738123447.666 configs: - config_name: default data_files: - split: train path: data/train-* - split: validation path: data/validation-* - split: test path: data/test-* --- # Dataset Card for Dataset Name The Active Template Regression (ATR) dataset comprises 18 semantic category labels, including face, sunglasses, hat, scarf, hair, upper clothes, left arm, right arm, belt, pants, left leg, right leg, skirt, left shoe, right shoe, bag, dress, and background. A total of 17,700 images were incorporated into the ATR dataset. 16,700 images were designated for training, and 1,000 for testing. - **Curated by:** Xiaodan Liang, Si Liu, Xiaohui Shen, Jianchao Yang, Luoqi Liu, Jian Dong, Liang Lin, Shuicheng Yan - **Shared by:** Xiaodan Liang, Si Liu, Xiaohui Shen, Jianchao Yang, Luoqi Liu, Jian Dong, Liang Lin, Shuicheng Yan - **License:** MIT # Dataset Sources - **Repository:** https://github.com/lemondan/HumanParsing-Dataset - **Paper:** Deep Human Parsing with Active Template Regression # Human Parsing Labels - 0: **background** - 1: **hat** - 2: **hair** - 3: **sunglasses** - 4: **upperclothes** - 5: **skirt** - 6: **pants** - 7: **dress** - 8: **belt** - 9: **leftshoe** - 10: **rightshoe** - 11: **face** - 12: **leftleg** - 13: **rightleg** - 14: **leftarm** - 15: **rightarm** - 16: **bag** - 17: **scarf** # Uses Semantic segmentation, and more specifically, human body parsing. # Dataset Card Authors Christian Kotait **BibTeX:** @article{liang2015deep, title={Deep human parsing with active template regression}, author={Liang, Xiaodan and Liu, Si and Shen, Xiaohui and Yang, Jianchao and Liu, Luoqi and Dong, Jian and Lin, Liang and Yan, Shuicheng}, journal={IEEE transactions on pattern analysis and machine intelligence}, volume={37}, number={12}, pages={2402--2414}, year={2015}, publisher={IEEE} }

--- dataset_info: 特征: - 名称: 像素值（pixel_values）数据类型: 图像 - 名称: 标签（label）数据类型: 图像划分集: - 名称: 训练集（train）字节数: 674327851.666 样本数: 16706 - 名称: 验证集（validation）字节数: 46935738.0 样本数: 1000 - 名称: 测试集（test）字节数: 16859858.0 样本数: 200 下载大小: 813600043 数据集总大小: 738123447.666 配置项: - 配置名称: 默认配置（default）数据文件: - 划分集: 训练集（train）路径: data/train-* - 划分集: 验证集（validation）路径: data/validation-* - 划分集: 测试集（test）路径: data/test-* --- # 数据集卡片主动模板回归（Active Template Regression, ATR）数据集包含18个语义类别标签，具体包括人脸、太阳镜、帽子、围巾、头发、上衣、左臂、右臂、腰带、裤子、左腿、右腿、裙子、左鞋、右鞋、包、连衣裙以及背景。该数据集共收录17700张图像，其中16700张用于训练，1000张用于测试。 - **整理者：** Xiaodan Liang, Si Liu, Xiaohui Shen, Jianchao Yang, Luoqi Liu, Jian Dong, Liang Lin, Shuicheng Yan - **共享方：** Xiaodan Liang, Si Liu, Xiaohui Shen, Jianchao Yang, Luoqi Liu, Jian Dong, Liang Lin, Shuicheng Yan - **许可证：** MIT # 数据集来源 - **代码仓库：** https://github.com/lemondan/HumanParsing-Dataset - **相关论文：** 《基于主动模板回归的深度人体解析》（Deep Human Parsing with Active Template Regression） # 人体解析标签 - 0: **背景** - 1: **帽子** - 2: **头发** - 3: **太阳镜** - 4: **上衣** - 5: **裙子** - 6: **裤子** - 7: **连衣裙** - 8: **腰带** - 9: **左鞋** - 10: **右鞋** - 11: **人脸** - 12: **左腿** - 13: **右腿** - 14: **左臂** - 15: **右臂** - 16: **包** - 17: **围巾** # 应用场景语义分割，具体可用于人体解析任务。 # 数据集卡片作者 Christian Kotait **BibTeX：** @article{liang2015deep, title={基于主动模板回归的深度人体解析}, author={Liang, Xiaodan and Liu, Si and Shen, Xiaohui and Yang, Jianchao and Liu, Luoqi and Dong, Jian and Lin, Liang and Yan, Shuicheng}, journal={IEEE模式分析与机器智能汇刊}, volume={37}, number={12}, pages={2402--2414}, year={2015}, publisher={IEEE} }

提供机构：

ckotait

原始信息汇总

数据集概述

数据集信息

特征:
- pixel_values: 图像数据
- label: 图像标签
分割:
- train: 训练集，包含16706个样本，大小为674327851.666字节
- validation: 验证集，包含1000个样本，大小为46935738.0字节
- test: 测试集，包含200个样本，大小为16859858.0字节
下载大小: 813600043字节
数据集大小: 738123447.666字节

配置

默认配置:
- train: 数据路径为data/train-*
- validation: 数据路径为data/validation-*
- test: 数据路径为data/test-*

数据集内容

类别标签: 包含18个语义类别标签，如face, sunglasses, hat等。
样本数量: 总共包含17700张图像，其中16700张用于训练，1000张用于测试。

标签说明

0: background
1: hat
2: hair
3: sunglasses
4: upperclothes
5: skirt
6: pants
7: dress
8: belt
9: leftshoe
10: rightshoe
11: face
12: leftleg
13: rightleg
14: leftarm
15: rightarm
16: bag
17: scarf

用途

语义分割，特别是人体解析。

搜集汇总

数据集介绍

构建方式

ATR数据集的构建是基于主动模板回归（Active Template Regression）技术，该方法通过将图像中的像素值与18个语义类别标签相对应，构建了一个包含16706张训练图像、1000张验证图像和200张测试图像的集合。这些图像被精心挑选并标注，以涵盖人脸、太阳镜、帽子、围巾、头发、上衣、手臂、腰带、裤子、腿部、裙子、鞋子、包等不同部位和背景，总计17,700张图像，其中16,700张用于训练，1,000张用于测试。

特点

该数据集的特点在于其细致的语义分割标签，为18个不同的类别提供了精确的标注。这些标签覆盖了人像解析的各个方面，使得该数据集在人体解析任务中具有重要价值。此外，数据集的分布均衡，包含了不同的人体姿态、场景和光照条件，确保了模型的泛化能力。数据集遵循MIT许可，易于学术和商业使用。

使用方法

使用该数据集时，用户可以从指定的存储库中下载并解压数据集，根据配置文件中提供的路径，将训练、验证和测试数据分别加载。数据集提供了默认配置，使得用户能够快速开始基于Python的环境中的数据加载和处理。针对语义分割任务，用户可以采用相应的模型训练和评估流程，利用数据集中的标注信息进行模型的训练和验证。

背景与挑战

背景概述

Active Template Regression（ATR）数据集，由Xiaodan Liang、Si Liu、Xiaohui Shen等研究人员于2015年创建，是计算机视觉领域用于人体解析的重要数据集。该数据集涵盖了18个语义类别标签，包括面部、太阳镜、帽子等，总计包含17,700张图像。其核心研究问题旨在通过深度学习技术实现对人体各部位的精确分割，对相关领域如图像识别、姿态估计等产生了显著影响。

当前挑战

该数据集在研究领域中面临的挑战主要包括：首先，人体解析的精确性受限于图像质量、遮挡等因素；其次，在构建过程中，如何有效标注和处理大量图像数据，以及如何平衡不同类别间的数据分布，都是数据集构建过程中的关键挑战。此外，数据集在多尺度和复杂背景下的泛化能力，也是当前研究中的一个重要议题。

常用场景

经典使用场景

在计算机视觉领域，Active Template Regression (ATR) 数据集以其精细的图像标注和丰富的语义类别标签而广受欢迎。该数据集最经典的使用场景在于执行语义分割任务，尤其是针对人体解析这一细分领域，提供了包括头饰、头发、上衣、裙子等在内的18个语义类别标签，使得研究人员能够在此基础上进行深入的模型训练与算法验证。

衍生相关工作

ATR数据集的成功应用催生了大量的相关研究工作。经典的工作包括基于深度学习的人体解析算法研究，这些研究进一步拓展了数据集的应用范围，如通过改进网络结构提高解析精度，或者利用迁移学习将模型应用于新的场景。此外，也有许多工作专注于数据集本身的扩展和优化，以适应不断发展的技术需求。

数据集最近研究