fredguth/aisegmentcn-matting-human
收藏Hugging Face2022-09-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/fredguth/aisegmentcn-matting-human
下载链接
链接失效反馈官方服务:
资源简介:
---
annotations_creators:
- Beijing Wanxing Convergence Technology Co
license:
- mit
pretty_name: aisegmentcn-matting-human
size_categories:
- 10K<n<100K
tags:
- binary
- aisegment.cn
task_categories:
- image-segmentation
task_ids:
- semantic-segmentation
---
# Dataset Card for AISegment.cn - Matting Human datasets
## Table of Contents
- [Dataset Card for AISegment.cn - Matting Human datasets](#dataset-card-for-aisegmentcn---matting-human-datasets)
- [Table of Contents](#table-of-contents)
- [Dataset Description](#dataset-description)
- [Dataset Structure](#dataset-structure)
- [Licensing Information](#licensing-information)
## Dataset Description
Quoting the [dataset's github](https://github.com/aisegmentcn/matting_human_datasets) (translated by Apple Translator):
> This dataset is currently the largest portrait matting dataset, containing 34,427 images and corresponding matting results.
> The data set was marked by the high quality of Beijing Play Star Convergence Technology Co. Ltd., and the portrait soft segmentation model trained using this data set has been commercialized.
> The original images in the dataset are from `Flickr`, `Baidu`, and `Taobao`. After face detection and area cropping, a half-length portrait of 600\*800 was generated.
> The clip_img directory is a half-length portrait image in the format jpg; the matting directory is the corresponding matting file (convenient to confirm the matting quality), the format is png, you should first extract the alpha map from the png image before training.
- **Repository:** [aisegmentcn/matting_human_datasets](https://github.com/aisegmentcn/matting_human_datasets)
## Dataset Structure
```text
└── data/
├── clip_img/
│ └── {group-id}/
│ └── clip_{subgroup-id}/
│ └── {group-id}-{img-id}.jpg
└── matting/
└── {group-id}/
└── matting_{subgroup-id}/
└── {group-id}-{img-id}.png
```
The input `data/clip_img/1803151818/clip_00000000/1803151818-00000003.jpg` matches the label `data/matting/1803151818/matting_00000000/1803151818-00000003.png`
### Licensing Information
See authors [Github](https://github.com/aisegmentcn/matting_human_datasets)
annotations_creators:
- 北京万兴聚合科技有限公司(Beijing Wanxing Convergence Technology Co)
license:
- MIT
pretty_name: aisegmentcn-matting-human
size_categories:
- 10K < 样本量 < 100K
tags:
- 二值(binary)
- aisegment.cn
task_categories:
- 图像分割(image-segmentation)
task_ids:
- 语义分割(semantic-segmentation)
# AISegment.cn - 人像抠图数据集卡片
## 目录
- [Dataset Card for AISegment.cn - 人像抠图数据集卡片](#dataset-card-for-aisegmentcn---matting-human-datasets)
- [目录](#table-of-contents)
- [数据集概述](#dataset-description)
- [数据集结构](#dataset-structure)
- [许可信息](#licensing-information)
## 数据集概述
引用数据集GitHub仓库的说明(由苹果翻译器译出):
> 本数据集为当前规模最大的人像抠图数据集,共计包含34427张图像及其对应的抠图结果。
> 该数据集由北京玩星聚合科技有限公司(Beijing Play Star Convergence Technology Co. Ltd.)完成高质量标注,基于此数据集训练的人像软分割模型已实现商业化落地。
> 数据集原始图像源自Flickr、百度及淘宝平台,经人脸检测与区域裁剪后,生成分辨率为600×800的半身人像图像。
> 其中`clip_img`目录存放格式为JPG的半身人像图像;`matting`目录存放对应的抠图文件(便于核验抠图质量),格式为PNG,训练前需先从PNG图像中提取Alpha通道图(Alpha Map)。
- **仓库地址:** [aisegmentcn/matting_human_datasets](https://github.com/aisegmentcn/matting_human_datasets)
## 数据集结构
text
└── data/
├── clip_img/
│ └── {分组ID}/
│ └── clip_{子分组ID}/
│ └── {分组ID}-{图像ID}.jpg
└── matting/
└── {分组ID}/
└── matting_{子分组ID}/
└── {分组ID}-{图像ID}.png
输入样本路径示例:`data/clip_img/1803151818/clip_00000000/1803151818-00000003.jpg` 对应的标签路径为 `data/matting/1803151818/matting_00000000/1803151818-00000003.png`
### 许可信息
详见作者的GitHub仓库:[https://github.com/aisegmentcn/matting_human_datasets](https://github.com/aisegmentcn/matting_human_datasets)
提供机构:
fredguth
原始信息汇总
数据集概述
数据集名称
- 名称: aisegmentcn-matting-human
数据集描述
- 描述: 该数据集是目前最大的肖像抠图数据集,包含34,427张图像及其对应的抠图结果。数据集由北京万兴汇聚科技有限公司高质量标注,使用此数据集训练的肖像软分割模型已实现商业化。
- 原始图像来源:
Flickr,Baidu,Taobao - 处理方式: 通过人脸检测和区域裁剪,生成600*800的半身肖像。
数据集结构
-
目录结构: text └── data/ ├── clip_img/ │ └── {group-id}/ │ └── clip_{subgroup-id}/ │ └── {group-id}-{img-id}.jpg └── matting/ └── {group-id}/ └── matting_{subgroup-id}/ └── {group-id}-{img-id}.png
-
文件格式:
- 图像:
.jpg - 抠图结果:
.png
- 图像:
许可证信息
- 许可证: MIT
数据集大小
- 大小: 10K<n<100K
标签
- 标签: binary, aisegment.cn
任务类别
- 任务类别: image-segmentation
- 任务ID: semantic-segmentation
搜集汇总
数据集介绍

构建方式
在计算机视觉领域,高质量的人像抠图数据集对于推动图像分割技术的发展至关重要。该数据集由北京万星汇合科技有限公司精心标注,其构建过程体现了严谨的数据工程方法。原始图像采集自Flickr、百度及淘宝等多个公开平台,经过人脸检测与区域裁剪处理,统一生成600*800像素的半身人像。数据组织采用分层目录结构,将裁剪后的图像与对应的抠图结果分别存放于clip_img与matting目录下,确保数据对的高效匹配与可追溯性。
特点
作为当前规模最大的人像抠图数据集,其核心特点在于数据的规模与质量。数据集共包含34,427对图像与抠图结果,为模型训练提供了充足的样本支持。所有标注均由专业团队完成,确保了抠图边界的精细度与准确性,基于此数据集训练的肖像软分割模型已成功实现商业化应用。数据格式规范,原始图像为JPG格式,而标注结果以PNG格式存储,其中包含了可直接用于模型训练的Alpha通道信息,极大地方便了研究者的预处理工作。
使用方法
在图像分割任务中,该数据集为训练与评估人像抠图模型提供了标准化的基准。使用者需首先从PNG格式的标注文件中提取Alpha遮罩图,作为模型训练的真实标签。数据集的目录结构清晰定义了图像与标签的对应关系,便于批量读取与配对。该数据集适用于监督学习框架,可用于训练语义分割或专门的肖像抠图神经网络,其商业化的成功先例也验证了其在工业级应用中的实用价值。
背景与挑战
背景概述
在计算机视觉领域,人像抠图技术旨在精确分离图像中的人物前景与背景,为图像编辑、虚拟现实等应用提供核心支持。AISegment.cn - Matting Human数据集由北京万兴科技股份有限公司于近年发布,作为当前规模最大的人像抠图数据集,它囊括了34,427张高质量图像及其对应的抠图结果。该数据集的构建源于对高精度人像分割模型的迫切需求,通过整合Flickr、百度、淘宝等多源图像,并经过人脸检测与区域裁剪处理,生成了统一尺寸的半身人像。这一资源不仅推动了人像抠图算法的进步,其训练的模型已实现商业化部署,显著提升了相关产业的应用效能。
当前挑战
人像抠图任务的核心挑战在于处理复杂边缘细节,如发丝、透明衣物等半透明区域的精确分割,这对模型的泛化能力提出了极高要求。构建数据集时,研究人员面临数据多样性与标注一致性的平衡难题,需从多平台采集图像并确保标注质量统一。此外,原始图像经过裁剪与尺寸标准化,可能引入信息损失,增加了模型学习真实场景复杂性的难度。这些挑战共同指向了对更高效、鲁棒的抠图算法的持续探索需求。
常用场景
经典使用场景
在计算机视觉领域,人像抠图技术作为图像分割的重要分支,其核心在于精准分离前景人物与背景。AISegment.cn - Matting Human数据集凭借其大规模、高质量的标注数据,成为训练和评估人像抠图模型的经典基准。该数据集广泛应用于深度学习模型的训练过程,特别是针对语义分割任务中的二值化人像分割,为研究者提供了丰富的半身肖像图像及其对应的精细抠图结果,有效支撑了从传统算法到现代神经网络方法的性能验证与比较。
衍生相关工作
围绕该数据集,已衍生出多项经典研究工作,主要集中在改进人像抠图网络架构与优化训练策略上。例如,一些研究利用其数据探索了注意力机制、多尺度特征融合在抠图任务中的应用;另一些工作则专注于半监督或弱监督学习方法,以降低对精细标注的依赖。这些成果不仅推动了如MODNet、Background Matting等先进模型的发展,也为图像分割领域的通用算法提供了有价值的参考与启发。
数据集最近研究
最新研究方向
在计算机视觉领域,人像抠图技术作为图像分割的重要分支,正随着高质量数据集的涌现而不断演进。AISegment.cn - Matting Human datasets作为当前规模最大的人像抠图数据集,其前沿研究聚焦于利用深度学习模型提升抠图的精细度与泛化能力,尤其在复杂背景与发丝细节的处理上展现出显著进展。该数据集推动了语义分割与生成对抗网络的结合,促进了实时高精度抠图算法的发展,相关技术已广泛应用于虚拟背景、影视制作和增强现实等热点场景,对推动人机交互与数字内容创作的智能化转型具有深远影响。
以上内容由遇见数据集搜集并总结生成



