fredguth/aisegmentcn-matting-human

Name: fredguth/aisegmentcn-matting-human
Creator: fredguth
Published: 2022-09-29 15:18:42
License: 暂无描述

Hugging Face2022-09-29 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/fredguth/aisegmentcn-matting-human

下载链接

链接失效反馈

官方服务：

资源简介：

--- annotations_creators: - Beijing Wanxing Convergence Technology Co license: - mit pretty_name: aisegmentcn-matting-human size_categories: - 10K<n<100K tags: - binary - aisegment.cn task_categories: - image-segmentation task_ids: - semantic-segmentation --- # Dataset Card for AISegment.cn - Matting Human datasets ## Table of Contents - [Dataset Card for AISegment.cn - Matting Human datasets](#dataset-card-for-aisegmentcn---matting-human-datasets) - [Table of Contents](#table-of-contents) - [Dataset Description](#dataset-description) - [Dataset Structure](#dataset-structure) - [Licensing Information](#licensing-information) ## Dataset Description Quoting the [dataset's github](https://github.com/aisegmentcn/matting_human_datasets) (translated by Apple Translator): > This dataset is currently the largest portrait matting dataset, containing 34,427 images and corresponding matting results. > The data set was marked by the high quality of Beijing Play Star Convergence Technology Co. Ltd., and the portrait soft segmentation model trained using this data set has been commercialized. > The original images in the dataset are from `Flickr`, `Baidu`, and `Taobao`. After face detection and area cropping, a half-length portrait of 600\*800 was generated. > The clip_img directory is a half-length portrait image in the format jpg; the matting directory is the corresponding matting file (convenient to confirm the matting quality), the format is png, you should first extract the alpha map from the png image before training. - **Repository:** [aisegmentcn/matting_human_datasets](https://github.com/aisegmentcn/matting_human_datasets) ## Dataset Structure ```text └── data/ ├── clip_img/ │ └── {group-id}/ │ └── clip_{subgroup-id}/ │ └── {group-id}-{img-id}.jpg └── matting/ └── {group-id}/ └── matting_{subgroup-id}/ └── {group-id}-{img-id}.png ``` The input `data/clip_img/1803151818/clip_00000000/1803151818-00000003.jpg` matches the label `data/matting/1803151818/matting_00000000/1803151818-00000003.png` ### Licensing Information See authors [Github](https://github.com/aisegmentcn/matting_human_datasets)

annotations_creators: - 北京万兴聚合科技有限公司（Beijing Wanxing Convergence Technology Co） license: - MIT pretty_name: aisegmentcn-matting-human size_categories: - 10K < 样本量 < 100K tags: - 二值（binary） - aisegment.cn task_categories: - 图像分割（image-segmentation） task_ids: - 语义分割（semantic-segmentation） # AISegment.cn - 人像抠图数据集卡片 ## 目录 - [Dataset Card for AISegment.cn - 人像抠图数据集卡片](#dataset-card-for-aisegmentcn---matting-human-datasets) - [目录](#table-of-contents) - [数据集概述](#dataset-description) - [数据集结构](#dataset-structure) - [许可信息](#licensing-information) ## 数据集概述引用数据集GitHub仓库的说明（由苹果翻译器译出）： > 本数据集为当前规模最大的人像抠图数据集，共计包含34427张图像及其对应的抠图结果。 > 该数据集由北京玩星聚合科技有限公司（Beijing Play Star Convergence Technology Co. Ltd.）完成高质量标注，基于此数据集训练的人像软分割模型已实现商业化落地。 > 数据集原始图像源自Flickr、百度及淘宝平台，经人脸检测与区域裁剪后，生成分辨率为600×800的半身人像图像。 > 其中`clip_img`目录存放格式为JPG的半身人像图像；`matting`目录存放对应的抠图文件（便于核验抠图质量），格式为PNG，训练前需先从PNG图像中提取Alpha通道图（Alpha Map）。 - **仓库地址：** [aisegmentcn/matting_human_datasets](https://github.com/aisegmentcn/matting_human_datasets) ## 数据集结构 text └── data/ ├── clip_img/ │ └── {分组ID}/ │ └── clip_{子分组ID}/ │ └── {分组ID}-{图像ID}.jpg └── matting/ └── {分组ID}/ └── matting_{子分组ID}/ └── {分组ID}-{图像ID}.png 输入样本路径示例：`data/clip_img/1803151818/clip_00000000/1803151818-00000003.jpg` 对应的标签路径为 `data/matting/1803151818/matting_00000000/1803151818-00000003.png` ### 许可信息详见作者的GitHub仓库：[https://github.com/aisegmentcn/matting_human_datasets](https://github.com/aisegmentcn/matting_human_datasets)

提供机构：

fredguth

原始信息汇总

数据集概述

数据集名称

名称: aisegmentcn-matting-human

数据集描述

描述: 该数据集是目前最大的肖像抠图数据集，包含34,427张图像及其对应的抠图结果。数据集由北京万兴汇聚科技有限公司高质量标注，使用此数据集训练的肖像软分割模型已实现商业化。
原始图像来源: Flickr, Baidu, Taobao
处理方式: 通过人脸检测和区域裁剪，生成600*800的半身肖像。

数据集结构

目录结构: text └── data/ ├── clip_img/ │ └── {group-id}/ │ └── clip_{subgroup-id}/ │ └── {group-id}-{img-id}.jpg └── matting/ └── {group-id}/ └── matting_{subgroup-id}/ └── {group-id}-{img-id}.png
文件格式:
- 图像: .jpg
- 抠图结果: .png

许可证信息

许可证: MIT

数据集大小

大小: 10K<n<100K

任务类别

任务类别: image-segmentation
任务ID: semantic-segmentation

搜集汇总

数据集介绍

构建方式

在计算机视觉领域，高质量的人像抠图数据集对于推动图像分割技术的发展至关重要。该数据集由北京万星汇合科技有限公司精心标注，其构建过程体现了严谨的数据工程方法。原始图像采集自Flickr、百度及淘宝等多个公开平台，经过人脸检测与区域裁剪处理，统一生成600*800像素的半身人像。数据组织采用分层目录结构，将裁剪后的图像与对应的抠图结果分别存放于clip_img与matting目录下，确保数据对的高效匹配与可追溯性。

特点

作为当前规模最大的人像抠图数据集，其核心特点在于数据的规模与质量。数据集共包含34,427对图像与抠图结果，为模型训练提供了充足的样本支持。所有标注均由专业团队完成，确保了抠图边界的精细度与准确性，基于此数据集训练的肖像软分割模型已成功实现商业化应用。数据格式规范，原始图像为JPG格式，而标注结果以PNG格式存储，其中包含了可直接用于模型训练的Alpha通道信息，极大地方便了研究者的预处理工作。

使用方法

在图像分割任务中，该数据集为训练与评估人像抠图模型提供了标准化的基准。使用者需首先从PNG格式的标注文件中提取Alpha遮罩图，作为模型训练的真实标签。数据集的目录结构清晰定义了图像与标签的对应关系，便于批量读取与配对。该数据集适用于监督学习框架，可用于训练语义分割或专门的肖像抠图神经网络，其商业化的成功先例也验证了其在工业级应用中的实用价值。

背景与挑战

背景概述

在计算机视觉领域，人像抠图技术旨在精确分离图像中的人物前景与背景，为图像编辑、虚拟现实等应用提供核心支持。AISegment.cn - Matting Human数据集由北京万兴科技股份有限公司于近年发布，作为当前规模最大的人像抠图数据集，它囊括了34,427张高质量图像及其对应的抠图结果。该数据集的构建源于对高精度人像分割模型的迫切需求，通过整合Flickr、百度、淘宝等多源图像，并经过人脸检测与区域裁剪处理，生成了统一尺寸的半身人像。这一资源不仅推动了人像抠图算法的进步，其训练的模型已实现商业化部署，显著提升了相关产业的应用效能。

当前挑战

人像抠图任务的核心挑战在于处理复杂边缘细节，如发丝、透明衣物等半透明区域的精确分割，这对模型的泛化能力提出了极高要求。构建数据集时，研究人员面临数据多样性与标注一致性的平衡难题，需从多平台采集图像并确保标注质量统一。此外，原始图像经过裁剪与尺寸标准化，可能引入信息损失，增加了模型学习真实场景复杂性的难度。这些挑战共同指向了对更高效、鲁棒的抠图算法的持续探索需求。

常用场景

经典使用场景

在计算机视觉领域，人像抠图技术作为图像分割的重要分支，其核心在于精准分离前景人物与背景。AISegment.cn - Matting Human数据集凭借其大规模、高质量的标注数据，成为训练和评估人像抠图模型的经典基准。该数据集广泛应用于深度学习模型的训练过程，特别是针对语义分割任务中的二值化人像分割，为研究者提供了丰富的半身肖像图像及其对应的精细抠图结果，有效支撑了从传统算法到现代神经网络方法的性能验证与比较。

衍生相关工作

围绕该数据集，已衍生出多项经典研究工作，主要集中在改进人像抠图网络架构与优化训练策略上。例如，一些研究利用其数据探索了注意力机制、多尺度特征融合在抠图任务中的应用；另一些工作则专注于半监督或弱监督学习方法，以降低对精细标注的依赖。这些成果不仅推动了如MODNet、Background Matting等先进模型的发展，也为图像分割领域的通用算法提供了有价值的参考与启发。

数据集最近研究