skytnt/anime-segmentation

Name: skytnt/anime-segmentation
Creator: skytnt
Published: 2022-10-03 01:35:40
License: 暂无描述

Hugging Face2022-10-03 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/skytnt/anime-segmentation

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个用于动漫角色分割的数据集。数据集包含背景图像、前景图像（透明背景）、真实图像及其对应的标签。背景图像来自character_bg_seg_data，前景图像来自danbooru网站，真实图像和标签来自AniSeg和danbooru网站。数据集总大小为18GB。

This is a dataset for anime character segmentation. The dataset includes background images, foreground images with transparent backgrounds, real images and their corresponding labels. The background images are sourced from character_bg_seg_data, foreground images from the Danbooru website, and both the real images and their corresponding labels are derived from AniSeg and the Danbooru website. The total size of the dataset is 18 GB.

提供机构：

skytnt

原始信息汇总

数据集概述

基本信息

名称: Anime Segmentation
许可证: cc0-1.0
任务类别: image-segmentation
任务ID: semantic-segmentation
大小: 10K<n<100K
源数据集: original

数据集详情

数据集概要

目录	描述	格式	图片数量
bg	背景图像	jpg	8057
fg	前景图像，透明背景	png	11802
imgs	包含背景和前景的真实图像	jpg	1111
masks	imgs的标签	jpg	1111

总大小: 18GB

收集方法

背景图像: 从character_bg_seg_data收集
前景图像: 从danbooru网站收集
imgs和masks: 从AniSeg和danbooru网站收集
背景图像处理: 使用Real-ESRGAN进行恢复
数据集清理: 首先使用DeepDanbooru进行清理，然后手动检查确保所有前景为动漫角色

贡献者

搜集汇总

数据集介绍

构建方式

在动漫图像分割领域，数据集的构建需兼顾多样性与精确性。本数据集通过整合多个来源实现：背景图像源自character_bg_seg_data项目，并采用Real-ESRGAN技术进行超分辨率修复以提升画质；前景图像从Danbooru网站采集，经DeepDanbooru模型初步筛选后辅以人工清洗，确保均为动漫角色；真实图像及其对应掩码则融合AniSeg数据集与Danbooru资源，最终形成包含背景、前景、合成图像及标签的四类子集，总计约2.2万张图像，数据规模达18GB。

特点

该数据集专为动漫角色语义分割任务设计，其核心特点体现在结构化的多模态组织。数据按功能划分为背景图、透明前景图、真实合成图及掩码标签四类，分别以JPG或PNG格式存储，支持端到端的分割模型训练与评估。图像内容聚焦动漫角色，通过严格的清洗流程保障了主题一致性，同时背景经超分辨率增强，提升了细节还原度。数据量级介于万至十万之间，兼顾了深度学习所需的规模与处理可行性。

使用方法

针对动漫图像分割的研究与应用，本数据集提供了清晰的使用路径。研究者可直接加载imgs目录中的真实图像作为输入，对应masks目录的掩码作为监督标签，构建分割模型的训练与测试集。背景与前景子集可用于数据增强或合成任务，例如通过组合生成新的训练样本。数据集兼容常见的图像处理框架，支持语义分割任务的模型开发、性能评估及跨域泛化分析，为动漫视觉计算领域提供了标准化基准。

背景与挑战

背景概述

在计算机视觉领域，动漫角色分割作为图像分割的一个细分方向，近年来随着二次元文化的全球传播而备受关注。该数据集由SkyTNT于近年构建，汇集了来自Danbooru网站及AniSeg等开源项目的图像资源，旨在为动漫角色与背景的精确分离提供高质量标注数据。其核心研究问题聚焦于提升动漫风格图像的语义分割精度，以支持动画制作、游戏开发及内容创作等应用场景。该数据集的发布，不仅丰富了图像分割领域的数据资源，也为风格化视觉任务的研究提供了重要基准。

当前挑战

动漫角色分割任务面临多重挑战：在领域层面，动漫图像通常具有高度风格化、线条复杂且色彩鲜明的特点，传统基于自然图像的分割模型难以准确捕捉其艺术特征，导致边缘模糊或细节丢失。构建过程中，数据收集与清洗尤为艰巨，需从多元来源整合图像，并借助DeepDanbooru等工具进行自动化筛选，辅以人工校验以确保角色主体的纯净性；同时，背景图像的恢复依赖Real-ESRGAN等超分辨率技术，处理高噪声或低质量原始数据时易引入伪影，增加了标注一致性的维护难度。

常用场景

经典使用场景

在动漫图像处理领域，该数据集为语义分割任务提供了精准的标注资源。其经典使用场景在于训练深度学习模型，特别是卷积神经网络，以实现对动漫角色与背景的像素级分离。通过结合前景、背景及掩码图像，研究者能够构建端到端的图像分割流程，优化模型在复杂动漫风格下的表现，为后续的图像编辑与合成奠定基础。

衍生相关工作

基于该数据集，衍生出多项经典研究工作，如AniSeg项目中的分割模型优化，以及结合Real-ESRGAN的图像超分辨率恢复。这些工作进一步拓展了动漫图像处理的前沿，包括风格迁移、姿态估计等任务。数据集的开源特性也激发了社区贡献，如DeepDanbooru的自动标注工具，共同推动了动漫视觉技术的迭代与创新。

数据集最近研究