five

skytnt/anime-segmentation

收藏
Hugging Face2022-10-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/skytnt/anime-segmentation
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个用于动漫角色分割的数据集。数据集包含背景图像、前景图像(透明背景)、真实图像及其对应的标签。背景图像来自character_bg_seg_data,前景图像来自danbooru网站,真实图像和标签来自AniSeg和danbooru网站。数据集总大小为18GB。

This is a dataset for anime character segmentation. The dataset includes background images, foreground images with transparent backgrounds, real images and their corresponding labels. The background images are sourced from character_bg_seg_data, foreground images from the Danbooru website, and both the real images and their corresponding labels are derived from AniSeg and the Danbooru website. The total size of the dataset is 18 GB.
提供机构:
skytnt
原始信息汇总

数据集概述

基本信息

  • 名称: Anime Segmentation
  • 许可证: cc0-1.0
  • 任务类别: image-segmentation
  • 任务ID: semantic-segmentation
  • 大小: 10K<n<100K
  • 源数据集: original

数据集详情

数据集概要

目录 描述 格式 图片数量
bg 背景图像 jpg 8057
fg 前景图像,透明背景 png 11802
imgs 包含背景和前景的真实图像 jpg 1111
masks imgs的标签 jpg 1111
  • 总大小: 18GB

收集方法

  • 背景图像: 从character_bg_seg_data收集
  • 前景图像: 从danbooru网站收集
  • imgs和masks: 从AniSeg和danbooru网站收集
  • 背景图像处理: 使用Real-ESRGAN进行恢复
  • 数据集清理: 首先使用DeepDanbooru进行清理,然后手动检查确保所有前景为动漫角色

贡献者

搜集汇总
数据集介绍
main_image_url
构建方式
在动漫图像分割领域,数据集的构建需兼顾多样性与精确性。本数据集通过整合多个来源实现:背景图像源自character_bg_seg_data项目,并采用Real-ESRGAN技术进行超分辨率修复以提升画质;前景图像从Danbooru网站采集,经DeepDanbooru模型初步筛选后辅以人工清洗,确保均为动漫角色;真实图像及其对应掩码则融合AniSeg数据集与Danbooru资源,最终形成包含背景、前景、合成图像及标签的四类子集,总计约2.2万张图像,数据规模达18GB。
特点
该数据集专为动漫角色语义分割任务设计,其核心特点体现在结构化的多模态组织。数据按功能划分为背景图、透明前景图、真实合成图及掩码标签四类,分别以JPG或PNG格式存储,支持端到端的分割模型训练与评估。图像内容聚焦动漫角色,通过严格的清洗流程保障了主题一致性,同时背景经超分辨率增强,提升了细节还原度。数据量级介于万至十万之间,兼顾了深度学习所需的规模与处理可行性。
使用方法
针对动漫图像分割的研究与应用,本数据集提供了清晰的使用路径。研究者可直接加载imgs目录中的真实图像作为输入,对应masks目录的掩码作为监督标签,构建分割模型的训练与测试集。背景与前景子集可用于数据增强或合成任务,例如通过组合生成新的训练样本。数据集兼容常见的图像处理框架,支持语义分割任务的模型开发、性能评估及跨域泛化分析,为动漫视觉计算领域提供了标准化基准。
背景与挑战
背景概述
在计算机视觉领域,动漫角色分割作为图像分割的一个细分方向,近年来随着二次元文化的全球传播而备受关注。该数据集由SkyTNT于近年构建,汇集了来自Danbooru网站及AniSeg等开源项目的图像资源,旨在为动漫角色与背景的精确分离提供高质量标注数据。其核心研究问题聚焦于提升动漫风格图像的语义分割精度,以支持动画制作、游戏开发及内容创作等应用场景。该数据集的发布,不仅丰富了图像分割领域的数据资源,也为风格化视觉任务的研究提供了重要基准。
当前挑战
动漫角色分割任务面临多重挑战:在领域层面,动漫图像通常具有高度风格化、线条复杂且色彩鲜明的特点,传统基于自然图像的分割模型难以准确捕捉其艺术特征,导致边缘模糊或细节丢失。构建过程中,数据收集与清洗尤为艰巨,需从多元来源整合图像,并借助DeepDanbooru等工具进行自动化筛选,辅以人工校验以确保角色主体的纯净性;同时,背景图像的恢复依赖Real-ESRGAN等超分辨率技术,处理高噪声或低质量原始数据时易引入伪影,增加了标注一致性的维护难度。
常用场景
经典使用场景
在动漫图像处理领域,该数据集为语义分割任务提供了精准的标注资源。其经典使用场景在于训练深度学习模型,特别是卷积神经网络,以实现对动漫角色与背景的像素级分离。通过结合前景、背景及掩码图像,研究者能够构建端到端的图像分割流程,优化模型在复杂动漫风格下的表现,为后续的图像编辑与合成奠定基础。
衍生相关工作
基于该数据集,衍生出多项经典研究工作,如AniSeg项目中的分割模型优化,以及结合Real-ESRGAN的图像超分辨率恢复。这些工作进一步拓展了动漫图像处理的前沿,包括风格迁移、姿态估计等任务。数据集的开源特性也激发了社区贡献,如DeepDanbooru的自动标注工具,共同推动了动漫视觉技术的迭代与创新。
数据集最近研究
最新研究方向
在动漫图像分割领域,Anime Segmentation数据集为精细化角色提取提供了关键支持。当前研究聚焦于结合生成对抗网络与语义分割技术,以提升动漫角色与复杂背景的分离精度,尤其在动态场景和艺术风格迁移中展现出潜力。该数据集推动了轻量化模型的发展,助力实时动漫内容创作与编辑工具的创新,相关成果正逐步应用于虚拟主播、动画制作及二次元文化衍生品设计,对数字娱乐产业的技术革新具有深远影响。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作