Anime-LineArt-Dataset

Hugging Face2026-03-31 更新2026-04-01 收录

下载链接：

https://huggingface.co/datasets/ityizNola/Anime-LineArt-Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

Anime Lineart Sketch Dataset 是一个高质量动漫线稿素描图像数据集，通过 ControlNet Annotators 中的 LineartAnimeDetector 模型从原始动漫图像中自动提取生成。该数据集旨在支持动漫风格素描生成、文本到素描管道、ControlNet 条件处理以及素描到图像和图像到素描转换等研究和开发。数据集中的素描图像以 PNG 格式存储，分辨率为 512×512 像素，采用灰度模式。原始数据来源于 Kaggle 上的 Anime Images Dataset，并按照原始动漫类别结构组织。数据集包含 1K 到 10K 之间的图像样本，每个类别最多包含 15 张图像。数据集采用 CC BY-NC 4.0 许可，适用于非商业用途的研究和开发。

创建时间：

2026-03-26

原始信息汇总

Anime Lineart Sketch Dataset 数据集概述

数据集简介

该数据集包含通过ControlNet Annotators中的LineartAnimeDetector模型从原始动漫图像中自动提取的高质量线稿草图图像。其设计旨在支持动漫风格草图生成、文本到草图流程、ControlNet条件控制以及草图到图像和图像到草图转换等领域的研究与开发。

数据集结构

草图图像按照原始动漫类别结构组织在子目录中：

sketches/ ├── category_1/ │ ├── image_001.png │ ├── image_002.png │ └── ... ├── category_2/ │ └── ... └── category_n/ └── ...

所有图像均以PNG格式保存，分辨率为512×512像素。

数据集详情

属性	值
图像格式	PNG
分辨率	512 × 512 像素
色彩模式	灰度（线稿）
源数据集	`diraizel/anime-images-dataset` (Kaggle)
提取模型	`LineartAnimeDetector` — `lllyasviel/Annotators`
每个类别最大图像数	15
许可证	CC BY-NC 4.0

生成过程

草图通过自动化流程生成：

下载 — 通过kagglehub从Kaggle获取原始动漫图像。
提取 — 每张图像以512像素分辨率通过LineartAnimeDetector处理。
存储 — 结果保存为PNG格式，并保留原始类别子文件夹结构。

预期用途

✅ 预期用途

训练草图条件扩散模型（例如ControlNet）
构建文本到草图或草图到图像的数据集
动漫风格迁移和线稿研究

❌ 非预期用途

未经明确许可的商业用途（参见许可证）
生成侵犯原始动漫作品版权的内容

源数据

原始图像来源于Kaggle上的Anime Images Dataset（由diraizel提供）。此数据集仅包含提取的线稿表示，不重新分发原始图像。

引用

若在研究中使用了此数据集，请引用： bibtex @dataset{icoglabs_anime_sketches_2025, author = {iCog Labs}, title = {Anime Lineart Sketch Dataset}, year = {2025}, publisher = {Hugging Face}, url = {https://huggingface.co/datasets/ityizNola/Anime-LineArt-Dataset} }

维护

由iCog Labs — AI视频生成研究团队维护。

搜集汇总

数据集介绍

构建方式

在动漫图像处理领域，高质量线稿的获取常面临人工绘制耗时且风格不一的挑战。该数据集通过自动化流程构建，首先从Kaggle平台的Anime Images Dataset获取原始动漫图像，随后利用ControlNet Annotators中的LineartAnimeDetector模型，以512×512分辨率批量提取线稿。提取后的图像以PNG格式保存，并沿用原始数据集的类别子目录结构进行组织，确保了数据的一致性与可追溯性。

特点

本数据集专为动漫风格线稿研究设计，其核心特征在于全部图像均为灰度线稿，分辨率统一为512×512像素，格式采用无损的PNG。数据规模介于一千至一万张之间，每类别最多包含15张图像，结构清晰且便于分类处理。这些线稿源自多样化的动漫原始图像，覆盖多种风格类别，为模型训练提供了丰富的视觉特征，尤其适用于基于线稿的条件生成任务。

使用方法

该数据集主要应用于动漫风格的图像生成与转换研究。研究人员可将其用于训练以线稿为条件的扩散模型，例如ControlNet，实现从文本到线稿或线稿到完整图像的生成。在具体使用中，用户需遵循CC BY-NC 4.0许可协议，将数据加载至图像处理或机器学习框架，通过读取按类别组织的PNG文件进行模型训练或评估，但应注意避免将其用于未经许可的商业用途或侵犯原作品版权的行为。

背景与挑战

背景概述

在动漫艺术创作与计算机视觉交叉领域，高质量的线稿草图是风格化图像生成与编辑的核心基础。Anime-LineArt-Dataset由iCog Labs于2025年构建并发布，旨在为动漫风格草图生成、文本到草图转换以及基于ControlNet的条件图像合成等研究提供专门数据支持。该数据集利用ControlNet Annotators中的LineartAnimeDetector模型，从Kaggle平台的Anime Images Dataset原始动漫图像中自动提取出统一为512×512分辨率的灰度线稿，其结构化组织保留了原始图像的类别目录，为生成式模型训练提供了精准的草图条件数据。

当前挑战

该数据集致力于解决动漫图像处理中草图与完整图像间的高保真转换问题，其核心挑战在于如何确保自动提取的线稿在保持动漫艺术风格一致性的同时，准确捕捉人物轮廓与细节特征，避免因原图复杂度或模型局限性导致的线条断裂或噪声干扰。在构建过程中，面临的主要挑战包括：原始图像质量与风格的多样性要求提取算法具备强鲁棒性；自动化流水线需在保持高效率的同时，确保每张输出线稿的结构完整性与视觉清晰度；此外，数据集的非商业许可协议也限制了其在商业化生成应用中的直接使用，要求研究者在使用时需谨慎处理版权与伦理边界。

常用场景

经典使用场景

在动漫风格图像生成领域，Anime-LineArt-Dataset为研究者提供了高质量的线稿草图数据。该数据集最经典的使用场景是训练基于草图的扩散模型，例如ControlNet，通过线稿作为条件输入，生成细节丰富、风格一致的动漫图像。这种应用不仅推动了文本到草图、草图到图像的转换研究，还为动漫艺术创作自动化提供了关键的技术支撑。

解决学术问题

该数据集有效解决了动漫图像处理中草图生成与条件控制的学术难题。通过提供标准化的线稿数据，它支持了草图条件扩散模型的训练与评估，促进了图像到图像转换、风格迁移以及线稿提取算法的研究。其意义在于为动漫视觉内容的生成与编辑建立了可重复的实验基准，推动了生成式人工智能在艺术创作领域的理论发展。

衍生相关工作

围绕该数据集，已衍生出多项经典研究工作。其中，基于ControlNet架构的动漫草图条件生成模型成为代表性应用，展示了线稿在引导图像合成中的有效性。此外，该数据集也促进了文本到草图生成管线的探索，以及跨模态草图与图像对齐方法的研究，为后续动漫风格生成模型的创新提供了重要的数据基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集