five

CyberHarem/hachiouji_naoto_donttoywithmemissnagatoro

收藏
Hugging Face2024-03-25 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/CyberHarem/hachiouji_naoto_donttoywithmemissnagatoro
下载链接
链接失效反馈
官方服务:
资源简介:
这是Hachiouji Naoto/八王子(来自《不要欺负我,长瀞同学》)的数据集,包含798张图片及其标签。数据集的核心标签包括`brown_hair, short_hair, glasses, brown_eyes`,并且这些标签在数据集中被修剪。图片从多个网站(如danbooru、pixiv、zerochan等)爬取,爬取系统由DeepGHS团队提供支持。

这是Hachiouji Naoto/八王子(来自《不要欺负我,长瀞同学》)的数据集,包含798张图片及其标签。数据集的核心标签包括`brown_hair, short_hair, glasses, brown_eyes`,并且这些标签在数据集中被修剪。图片从多个网站(如danbooru、pixiv、zerochan等)爬取,爬取系统由DeepGHS团队提供支持。
提供机构:
CyberHarem
原始信息汇总

数据集概述:Hachiouji Naoto/八王子 (Dont Toy With Me, Miss Nagatoro)

数据集基本信息

  • 名称: Hachiouji Naoto/八王子 (Dont Toy With Me, Miss Nagatoro)
  • 包含内容: 798张图像及其标签
  • 核心标签: brown_hair, short_hair, glasses, brown_eyes
  • 许可证: MIT
  • 任务类别: text-to-image
  • 标签: art, not-for-all-audiences
  • 大小类别: n<1K

数据集内容

  • 图像来源: 从多个网站(如danbooru, pixiv, zerochan等)自动爬取
  • 爬取系统: 由DeepGHS Team提供技术支持

数据集包列表

名称 图像数量 大小 下载链接 类型 描述
raw 798 639.34 MiB 下载链接 Waifuc-Raw 包含元信息的原始数据(如果较大,则最小边缘对齐到1400)。
1200 798 639.08 MiB 下载链接 IMG+TXT 数据集,其中较短的一侧不超过1200像素。
stage3-p480-1200 1611 1.10 GiB 下载链接 IMG+TXT 三阶段裁剪数据集,区域不小于480x480像素。

数据集使用

  • 加载原始数据集: 提供给waifuc加载的原始数据集(包括标记的图像)。使用示例代码如下:

python import os import zipfile

from huggingface_hub import hf_hub_download from waifuc.source import LocalSource

下载原始存档文件

zip_file = hf_hub_download( repo_id=CyberHarem/hachiouji_naoto_donttoywithmemissnagatoro, repo_type=dataset, filename=dataset-raw.zip, )

提取文件到你的目录

dataset_dir = dataset_dir os.makedirs(dataset_dir, exist_ok=True) with zipfile.ZipFile(zip_file, r) as zf: zf.extractall(dataset_dir)

使用waifuc加载数据集

source = LocalSource(dataset_dir) for item in source: print(item.image, item.meta[filename], item.meta[tags])

数据集标签集群列表

原始文本版本

# 样本数 图像示例 标签
0 30 1boy, collared_shirt, male_focus, solo, white_shirt, black-framed_eyewear, sweatdrop, portrait, closed_mouth, blush, indoors
1 5 1boy, male_focus, open_mouth, parody, solo, sweatdrop, white_shirt, collared_shirt, looking_at_viewer, portrait, blush
2 9 1boy, closed_mouth, male_focus, parody, portrait, solo, blush, over-rim_eyewear, sweatdrop, black-framed_eyewear, wavy_mouth
3 8 1boy, collared_shirt, long_sleeves, male_focus, school_bag, school_uniform, white_shirt, black_pants, blush, closed_mouth, orange_sweater, solo_focus, sweatdrop, from_side, profile
4 7 1boy, black_pants, collared_shirt, green_apron, male_focus, solo, white_shirt, indoors, long_sleeves, sitting, easel, canvas_(object), tile_floor, full_body, holding, open_mouth, shoes, sweater, white_footwear
5 10 1boy, blue_sky, cloud, day, male_focus, outdoors, black-framed_eyewear, blue_jacket, solo, track_jacket, closed_mouth, upper_body, sweatdrop, blush, building, open_mouth
6 5 1boy, black_pants, brown_belt, collared_shirt, long_sleeves, male_focus, sitting, solo, white_shirt, indoors, chair, closed_mouth, stool, sweatdrop, book, canvas_(object), easel, holding
7 7 1boy, black_pants, indoors, male_focus, solo, white_shirt, brown_belt, long_sleeves, from_behind, sitting, canvas_(object), easel, painting_(object), standing
8 6 1boy, brown_pants, collared_shirt, long_sleeves, male_focus, sitting, solo_focus, white_shirt, bench, black-framed_eyewear, closed_mouth, day, outdoors, bag, red_sweater, sketchbook, sweatdrop, blush, holding_pencil, tree
9 5 1boy, male_focus, solo, closed_mouth, night, outdoors, sweatdrop, tree, upper_body, green_hoodie, green_jacket, looking_at_viewer, smile, blush
10 8 1boy, male_focus, solo, dark, blush, forest, night, tree, outdoors

表格版本

| # | 样本数 | 图像示例 | 1boy | collared_shirt | male_focus | solo | white_shirt | black-framed_eyewear | sweatdrop | portrait | closed_mouth | blush | indoors | open_mouth | parody | looking_at_viewer | over-rim_eyewear | wavy_mouth | long_sleeves | school_bag | school_uniform | black_pants | orange_sweater | solo_focus | from_side | profile | green_apron | sitting | easel | canvas_(object) | tile_floor | full_body | holding | shoes | sweater | white_footwear | blue_sky | cloud | day | outdoors | blue_jacket | track_jacket | upper_body | building | brown_belt | chair | stool | book | from_behind | painting_(object) | standing | brown_pants | bench | bag | red_sweater | sketchbook | holding_pencil | tree | night | green_hoodie | green_jacket | smile | dark | forest | |----:|----------:|:-------------------------------------------------------------------------|:-------|:-----------------|:-------------|:-------|:--------------|:-----------------------|:------------|:-----------|:---------------|:--------|:----------|:-------------|:---------|:--------------------|:-------------------|:-------------|:---------------|:-------------|:-----------------|:--------------|:-----------------|:-------------|:------------|:----------|:--------|:--------------|:----------|:--------|:------------------|:-------------|:------------|:----------|:--------|:----------|:-----------------|:-----------|:--------|:------|:-----------|:--------------|:---------------|:-------------|:-----------|:-------------|:--------|:--------|:-------|:--------------|:--------------------|:-----------|:--------------|:--------|:------|:--------------|:-------------|:-----------------|:-------|:--------|:---------------|:---------------|:--------|:-------|:---------| | 0 | 30 | | X | X | X | X | X | X | X | X | X | X | X | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 1 | 5 | | X | X | X | X | X | | X | X | | X | | X | X | X | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 2 | 9 | | X | | X | X | | X | X | X | X | X | | | X | | X | X | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 3 | 8 | | X | X | X | | X | | X | | X | X | | | | | | | X | X | X | X | X | X | X | X | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 4 | 7 | | X | X | X | X | X | | | | | | X | X | | | | | X | | | X | | | | | X | X | X | X | X | X | X | X | X | X | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 5 | 10 | | X | | X | X | | X | X | | X | X | | X | | | | | | | | | | | | | | | | | | | | | | | X | X | X | X | X | X | X | X | | | | | | | | | | | | | | | | | | | | | | 6 | 5 | | X | X | X | X | X | | X | | X | | X | | | | | | X | | | X | | | | | | X | X | X | | | X | | | | | | | | | | | | X | X | X | X | | | | | | | | | | | | | | | | | | 7 | 7 | | X | | X | X | X | | | | | | X | | | | | | X | | | X | | | | | | X | X | X | | | | | | | | | | | | | | | X | | | | X | X | X | | | | | | | | | | | | | | | 8 | 6 | | X | X | X | | X | X | X | | X | X | | | | | | | X | | | | | X | | | | X | | | | | | | | |

搜集汇总
数据集介绍
main_image_url
构建方式
在动漫角色图像数据集的构建领域,本数据集聚焦于《不要欺负我,长瀞同学》中的八王子直人角色,通过自动化爬虫系统从Danbooru、Pixiv、Zerochan等多个知名图像平台系统性地采集了798张图像。数据收集过程中,核心角色特征标签如棕色头发、短发、眼镜和棕色眼睛被特意修剪,以优化数据集的多样性与泛化能力。图像预处理环节确保了原始数据的质量,其中较长边被统一对齐至1400像素,为后续的模型训练提供了标准化的视觉素材基础。
特点
该数据集在动漫图像生成领域展现出鲜明的特色,不仅提供了原始图像与对应标签的配对数据,还包含多种预处理版本,如1200像素限幅版本及三阶段裁剪版本,适应不同分辨率需求的模型训练。数据集中图像涵盖了角色的多样化场景与服饰,从校服到休闲装扮,室内外环境均有涉及,并通过聚类分析呈现了标签组合的分布规律,为角色特征的细粒度研究提供了结构化视角。其丰富的元数据标注支持深入的视觉内容分析,助力生成模型捕捉角色细节与上下文关联。
使用方法
在文本到图像生成任务中,研究者可通过HuggingFace平台直接下载数据包的压缩文件,并利用提供的Python代码示例加载原始数据集。使用Waifuc工具库能够便捷地访问图像的元信息与标签,实现数据流的本地化处理。数据集的多个版本允许用户根据计算资源与模型需求灵活选择,例如高分辨率版本适用于细节生成,而裁剪版本则有利于提升训练效率。此外,聚类结果可作为角色属性挖掘的参考,辅助构建更精准的提示词工程与风格化生成实验。
背景与挑战
背景概述
在动漫角色图像生成与风格化研究领域,特定角色数据集的构建对于推动文本到图像生成模型的精细化发展具有关键意义。CyberHarem/hachiouji_naoto_donttoywithmemissnagatoro数据集由DeepGHS团队创建,专注于动漫《不要欺负我,长瀞同学》中的角色八王子直人。该数据集收录了798张图像及其对应标签,核心研究问题在于通过高质量、多来源的角色视觉数据,支持生成模型在角色一致性、细节还原和风格迁移方面的训练与评估。其构建依托于自动化爬虫系统,从Danbooru、Pixiv等多个知名动漫艺术平台采集数据,为动漫角色生成研究提供了重要的数据基础。
当前挑战
该数据集旨在解决动漫角色图像生成中角色特征一致性与细节还原的挑战,尤其在处理特定角色的多样化姿态、服饰和场景时,模型需准确捕捉如棕色短发、眼镜等核心视觉属性。在构建过程中,数据采集面临多源平台图像质量参差不齐、标签标准化困难等挑战,例如需要从非结构化艺术站点中提取并清洗元数据。此外,数据预处理涉及图像尺寸归一化与裁剪,以平衡细节保留与计算效率,而标签聚类分析则需克服语义重叠与稀疏性问题,以确保数据在生成任务中的有效性和代表性。
常用场景
经典使用场景
在动漫风格图像生成领域,该数据集聚焦于特定角色八王子直人的视觉特征,为文本到图像生成模型提供了高质量的标注训练素材。通过精心整理的798张图像及其标签,研究者能够针对角色属性如棕色短发、眼镜等细节进行模型微调,从而在生成动漫角色时实现更高的人物一致性和风格保真度。这类数据集常被用于探索生成对抗网络或扩散模型在特定风格下的表现,推动个性化角色生成的边界。
解决学术问题
该数据集有效应对了动漫角色生成中常见的特征一致性难题,为学术研究提供了解决细粒度属性控制的基准。通过提供精确的角色标签和多样化的视觉样本,它助力研究者攻克文本与图像对齐的挑战,特别是在处理复杂服饰、表情及场景组合时。其意义在于为可控图像生成领域建立了可复现的实验基础,促进了生成模型在理解语义细节方面的进步,对跨模态表示学习产生了积极影响。
衍生相关工作
围绕该数据集衍生的经典工作主要集中在动漫风格生成模型的优化与扩展上。例如,基于标签聚类的方法被用于探索角色服饰与场景的关联模式,进而改进条件生成网络的架构。同时,该数据集常作为基准测试的一部分,用于评估如Stable Diffusion等模型在动漫领域的适应能力。相关研究还涉及跨数据集迁移学习,将学到的角色特征泛化至其他动漫风格,推动了领域自适应技术的发展。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务