five

CyberHarem/wu_zetian_fgo

收藏
Hugging Face2024-03-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CyberHarem/wu_zetian_fgo
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个名为wu_zetian/武則天/武则天 (Fate/Grand Order)的数据集,包含472张图像及其标签。图像从多个网站(如danbooru, pixiv, zerochan等)爬取,并由DeepGHS团队提供技术支持。数据集的核心标签包括长头发、紫色头发、紫色眼睛等,这些标签在数据集中被修剪。

This is a dataset named wu_zetian/武則天/武则天 (Fate/Grand Order) that contains 472 images and their corresponding labels. The images were crawled from multiple websites including danbooru, pixiv, zerochan and other platforms, with technical support provided by the DeepGHS team. The core labels of the dataset include long hair, purple hair, purple eyes and other related attributes, and these labels were pruned within the dataset.
提供机构:
CyberHarem
原始信息汇总

数据集概述

数据集信息

  • 名称: Dataset of wu_zetian/武則天/武则天 (Fate/Grand Order)
  • 描述: 包含472张图片及其标签的数据集。
  • 核心标签: long_hair, purple_hair, purple_eyes, very_long_hair, parted_bangs, hair_ornament, breasts, twintails, scrunchie, sidelocks, small_breasts, hair_scrunchie, bow, yellow_scrunchie
  • 来源: 从多个网站(如danbooru, pixiv, zerochan等)爬取。
  • 爬虫系统: 由DeepGHS Team提供支持。

数据集包列表

名称 图片数量 大小 下载链接 类型 描述
raw 472 565.87 MiB Download Waifuc-Raw 包含元信息的原始数据(最小边对齐到1400像素,如果更大)。
1200 472 513.34 MiB Download IMG+TXT 短边不超过1200像素的数据集。
stage3-p480-1200 1172 1000.00 MiB Download IMG+TXT 3阶段裁剪数据集,区域不小于480x480像素。

加载原始数据集

  • 工具: waifuc

  • 代码示例: python import os import zipfile from huggingface_hub import hf_hub_download from waifuc.source import LocalSource

    下载原始压缩文件

    zip_file = hf_hub_download( repo_id=CyberHarem/wu_zetian_fgo, repo_type=dataset, filename=dataset-raw.zip, )

    解压文件到指定目录

    dataset_dir = dataset_dir os.makedirs(dataset_dir, exist_ok=True) with zipfile.ZipFile(zip_file, r) as zf: zf.extractall(dataset_dir)

    使用waifuc加载数据集

    source = LocalSource(dataset_dir) for item in source: print(item.image, item.meta[filename], item.meta[tags])

标签聚类结果

  • 描述: 标签聚类结果列表,可能包含一些服装信息。
  • 示例:
    # 样本数量 图片1 图片2 图片3 图片4 图片5 标签
    0 22 1girl, black_bikini, cleavage, hair_flower, looking_at_viewer, large_breasts, smile, forehead_mark, solo, black_cape, black_gloves, fur-trimmed_cape, half_gloves, thighs, ahoge, navel, collarbone, bare_shoulders, bracelet, halterneck, sitting, ponytail, simple_background
    1 6 1girl, bare_shoulders, forehead, looking_at_viewer, smile, solo, black_dress, ponytail, blush, earrings, hair_flower, sleeveless_dress, wrist_scrunchie, closed_mouth, hair_bow, simple_background, white_background, white_pantyhose
    2 7 1girl, bare_shoulders, blush, looking_at_viewer, navel, solo, collarbone, forehead_mark, hair_bow, open_mouth, :d, purple_bikini, earrings, fang, shawl
    3 6 1girl, bare_shoulders, black_one-piece_swimsuit, earrings, hair_between_eyes, highleg_swimsuit, looking_at_viewer, open_mouth, side_ponytail, smile, thighs, wrist_scrunchie, cleavage, large_breasts, medium_breasts, solo, thighlet, blush, collarbone, navel
    4 13 1girl, bow_bra, hanfu, long_sleeves, looking_at_viewer, navel, solo, string_bra, wide_sleeves, crown, forehead_mark, pelvic_curtain, blush, open_mouth, shawl, :d, gloves, simple_background, earrings, fang, revealing_clothes, white_background, open_clothes
    5 6 1girl, bare_shoulders, blush, collarbone, hanfu, long_sleeves, looking_at_viewer, off_shoulder, pelvic_curtain, purple_dress, shawl, smile, solo, strapless, wide_sleeves, forehead, sash, closed_mouth, sitting
    6 8 1girl, hanfu, long_sleeves, looking_at_viewer, purple_dress, sash, shawl, smile, wide_sleeves, blush, collarbone, simple_background, solo, white_background, closed_mouth, forehead, pelvic_curtain
    7 13 1girl, hanfu, long_sleeves, open_mouth, shawl, solo, wide_sleeves, :d, blush, collarbone, looking_at_viewer, sash, pelvic_curtain, fang, forehead, purple_dress, white_background, off_shoulder
    8 16 1girl, blush, nipples, hetero, penis, solo_focus, open_mouth, 1boy, navel, spread_legs, mosaic_censoring, loli, collarbone, sex, vaginal, cum_in_pussy, looking_at_viewer, hanfu, nude, sweat, forehead_mark, smile, straddling
    9 5 1girl, bare_shoulders, blush, bowtie, detached_collar, fake_animal_ears, forehead, looking_at_viewer, playboy_bunny, rabbit_ears, solo, strapless_leotard, hairband, open_mouth, :d, black_leotard, heart, rabbit_tail, simple_background, wrist_cuffs, arms_behind_back, ass, black_pantyhose, covered_navel, fang, red_leotard, white_background
    10 5 1girl, blush, solo, beret, black_skirt, forehead, looking_at_viewer, open_mouth, pleated_skirt, white_shirt, :d, brown_headwear, collared_shirt, homurahara_academy_school_uniform, long_sleeves, white_background, white_thighhighs, black_panties, brown_shirt, half-closed_eyes, holding_food, randoseru, ribbon, short_sleeves, simple_background
搜集汇总
数据集介绍
main_image_url
构建方式
在动漫角色图像数据集的构建领域,CyberHarem/wu_zetian_fgo数据集通过自动化爬虫技术,从Danbooru、Pixiv、Zerochan等多个知名图像社区系统性地采集了472幅以《Fate/Grand Order》中武则天角色为主题的视觉素材。原始数据经过预处理,将较长边缘统一对齐至1400像素,并剔除了角色的核心标签,以确保数据集的规范性与一致性。整个流程依托DeepGHS团队开发的自动化采集系统完成,体现了高效、规模化的数据整合能力。
特点
该数据集以多版本格式呈现,包括原始数据包、短边不超过1200像素的优化版本,以及经过三阶段裁剪、区域不小于480x480像素的增强版本,为不同计算需求提供灵活选择。数据集附有详细的标签聚类分析,通过视觉特征自动分组,揭示了角色在不同服饰、姿态与场景下的分布规律,如汉服、泳装、学院风等主题簇,为角色风格研究提供了结构化视角。其内容涵盖艺术性、角色特异性及部分成人向元素,标注了“不适合所有受众”的提示,体现了数据伦理的考量。
使用方法
研究者可通过Hugging Face Hub直接下载压缩包,或利用提供的Python代码加载原始数据集。使用Waifuc工具包时,可调用LocalSource接口读取本地解压后的数据,便捷访问图像及其元标签信息。对于模型训练,建议根据硬件条件选择相应版本:原始包适用于高分辨率生成任务,1200像素版本平衡质量与效率,而三阶段裁剪版本则优化了细节训练与数据增强。聚类表格可作为风格控制的参考,辅助构建条件生成或分类模型。
背景与挑战
背景概述
在数字艺术与生成式人工智能蓬勃发展的时代,针对特定角色或风格的图像数据集成为驱动文本到图像模型精细化生成的关键资源。CyberHarem/wu_zetian_fgo数据集聚焦于《Fate/Grand Order》中的角色武则天,由DeepGHS团队构建并发布于HuggingFace平台。该数据集收录了472幅图像及其对应标签,旨在为角色驱动的视觉内容生成提供高质量、标注详尽的训练样本。其核心研究问题在于解决二次元角色图像生成中风格一致性、细节还原与多样化姿态表达的难题,为动漫艺术生成与个性化内容创作领域注入了新的数据动力。
当前挑战
该数据集致力于应对动漫角色图像生成中的核心挑战:如何在保持角色固有视觉特征(如发色、瞳色、服饰细节)的同时,实现姿态、场景与艺术风格的多样化输出。构建过程中的挑战亦不容忽视:首先,从Danbooru、Pixiv等多源平台爬取图像需克服数据格式异构与版权合规性问题;其次,自动化标注系统需精准识别并修剪核心标签,避免噪声干扰;此外,数据清洗与聚类环节需处理图像质量参差、内容重复以及敏感内容过滤等复杂问题,确保数据集的纯净度与可用性。
常用场景
经典使用场景
在动漫艺术与计算机视觉交叉领域,该数据集聚焦于《Fate/Grand Order》中武则天角色的图像生成任务。通过472张精心标注的图像,它成为训练文本到图像生成模型的珍贵资源,尤其在风格化角色创作方面展现出独特价值。研究者能够利用这些带有详细标签的视觉数据,探索生成对抗网络或扩散模型在二次元人物绘制中的表现,推动艺术生成技术的边界。
衍生相关工作
围绕该数据集,已衍生出若干聚焦于动漫风格图像生成的经典研究工作。例如,基于其构建的角色特定生成模型,推动了标签条件图像合成技术的进步。相关探索进一步扩展到跨角色风格迁移、高分辨率动漫图像超分辨率等领域,形成了从数据采集、清洗到模型训练与评估的完整技术链条,为后续的动漫艺术生成研究奠定了坚实的数据与方法论基础。
数据集最近研究
最新研究方向
在动漫风格图像生成领域,特定角色数据集的构建与精细化标注正成为研究热点。以CyberHarem/wu_zetian_fgo数据集为例,其聚焦于《Fate/Grand Order》中的武则天角色,通过系统化采集与多维度标签聚类,为个性化角色生成模型提供了高质量的训练语料。当前前沿研究致力于利用此类结构化数据集,探索可控文本到图像生成的细粒度属性编辑技术,例如通过标签组合实现角色服饰、姿态与场景的精准定制。同时,结合生成对抗网络与扩散模型,学者们正尝试在保持角色身份一致性的前提下,提升生成图像的多样性与艺术表现力,这为动漫内容创作与数字娱乐产业带来了新的技术范式。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作