37_reverse1999
收藏Hugging Face2024-08-05 更新2024-12-12 收录
下载链接:
https://huggingface.co/datasets/CyberHarem/37_reverse1999
下载链接
链接失效反馈官方服务:
资源简介:
这是一个包含168张图片及其标签的'37/重返未来37/37(リバース:1999) (Reverse:1999)'数据集。该数据集主要标签包括`long_hair, blue_hair, blue_eyes, very_long_hair, hair_between_eyes`。图片从多个网站(如danbooru, pixiv, zerochan等)爬取,由[DeepGHS Team](https://github.com/deepghs)开发的自动爬虫系统支持。数据集分为多个包,包括原始数据和经过处理的图像,部分包包含超过168张图片。README文件还提供了使用waifuc库加载原始数据集的说明,并列出了基于标签的图像集群。
提供机构:
DeepGHS CyberHarem
创建时间:
2024-08-05
原始信息汇总
数据集概述
基本信息
- 数据集名称: 37/重返未来37/37(リバース:1999) (Reverse:1999)
- 许可证: MIT
- 任务类别: text-to-image
- 标签: art, not-for-all-audiences
- 数据量: n<1K
数据内容
- 图像数量: 168张
- 核心标签: long_hair, blue_hair, blue_eyes, very_long_hair, hair_between_eyes
数据包列表
| 名称 | 图像数量 | 大小 | 下载链接 | 类型 | 描述 |
|---|---|---|---|---|---|
| raw | 168 | 386.76 MiB | Download | Waifuc-Raw | 包含元信息的原始数据(最小边对齐到1400像素,如果更大) |
| stage3-p480-1200 | 416 | 584.01 MiB | Download | IMG+TXT | 3阶段裁剪数据集,区域不小于480x480像素 |
数据加载
-
加载工具: waifuc
-
加载代码: python import os import zipfile from huggingface_hub import hf_hub_download from waifuc.source import LocalSource
下载原始归档文件
zip_file = hf_hub_download( repo_id=CyberHarem/37_reverse1999, repo_type=dataset, filename=dataset-raw.zip, )
解压文件到指定目录
dataset_dir = dataset_dir os.makedirs(dataset_dir, exist_ok=True) with zipfile.ZipFile(zip_file, r) as zf: zf.extractall(dataset_dir)
使用waifuc加载数据集
source = LocalSource(dataset_dir) for item in source: print(item.image, item.meta[filename], item.meta[tags])
标签聚类结果
- 示例:
# 样本数量 标签 0 13 1girl, ancient_greek_clothes, solo, greco-roman_clothes, toga, barefoot, full_body, white_dress, sitting, closed_mouth, anklet, bare_shoulders, gold_choker, looking_at_viewer, sky, feet, holding, smile, toes 1 8 1girl, ancient_greek_clothes, greco-roman_clothes, solo, toga, white_dress, gold_choker, parted_lips, looking_at_viewer, bare_shoulders, floating_hair, armlet, jewelry, star_(sky) 2 6 1girl, ancient_greek_clothes, collarbone, gold_choker, greco-roman_clothes, solo, toga, arm_up, bare_shoulders, braid, off_shoulder, holding, jewelry, long_sleeves, parted_lips, single_bare_shoulder, breasts, cowboy_shot, looking_at_viewer, outdoors, sky, white_dress 3 9 1girl, gold_choker, simple_background, solo, white_background, collarbone, looking_at_viewer, ancient_greek_clothes, greco-roman_clothes, toga, upper_body, bare_shoulders, closed_mouth, dress, hairband, hand_up 4 5 ancient_greek_clothes, bare_shoulders, gold_choker, greco-roman_clothes, simple_background, smile, toga, white_background, collarbone, upper_body, 1girl, closed_mouth, looking_at_viewer, red_hair, solo_focus, 1boy, armlet, hair_over_one_eye, jewelry, white_dress 5 8 1girl, solo, white_dress, bare_shoulders, bird, ocean, outdoors, toga, water, ancient_greek_clothes, gold_choker, greco-roman_clothes, armlet, blue_sky, cloud, day, floating_hair, from_side, looking_at_viewer, braid, closed_mouth, hand_up, jewelry, open_mouth, profile 6 10 1girl, solo, green_dress, veil, braid, looking_at_viewer, necklace, white_flower, closed_mouth, hair_flower, ribbon, sleeveless, smile, beads, aqua_eyes, bird, holding
搜集汇总
数据集介绍

构建方式
37_reverse1999数据集的构建过程主要依赖于自动化爬虫技术,从多个知名图像平台(如danbooru、pixiv、zerochan等)收集了168张与角色37/重返未来37相关的图像及其标签。这些图像经过筛选和裁剪,确保最小边长不小于480像素,且保留了原始图像的元信息。数据集的核心标签包括`long_hair, blue_hair, blue_eyes, very_long_hair, hair_between_eyes`,并通过DeepGHS团队的自动化系统进行整理和优化。
特点
该数据集的特点在于其专注于角色37/重返未来37的图像集合,涵盖了多样化的艺术风格和场景。图像经过精心裁剪和分类,确保每张图像的分辨率和内容质量。数据集还提供了详细的标签信息,便于用户进行图像检索和分析。此外,数据集分为原始数据包和经过三阶段裁剪的优化数据包,满足不同研究需求。
使用方法
用户可以通过Hugging Face平台下载数据集的原始或优化版本。对于需要使用waifuc工具加载原始数据的用户,提供了详细的代码示例,支持从Hugging Face下载并解压数据包,随后通过waifuc进行本地加载。数据集适用于图像生成、角色分析等任务,用户可根据需求选择不同的数据包进行实验和研究。
背景与挑战
背景概述
37_reverse1999数据集由DeepGHS团队创建,专注于文本到图像的生成任务,特别是与艺术相关的图像生成。该数据集包含了168张图像及其对应的标签,主要围绕角色37/重返未来37/37(リバース:1999)展开。这些图像从多个知名站点(如danbooru、pixiv、zerochan等)爬取,并通过自动爬取系统进行整理。数据集的核心标签包括`long_hair, blue_hair, blue_eyes, very_long_hair, hair_between_eyes`等,这些标签经过修剪以提升数据集的精确性。该数据集的发布为艺术生成领域的研究提供了丰富的素材,尤其在角色设计和图像生成任务中具有重要参考价值。
当前挑战
37_reverse1999数据集在构建过程中面临多重挑战。首先,图像爬取过程中需要处理不同来源的图像质量差异,确保图像的分辨率和清晰度符合研究需求。其次,标签的修剪和标准化是一个复杂的过程,需要确保标签的准确性和一致性,以避免模型训练中的噪声干扰。此外,数据集规模相对较小(n<1K),可能限制了其在深度学习模型中的泛化能力。最后,由于数据集涉及艺术图像,如何在不侵犯版权的前提下合法获取和使用这些图像也是一个重要的法律和伦理挑战。这些挑战共同构成了该数据集在应用和研究中的主要障碍。
常用场景
经典使用场景
在动漫艺术创作领域,37_reverse1999数据集为研究者和艺术家提供了一个丰富的图像资源库,特别是针对角色设计和风格化表现的探索。该数据集包含了168张图像及其标签,涵盖了多种艺术风格和角色特征,能够为动漫角色的视觉表现提供多样化的参考。通过分析这些图像,研究者可以深入探讨角色设计中的色彩搭配、服饰细节以及情感表达等关键要素。
实际应用
在实际应用中,37_reverse1999数据集被广泛用于动漫游戏开发、角色设计以及艺术创作中。开发者可以利用该数据集中的图像资源,快速生成符合特定风格的角色设计,提升游戏或动漫作品的视觉表现力。同时,该数据集也为艺术创作者提供了丰富的灵感来源,帮助他们更好地理解和应用动漫艺术中的视觉语言。
衍生相关工作
基于37_reverse1999数据集,许多相关研究工作得以展开。例如,研究者利用该数据集训练了多种图像生成模型,如GAN和VAE,生成了大量风格化的动漫角色图像。此外,该数据集还被用于动漫角色情感分析的研究中,通过分析图像中的表情和姿态,探讨角色情感表达的多样性和复杂性。这些研究工作不仅推动了动漫艺术的发展,也为相关领域的技术创新提供了新的思路。
以上内容由遇见数据集搜集并总结生成



