eternity_reverse1999
收藏Hugging Face2024-08-05 更新2024-12-12 收录
下载链接:
https://huggingface.co/datasets/CyberHarem/eternity_reverse1999
下载链接
链接失效反馈官方服务:
资源简介:
这是一个名为'永恒/温妮弗雷德 (Reverse:1999)'的数据集,包含36张图片及其标签。该数据集的核心标签包括'黄色眼睛、胸部、耳环、白发、灰发、长发'等角色特征。图片从多个网站(如danbooru、pixiv、zerochan等)爬取,爬虫系统由DeepGHS团队提供支持。数据集提供不同包,包括原始数据和裁剪数据集,以及使用waifuc包加载原始数据的方法。此外,还列出了标签聚类结果,以便进一步分析。
提供机构:
DeepGHS CyberHarem
创建时间:
2024-08-05
原始信息汇总
数据集概述
数据集名称
Dataset of Eternity/温妮弗雷德 (Reverse:1999)
数据集描述
该数据集包含36张图片及其标签,主要标签包括 yellow_eyes, breasts, earrings, white_hair, grey_hair, long_hair。
数据集来源
图片从多个网站(如danbooru, pixiv, zerochan等)爬取,爬虫系统由DeepGHS Team开发。
数据集包列表
| 名称 | 图片数量 | 大小 | 下载链接 | 类型 | 描述 |
|---|---|---|---|---|---|
| raw | 36 | 78.24 MiB | Download | Waifuc-Raw | 包含元信息的原始数据(最小边对齐到1400像素,如果更大) |
| stage3-p480-1200 | 98 | 133.98 MiB | Download | IMG+TXT | 3阶段裁剪数据集,区域不小于480x480像素 |
数据集加载
提供原始数据集(包括标记的图像)用于waifuc加载。
python import os import zipfile from huggingface_hub import hf_hub_download from waifuc.source import LocalSource
下载原始归档文件
zip_file = hf_hub_download( repo_id=CyberHarem/eternity_reverse1999, repo_type=dataset, filename=dataset-raw.zip, )
提取文件到指定目录
dataset_dir = dataset_dir os.makedirs(dataset_dir, exist_ok=True) with zipfile.ZipFile(zip_file, r) as zf: zf.extractall(dataset_dir)
使用waifuc加载数据集
source = LocalSource(dataset_dir) for item in source: print(item.image, item.meta[filename], item.meta[tags])
标签聚类结果
原始文本版本
| # | 样本数量 | 图片1 | 图片2 | 图片3 | 图片4 | 图片5 | 标签 |
|---|---|---|---|---|---|---|---|
| 0 | 7 | ![]() |
![]() |
![]() |
![]() |
![]() |
1girl, jewelry, smile, solo, cleavage, collarbone, long_sleeves, looking_at_viewer, white_dress, holding_cup, large_breasts, very_long_hair, closed_mouth, curtains, indoors, nightgown, white_background, window |
| 1 | 7 | ![]() |
![]() |
![]() |
![]() |
![]() |
1girl, coat, fur_trim, fur_hat, smile, solo, black_headwear, blue_gloves, looking_at_viewer, necklace, black_gloves, blue_dress, long_sleeves, sitting |
| 2 | 9 | ![]() |
![]() |
![]() |
![]() |
![]() |
1girl, bare_shoulders, solo, cleavage, looking_at_viewer, side_slit, smile, blue_dress, off-shoulder_dress, black_dress, large_breasts, necklace, ponytail, single_glove, closed_mouth, parted_lips |
表格版本
| # | 样本数量 | 图片1 | 图片2 | 图片3 | 图片4 | 图片5 | 1girl | jewelry | smile | solo | cleavage | collarbone | long_sleeves | looking_at_viewer | white_dress | holding_cup | large_breasts | very_long_hair | closed_mouth | curtains | indoors | nightgown | white_background | window | coat | fur_trim | fur_hat | black_headwear | blue_gloves | necklace | black_gloves | blue_dress | sitting | bare_shoulders | side_slit | off-shoulder_dress | black_dress | ponytail | single_glove | parted_lips |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | 7 | ![]() |
![]() |
![]() |
![]() |
![]() |
X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | ||||||||||
| 1 | 7 | ![]() |
![]() |
![]() |
![]() |
![]() |
X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | |||||||||||||||||||
| 2 | 9 | ![]() |
![]() |
![]() |
![]() |
![]() |
X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X |
搜集汇总
数据集介绍

构建方式
eternity_reverse1999数据集的构建依托于自动化爬虫系统,该系统由DeepGHS团队开发,能够从多个知名图像平台(如danbooru、pixiv、zerochan等)高效抓取图像数据。数据集中的图像经过筛选和修剪,确保每张图像的最小边长不低于1400像素,同时保留了丰富的元信息。这一构建方式不仅保证了数据的多样性和质量,还为后续的图像处理和分析提供了坚实的基础。
特点
该数据集包含了36张图像及其对应的标签,涵盖了丰富的视觉元素和细节。图像标签经过精心修剪,去除了核心标签如`yellow_eyes`、`breasts`等,以适应用户需求。数据集还提供了多种格式的下载选项,包括原始数据和经过裁剪的版本,裁剪后的图像面积不小于480x480像素,便于不同场景下的使用。此外,数据集还提供了标签聚类结果,帮助用户挖掘图像中的潜在模式。
使用方法
用户可以通过Hugging Face平台下载eternity_reverse1999数据集,支持原始数据和裁剪版本的下载。对于需要进一步处理的用户,数据集提供了与waifuc工具的兼容性,用户可以通过简单的Python代码加载和处理数据。具体操作包括下载压缩文件、解压到指定目录,并使用waifuc工具加载图像及其元信息。这一流程不仅简化了数据的使用,还为图像分析和模型训练提供了便利。
背景与挑战
背景概述
eternity_reverse1999数据集由DeepGHS团队创建,专注于文本到图像的生成任务,特别是与艺术相关的图像内容。该数据集包含了36张图像及其标签,主要围绕角色Eternity/温妮弗雷德展开,标签涵盖了如黄色眼睛、耳环、白色头发等特征。这些图像从多个知名艺术平台(如danbooru、pixiv、zerochan等)爬取而来,展示了该角色在不同场景中的多样化表现。该数据集的构建旨在为艺术生成模型提供高质量的图像-文本对,推动文本到图像生成技术的发展。
当前挑战
eternity_reverse1999数据集在构建过程中面临多重挑战。首先,图像爬取与筛选需要处理大量噪声数据,确保图像质量与标签的准确性。其次,标签的精细化处理是另一大挑战,尤其是在去除冗余标签的同时保留关键特征。此外,数据集的规模较小(少于1000张图像),限制了其在复杂模型训练中的应用。最后,数据集的多样性与代表性仍需进一步提升,以覆盖更广泛的场景与风格,从而更好地服务于文本到图像生成任务的研究与应用。
常用场景
经典使用场景
在数字艺术与动漫角色设计领域,eternity_reverse1999数据集为研究人员和艺术家提供了一个丰富的视觉资源库。该数据集包含了36张高质量图像及其标签,涵盖了多种角色特征和服饰风格,特别适用于图像生成模型的训练与测试。通过使用这些图像,研究人员可以探索文本到图像生成技术的前沿应用,尤其是在角色设计和风格化图像生成方面。
实际应用
在实际应用中,eternity_reverse1999数据集被广泛用于动漫角色设计、游戏开发以及虚拟偶像的创建。设计师和开发者可以利用该数据集中的图像和标签信息,快速生成符合特定风格的角色形象,从而缩短开发周期并提高创作效率。此外,该数据集还为虚拟现实和增强现实中的角色建模提供了高质量的视觉素材。
衍生相关工作
eternity_reverse1999数据集催生了一系列与动漫角色生成相关的研究工作。例如,基于该数据集的生成对抗网络(GAN)模型在角色风格迁移和多样化生成方面取得了显著进展。此外,该数据集还被用于研究如何通过文本描述生成具有特定情感和风格的角色图像,推动了文本到图像生成技术在艺术创作中的应用。
以上内容由遇见数据集搜集并总结生成


















