centurion_reverse1999
收藏Hugging Face2024-08-05 更新2024-12-12 收录
下载链接:
https://huggingface.co/datasets/CyberHarem/centurion_reverse1999
下载链接
链接失效反馈官方服务:
资源简介:
这是一个名为'Dataset of Centurion/百夫长 (Reverse:1999)'的数据集,包含22张图片及其标签。这些图片主要描述了一个具有深色皮肤、长发、黑色头发等特征的角色。数据集提供了原始数据和经过裁剪的数据包,以及标签聚类的结果,帮助用户更好地理解和利用数据集中的图片。
提供机构:
DeepGHS CyberHarem
创建时间:
2024-08-05
原始信息汇总
数据集概述
数据集信息
- 名称: Dataset of Centurion/百夫长 (Reverse:1999)
- 任务类别: text-to-image
- 标签: art, not-for-all-audiences
- 大小类别: n<1K
- 包含内容: 22张图片及其标签
- 核心标签: dark-skinned_female, long_hair, dark_skin, black_hair, earrings, multicolored_hair, breasts, streaked_hair, white_hair, hair_over_one_eye, yellow_eyes
数据包列表
| 名称 | 图片数量 | 大小 | 下载链接 | 类型 | 描述 |
|---|---|---|---|---|---|
| raw | 22 | 53.28 MiB | Download | Waifuc-Raw | 包含元信息的原始数据(最小边对齐到1400像素,如果更大)。 |
| stage3-p480-1200 | 52 | 75.95 MiB | Download | IMG+TXT | 3阶段裁剪数据集,区域不小于480x480像素。 |
标签聚类结果
原始文本版本
| # | 样本数量 | 图片1 | 图片2 | 图片3 | 图片4 | 图片5 | 标签 |
|---|---|---|---|---|---|---|---|
| 0 | 9 | Img-1 | Img-2 | Img-3 | Img-4 | Img-5 | 1girl, looking_at_viewer, black_bikini, smile, solo, necklace, shirt, bare_shoulders, bubble |
| 1 | 12 | Img-1 | Img-2 | Img-3 | Img-4 | Img-5 | 1girl, looking_at_viewer, solo, bracelet, smile, necklace, simple_background, white_background, black_pants, upper_body, white_jacket, white_shirt |
表格版本
| # | 样本数量 | 图片1 | 图片2 | 图片3 | 图片4 | 图片5 | 1girl | looking_at_viewer | black_bikini | smile | solo | necklace | shirt | bare_shoulders | bubble | bracelet | simple_background | white_background | black_pants | upper_body | white_jacket | white_shirt |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | 9 | Img-1 | Img-2 | Img-3 | Img-4 | Img-5 | X | X | X | X | X | X | X | X | X | |||||||
| 1 | 12 | Img-1 | Img-2 | Img-3 | Img-4 | Img-5 | X | X | X | X | X | X | X | X | X | X | X | X |
搜集汇总
数据集介绍

构建方式
该数据集的构建依托于自动化爬虫系统,从多个知名图像平台(如danbooru、pixiv、zerochan等)抓取图像数据。通过DeepGHS团队开发的工具,系统能够高效地收集并整理与Centurion/百夫长(Reverse:1999)相关的图像及其标签信息。数据集中的图像经过筛选和修剪,确保每张图像的最小边长不低于1400像素,同时保留了丰富的元数据信息。
特点
该数据集包含22张图像及其对应的标签,涵盖了Centurion/百夫长这一角色的核心特征,如深色皮肤、长发、耳环等。数据集还提供了不同裁剪版本的图像,例如stage3-p480-1200版本,确保图像区域不小于480x480像素,适合多样化的研究需求。此外,数据集通过标签聚类的方式,展示了不同服饰和场景下的图像分布,为深入分析提供了便利。
使用方法
用户可以通过Hugging Face平台下载数据集的原始文件或裁剪版本。对于需要使用waifuc工具加载数据的用户,提供了详细的代码示例,帮助用户快速提取并加载图像及其元数据。通过LocalSource接口,用户可以轻松遍历数据集中的每张图像,并访问其文件名和标签信息,便于进一步的分析或模型训练。
背景与挑战
背景概述
centurion_reverse1999数据集由DeepGHS团队创建,专注于文本到图像生成任务,特别是与艺术创作相关的图像标注。该数据集包含了22张图像及其对应的标签,主要围绕角色Centurion/百夫长的视觉特征进行标注,如深色皮肤、长发、耳环等。这些图像从多个艺术社区(如danbooru、pixiv、zerochan等)爬取,并通过自动化系统进行整理和标注。该数据集的构建旨在为艺术创作和图像生成模型提供高质量的标注数据,推动相关领域的研究与应用。
当前挑战
centurion_reverse1999数据集在构建过程中面临多重挑战。首先,图像来源的多样性和复杂性导致数据质量参差不齐,需通过自动化系统进行筛选和标注,以确保数据的准确性和一致性。其次,图像标签的精细化处理要求较高,特别是对于多标签分类和特征提取任务,如何有效捕捉角色的视觉特征并生成高质量的标签是一个技术难点。此外,数据集的规模较小(n<1K),可能限制了其在复杂模型训练中的泛化能力,如何扩展数据集规模并保持数据质量是未来需要解决的问题。
常用场景
经典使用场景
在数字艺术和角色设计领域,centurion_reverse1999数据集为研究人员和艺术家提供了一个丰富的视觉资源库。该数据集包含了22张经过精心标注的图像,涵盖了多种角色特征和艺术风格,特别适用于图像生成模型和风格迁移算法的训练与测试。
解决学术问题
该数据集解决了在图像生成和角色设计领域中,缺乏高质量、多样化标注数据的难题。通过提供详细的图像标签和多样化的角色特征,研究人员能够更精确地训练和评估图像生成模型,推动相关算法在艺术创作和虚拟角色设计中的应用。
衍生相关工作
基于centurion_reverse1999数据集,许多经典工作得以衍生。例如,研究人员开发了基于深度学习的图像生成模型,能够自动生成符合特定标签的角色形象。此外,该数据集还被用于风格迁移算法的研究,推动了数字艺术创作的技术进步。
以上内容由遇见数据集搜集并总结生成



