five

voyager_reverse1999

收藏
Hugging Face2024-08-05 更新2024-12-12 收录
下载链接:
https://huggingface.co/datasets/CyberHarem/voyager_reverse1999
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个关于Voyager/远旅/ボイジャー(リバース:1999)的数据集,包含85张图片及其标签。该数据集的核心标签包括蓝色头发、长发、发饰、多色头发、星形发饰、彩色内发、发带、金色头发、眼睛间的头发、非常长的头发、双色头发、蓝色眼睛、黑色发带、紫色眼睛等。这些图片从多个网站(如danbooru、pixiv、zerochan等)爬取,由DeepGHS团队开发的自动爬虫系统处理。数据集提供原始数据和经过处理的版本,后者经过裁剪和调整大小。
提供机构:
DeepGHS CyberHarem
创建时间:
2024-08-05
原始信息汇总

数据集概述

数据集名称

Dataset of Voyager/远旅/ボイジャー(リバース:1999) (Reverse:1999)

数据集描述

该数据集包含85张图像及其标签,主要标签包括blue_hair, long_hair, hair_intakes, hair_ornament, multicolored_hair, star_hair_ornament, colored_inner_hair, hairband, blonde_hair, hair_between_eyes, very_long_hair, two-tone_hair, blue_eyes, black_hairband, purple_eyes

数据集大小

  • 总图像数:85
  • 总大小:224.24 MiB

数据集下载

名称 图像数 大小 下载链接 类型 描述
raw 85 224.24 MiB Download Waifuc-Raw 包含元信息的原始数据(最小边对齐到1400像素,如果更大)。
stage3-p480-1200 214 334.28 MiB Download IMG+TXT 3阶段裁剪数据集,区域不小于480x480像素。

数据集加载

提供原始数据集(包括标记图像)用于waifuc加载。

标签聚类结果

原始文本版本

# 样本数 图像1 图像2 图像3 图像4 图像5 标签
0 8 1girl, black_dress, bow_(music), closed_mouth, holding_instrument, holding_violin, playing_instrument, solo, star_(symbol), white_apron, smile, juliet_sleeves, looking_at_viewer, maid, musical_note, upper_body
1 6 1girl, bow_(music), holding_instrument, holding_violin, playing_instrument, solo, star_(symbol), white_dress, white_gloves, closed_mouth, long_sleeves, smile, starry_sky, closed_eyes, pantyhose, puffy_sleeves
2 6 1girl, bow_(music), holding_instrument, holding_violin, long_sleeves, playing_instrument, solo, star_(symbol), white_apron, white_pantyhose, black_dress, closed_eyes, closed_mouth, star_(sky), full_body, standing, black_footwear, frilled_apron, mary_janes, musical_note, puffy_sleeves, smile
3 6 1girl, looking_at_viewer, smile, solo, black_dress, blush, closed_mouth, maid, simple_background, star_(symbol), upper_body, white_apron, frilled_apron, grey_background, juliet_sleeves, white_background

表格版本

# 样本数 图像1 图像2 图像3 图像4 图像5 1girl black_dress bow_(music) closed_mouth holding_instrument holding_violin playing_instrument solo star_(symbol) white_apron smile juliet_sleeves looking_at_viewer maid musical_note upper_body white_dress white_gloves long_sleeves starry_sky closed_eyes pantyhose puffy_sleeves white_pantyhose star_(sky) full_body standing black_footwear frilled_apron mary_janes blush simple_background grey_background white_background
0 8 X X X X X X X X X X X X X X X X
1 6 X X X X X X X X X X X X X X X X
2 6 X X X X X X X X X X X X X X X X X X X X X X
3 6 X X X X X X X X X X X X X X X X
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集通过自动化爬虫系统从多个知名艺术平台(如danbooru、pixiv、zerochan等)收集了85张与Voyager/远旅/ボイジャー(リバース:1999)相关的图像及其标签。这些图像经过筛选和修剪,确保其质量与主题一致性。数据集的核心标签涵盖了角色的发型、发饰、眼睛颜色等特征,进一步增强了数据的多样性与丰富性。
特点
该数据集的特点在于其高度结构化的标签系统,涵盖了角色的多种视觉特征,如蓝色头发、长头发、星形发饰等。此外,数据集提供了两种版本:原始数据和经过裁剪的版本,后者确保了图像的最小尺寸不低于480x480像素。这种多版本设计使得数据集能够适应不同的研究需求,尤其是在图像生成与处理领域。
使用方法
用户可以通过Hugging Face平台下载数据集的原始压缩包,并使用waifuc工具进行加载和处理。具体操作包括下载压缩文件、解压到指定目录,并通过waifuc的LocalSource类加载图像及其元数据。该数据集适用于文本到图像生成任务,尤其是基于角色特征的图像生成与分类研究。
背景与挑战
背景概述
Voyager/远旅/ボイジャー(リバース:1999)数据集由DeepGHS团队创建,专注于文本到图像生成任务,特别是与艺术相关的图像分类与标注。该数据集包含了85张图像及其对应的标签,涵盖了多种艺术风格和角色特征。数据集的核心标签包括蓝色头发、长发、发饰等,这些标签经过精心筛选和修剪,以确保数据的质量和一致性。数据集的构建依赖于从多个艺术站点(如Danbooru、Pixiv、Zerochan等)自动爬取的图像,展示了DeepGHS团队在图像数据采集与处理方面的技术实力。该数据集为艺术图像生成和角色设计领域的研究提供了重要的数据支持,推动了相关领域的技术进步。
当前挑战
Voyager/远旅/ボイジャー(リバース:1999)数据集在构建过程中面临多重挑战。首先,图像数据的多样性和复杂性使得标签的准确标注成为一大难题,尤其是涉及多色头发、复杂发饰等细节特征时,人工标注的准确性和一致性难以保证。其次,数据集的规模相对较小(少于1000张图像),这限制了其在深度学习模型训练中的应用效果,尤其是在需要大规模数据支持的图像生成任务中。此外,数据来源的多样性和版权问题也为数据集的构建带来了额外的复杂性,确保数据的合法性和可用性成为一项重要任务。这些挑战不仅影响了数据集的质量,也对相关领域的研究提出了更高的要求。
常用场景
经典使用场景
在动漫艺术创作领域,voyager_reverse1999数据集为研究者和艺术家提供了一个丰富的图像资源库。该数据集包含了85张高质量图像及其详细标签,涵盖了多种角色特征和艺术风格。这些图像不仅可用于角色设计的参考,还能为图像生成模型的训练提供多样化的素材,特别是在生成具有复杂发型和服饰细节的角色时,该数据集展现了其独特的价值。
解决学术问题
该数据集解决了动漫角色生成与识别中的关键问题,尤其是在多标签分类和图像生成领域。通过提供详细的角色特征标签,研究者可以更精确地训练模型,提升图像生成的质量和多样性。此外,数据集中的图像经过精心筛选和标注,能够有效支持图像风格迁移、角色识别等研究任务,推动了动漫艺术与计算机视觉的交叉领域发展。
衍生相关工作
基于voyager_reverse1999数据集,许多相关研究工作得以展开。例如,研究者利用该数据集开发了基于深度学习的多标签图像分类模型,显著提升了动漫角色识别的准确率。此外,该数据集还被用于生成对抗网络(GAN)的训练,推动了高质量动漫角色生成技术的发展。这些衍生工作不仅丰富了动漫艺术的研究内容,也为相关领域的创新提供了重要支持。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作