sylus_love_and_deepspace
收藏Hugging Face2024-07-19 更新2024-12-12 收录
下载链接:
https://huggingface.co/datasets/CyberHarem/sylus_love_and_deepspace
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含44张来自'Love and Deepspace'的角色Sylus/秦彻/シン/진的图片及其标签。这些图片的核心标签包括'短发、红眼、白发、灰发、面部有血'。数据集提供原始和处理后的版本,原始版本包含元信息,处理后的版本经过裁剪并优化为特定尺寸。图片来源于多个网站,并由DeepGHS团队开发的自动爬虫系统收集。此外,数据集还提供了基于标签相似性的集群列表,有助于进一步分析或挖掘特定服装或特征。
提供机构:
DeepGHS CyberHarem
创建时间:
2024-07-19
原始信息汇总
数据集概述
数据集信息
- 名称: Dataset of Sylus/秦彻/シン/진 (Love and Deepspace)
- 许可证: MIT
- 任务类别: text-to-image
- 标签: art, not-for-all-audiences
- 大小类别: n<1K
数据内容
- 图像数量: 44
- 核心标签: short_hair, red_eyes, white_hair, grey_hair, blood_on_face
数据包列表
| 名称 | 图像数量 | 大小 | 类型 | 描述 | 图像-头部 | 图像-其他 |
|---|---|---|---|---|---|---|
| raw | 44 | 102.25 MiB | Waifuc-Raw | 包含元信息的原始数据(最小边对齐到1400像素,如果更大) | -- | -- |
| stage3-p480-1200 | 105 | 154.16 MiB | IMG+TXT | 3阶段裁剪数据集,区域不小于480x480像素 | 42 | 63 |
数据加载
-
加载工具: waifuc
-
代码示例: python import os import zipfile from huggingface_hub import hf_hub_download from waifuc.source import LocalSource
下载原始归档文件
zip_file = hf_hub_download( repo_id=CyberHarem/sylus_love_and_deepspace, repo_type=dataset, filename=dataset-raw.zip, )
提取文件到指定目录
dataset_dir = dataset_dir os.makedirs(dataset_dir, exist_ok=True) with zipfile.ZipFile(zip_file, r) as zf: zf.extractall(dataset_dir)
使用waifuc加载数据集
source = LocalSource(dataset_dir) for item in source: print(item.image, item.meta[filename], item.meta[tags])
标签聚类结果
原始文本版本
| # | 样本数量 | 图像1 | 图像2 | 图像3 | 图像4 | 图像5 | 标签 |
|---|---|---|---|---|---|---|---|
| 0 | 8 | 图像链接 | 图像链接 | 图像链接 | 图像链接 | 图像链接 | 1boy, 1girl, long_hair, black_shirt, black_hair, blood, hetero, jewelry, looking_at_viewer, smile |
| 1 | 6 | 图像链接 | 图像链接 | 图像链接 | 图像链接 | 图像链接 | sitting, 1boy, black_pants, holding, indoors, male_focus, black_footwear, black_jacket, collared_shirt, couch, looking_at_viewer, solo_focus, bottle, crossed_legs, drinking_glass, necklace, shoes, white_shirt |
| 2 | 6 | 图像链接 | 图像链接 | 图像链接 | 图像链接 | 图像链接 | 1boy, male_focus, solo, black_shirt, closed_mouth, crow, upper_body, collared_shirt, jacket, looking_at_viewer, animal_on_shoulder, blood, smile, white_background |
| 3 | 10 | 图像链接 | 图像链接 | 图像链接 | 图像链接 | 图像链接 | 1boy, male_focus, solo, simple_background, white_background, looking_at_viewer, upper_body, collared_shirt, blood, jacket, parted_lips |
表格版本
| # | 样本数量 | 图像1 | 图像2 | 图像3 | 图像4 | 图像5 | 1boy | 1girl | long_hair | black_shirt | black_hair | blood | hetero | jewelry | looking_at_viewer | smile | sitting | black_pants | holding | indoors | male_focus | black_footwear | black_jacket | collared_shirt | couch | solo_focus | bottle | crossed_legs | drinking_glass | necklace | shoes | white_shirt | solo | closed_mouth | crow | upper_body | jacket | animal_on_shoulder | white_background | simple_background | parted_lips |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | 8 | 图像链接 | 图像链接 | 图像链接 | 图像链接 | 图像链接 | X | X | X | X | X | X | X | X | X | X | |||||||||||||||||||||||||
| 1 | 6 | 图像链接 | 图像链接 | 图像链接 | 图像链接 | 图像链接 | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | |||||||||||||||||
| 2 | 6 | 图像链接 | 图像链接 | 图像链接 | 图像链接 | 图像链接 | X | X | X | X | X | X | X | X | X | X | X | X | X | X | |||||||||||||||||||||
| 3 | 10 | 图像链接 | 图像链接 | 图像链接 | 图像链接 | 图像链接 | X | X | X | X | X | X | X | X | X | X | X |
搜集汇总
数据集介绍

构建方式
该数据集围绕角色Sylus/秦彻/シン/진(Love and Deepspace)构建,包含44张图像及其标签。图像通过自动化爬虫系统从多个平台(如danbooru、pixiv、zerochan等)收集,并由DeepGHS团队提供技术支持。数据集分为原始数据和经过裁剪处理的版本,裁剪后的图像确保最小边不小于480像素,以满足不同应用场景的需求。
特点
该数据集的核心特点在于其图像标签的丰富性和多样性。每张图像均附有详细的标签,如`short_hair`、`red_eyes`、`white_hair`等,这些标签经过精心筛选和修剪,确保数据的高质量。此外,数据集还提供了图像聚类结果,展示了不同标签组合下的图像分布,为研究角色特征和风格提供了便利。
使用方法
用户可以通过Hugging Face平台下载数据集的原始文件或裁剪版本。对于需要进一步处理数据的用户,提供了基于waifuc工具的加载方法,支持本地解压和图像元数据的提取。通过简单的Python脚本,用户可以快速加载图像及其标签,进行后续的分析或模型训练。
背景与挑战
背景概述
sylus_love_and_deepspace数据集由DeepGHS团队创建,专注于二次元角色Sylus/秦彻/シン/진的图像及其标签的收集与整理。该数据集包含44张图像,涵盖了角色的多种特征标签,如`short_hair`、`red_eyes`、`white_hair`等。这些图像主要从danbooru、pixiv、zerochan等知名二次元图像平台爬取,并通过自动化系统进行整理与标注。该数据集的构建旨在为二次元角色图像生成与标签分析提供高质量的数据支持,推动了二次元艺术创作与人工智能生成技术的结合。
当前挑战
sylus_love_and_deepspace数据集在构建过程中面临多重挑战。首先,图像来源的多样性与复杂性导致数据质量参差不齐,需通过自动化系统进行筛选与清洗。其次,标签的准确性与一致性是核心问题,尤其在处理多语言标签时,如何确保语义的统一与精确成为难点。此外,数据集的规模较小(n<1K),限制了其在深度学习模型训练中的广泛应用。如何扩展数据规模并保持高质量标注,是该数据集未来发展的主要挑战。
常用场景
经典使用场景
在动漫与游戏角色设计领域,sylus_love_and_deepspace数据集为研究者提供了丰富的图像资源,尤其是围绕角色Sylus/秦彻/シン/진的视觉表现。该数据集通过包含44张图像及其标签,支持从角色特征分析到图像生成模型的训练。经典使用场景包括角色设计中的风格化研究、图像生成模型的训练与优化,以及基于标签的视觉特征提取与分析。
解决学术问题
该数据集解决了动漫与游戏角色设计中的多个学术问题,尤其是在角色视觉特征的自动提取与分类方面。通过提供详细的标签信息,研究者可以深入分析角色的视觉特征,如发型、眼睛颜色、服装风格等,进而推动角色设计自动化的研究。此外,数据集还为图像生成模型的训练提供了高质量的数据支持,解决了生成模型在动漫风格图像生成中的精度问题。
衍生相关工作
基于sylus_love_and_deepspace数据集,衍生了许多与动漫角色设计相关的研究工作。例如,研究者利用该数据集开发了基于深度学习的角色风格迁移模型,能够将一种角色风格迁移到另一种角色上。此外,该数据集还被用于训练生成对抗网络(GAN)模型,生成高质量的动漫风格图像,推动了动漫图像生成领域的技术进步。
以上内容由遇见数据集搜集并总结生成



