five

sonetto_reverse1999

收藏
Hugging Face2024-08-05 更新2024-12-12 收录
下载链接:
https://huggingface.co/datasets/CyberHarem/sonetto_reverse1999
下载链接
链接失效反馈
官方服务:
资源简介:
这是'Sonetto/十四行诗/ソネット(リバース:1999)'数据集,包含282张图片及其标签。该角色的核心标签为'橙色头发、长发、两侧上扬、绿色眼睛、辫子、侧辫',这些标签在此数据集中进行了修剪。图片从多个网站(如danbooru、pixiv、zerochan等)爬取,自动爬取系统由[DeepGHS Team](https://github.com/deepghs)提供支持。数据集提供原始数据和不同阶段的裁剪数据,以及如何使用'waifuc'加载原始数据集的说明。此外,还提供了标签聚类结果的列表,可能有助于挖掘某些服装。
提供机构:
DeepGHS CyberHarem
创建时间:
2024-08-05
原始信息汇总

数据集概述

数据集名称

Dataset of Sonetto/十四行诗/ソネット(リバース:1999) (Reverse:1999)

数据集描述

该数据集包含282张图片及其标签,主要角色标签为orange_hair, long_hair, two_side_up, green_eyes, braid, side_braid

数据来源

图片从多个网站(如danbooru, pixiv, zerochan等)爬取,爬虫系统由DeepGHS Team提供支持。

数据集包列表

名称 图片数量 大小 下载链接 类型 描述
raw 282 556.39 MiB Download Waifuc-Raw 包含元信息的原始数据(最小边对齐到1400像素,如果更大)。
stage3-p480-1200 685 881.15 MiB Download IMG+TXT 3阶段裁剪数据集,区域不小于480x480像素。

数据集加载

提供原始数据集(包括标记的图像)用于waifuc加载。

标签聚类结果

列出了标签聚类的结果,可能从中挖掘出一些服装信息。

原始文本版本

# 样本数量 图片1 图片2 图片3 图片4 图片5 标签
0 11 2girls, simple_background, white_background, blush, long_sleeves, open_mouth, upper_body, solo_focus, yuri, grey_hair, smile, white_dress, closed_eyes, coat, collared_shirt, jacket, white_shirt
1 10 2girls, closed_mouth, long_sleeves, simple_background, white_background, white_dress, blush, coat, grey_hair, yuri, solo_focus, white_shirt, upper_body, white_gloves, white_pants
2 8 simple_background, 1girl, looking_at_viewer, portrait, solo, closed_mouth, white_background, upper_body, white_shirt, :o, parted_lips
3 11 aged_down, white_dress, white_hairband, 1girl, closed_mouth, solo_focus, 2girls, full_body, puffy_long_sleeves, white_socks, black_footwear, holding, shoes, standing, child, collared_dress
4 6 1girl, high_collar, long_sleeves, solo, upper_body, white_dress, holding_pen, looking_at_viewer, white_gloves, grey_sleeves, magic, closed_mouth, dark_background, floating_hair, hand_up, holding_wand
5 5 1girl, high_collar, solo, white_dress, white_gloves, grey_sleeves, holding_pen, looking_at_viewer, black_background, capelet, closed_mouth, cowboy_shot, floating_hair, parted_lips, thigh_strap, white_pants, feet_out_of_frame, hand_up, puffy_long_sleeves, short_dress, thigh_belt
6 6 solo_focus, white_dress, white_gloves, grey_sleeves, holding, outdoors, puffy_long_sleeves, white_pants, 2girls, building, hand_up, high_collar, looking_at_viewer, parted_lips, standing, 1girl, full_body, hat, rain
7 14 1girl, solo, long_sleeves, looking_at_viewer, glasses, hairband, round_eyewear, closed_mouth, black_footwear, blue_dress, bowtie, full_body, hand_up, socks, white_background, black_bow, checkered_clothes, hair_bow, holding_book, shirt, simple_background, upper_body
8 7 1girl, white_background, white_shirt, full_body, long_sleeves, simple_background, solo, hairband, looking_at_viewer, long_skirt, blue_skirt, boots, holding, open_mouth, smile, standing, very_long_hair
9 7 solo_focus, 2girls, white_dress, upper_body, 1girl, closed_mouth, high_collar, long_sleeves, sitting
10 16 1girl, solo, white_dress, white_gloves, sleeveless_dress, white_headwear, elbow_gloves, hand_up, shoulder_sash, bird, floating_hair, high_collar, yellow_sash, looking_at_viewer, outdoors, parted_lips, upper_body, beret, blue_sky, closed_mouth, day, holding

表格版本

| # | 样本数量 | 图片1 | 图片2 | 图片3 | 图片4 | 图片5 | 2girls | simple_background | white_background | blush | long_sleeves | open_mouth | upper_body | solo_focus | yuri | grey_hair | smile | white_dress | closed_eyes | coat | collared_shirt | jacket | white_shirt | closed_mouth | white_gloves

搜集汇总
数据集介绍
main_image_url
构建方式
sonetto_reverse1999数据集的构建依托于自动化爬虫系统,该系统由DeepGHS团队开发,能够从多个知名图像平台(如danbooru、pixiv、zerochan等)高效抓取图像数据。数据集包含282张图像及其对应的标签,这些标签经过精心筛选,保留了与角色特征相关的核心标签,如`orange_hair`、`long_hair`等。图像数据经过预处理,确保最小边缘对齐至1400像素,以满足高质量图像分析的需求。
特点
该数据集的特点在于其专注于特定角色Sonetto的图像集合,涵盖了多样化的艺术风格和场景。图像标签经过聚类处理,便于用户快速定位特定主题或风格的图像。此外,数据集提供了两种格式的下载选项:原始数据包和经过三阶段裁剪的数据包,后者确保图像区域不小于480x480像素,适合不同分辨率需求的图像处理任务。
使用方法
用户可通过Hugging Face平台下载数据集,并使用waifuc工具加载原始数据包。waifuc支持本地数据源的加载,用户可通过简单的Python代码实现数据集的解压与读取。数据集中的每张图像均附带元信息,包括文件名和标签,便于用户进行进一步的分析或模型训练。此外,数据集还提供了标签聚类结果,用户可基于聚类结果挖掘特定主题的图像集合。
背景与挑战
背景概述
sonetto_reverse1999数据集由DeepGHS团队创建,专注于文本到图像的生成任务,特别是与艺术和二次元文化相关的图像生成。该数据集包含了282张图像及其对应的标签,主要围绕角色Sonetto的特征进行标注,如橙色头发、长辫子、绿色眼睛等。这些图像从多个知名二次元图像平台(如danbooru、pixiv、zerochan等)爬取而来,并通过自动化系统进行处理和筛选。该数据集的构建旨在为艺术创作和图像生成模型提供高质量的标注数据,推动二次元文化在人工智能领域的应用。
当前挑战
sonetto_reverse1999数据集在构建过程中面临多重挑战。首先,图像来源的多样性和复杂性使得数据爬取和清洗过程变得尤为困难,尤其是在确保图像质量和标签准确性的同时,还需避免版权纠纷。其次,由于二次元图像的特征多样且风格各异,如何有效提取和标注核心特征(如发型、服饰、表情等)成为一大难题。此外,数据集的规模相对较小(n<1K),可能限制了其在深度学习模型训练中的泛化能力。最后,如何在不影响图像质量的前提下,对图像进行裁剪和标准化处理,也是数据集构建过程中需要解决的技术挑战。
常用场景
经典使用场景
在艺术与图像生成领域,sonetto_reverse1999数据集为研究者提供了一个丰富的图像资源库,特别是针对二次元风格的角色设计。该数据集包含了282张图像及其标签,涵盖了多种角色特征,如橙色长发、绿色眼睛等。这些图像来源于多个知名站点,如danbooru、pixiv等,确保了数据的多样性和代表性。研究者可以利用这些数据进行图像生成模型的训练,特别是针对特定角色特征的生成任务。
衍生相关工作
基于sonetto_reverse1999数据集,研究者们已经开展了一系列相关工作。例如,利用该数据集进行图像生成模型的优化,提升了生成图像的细节和真实感。此外,还有研究专注于图像标签的自动生成和分类,进一步提高了图像理解的准确性。这些工作不仅推动了图像生成技术的发展,还为相关领域的应用提供了新的思路和方法。
数据集最近研究
最新研究方向
在文本到图像生成领域,sonetto_reverse1999数据集的最新研究方向主要集中在如何通过深度学习模型更精确地生成与文本描述相匹配的图像。该数据集包含了282张图像及其标签,涵盖了丰富的艺术风格和角色特征,如橙色头发、长头发、绿色眼睛等。这些特征为研究者提供了多样化的训练样本,有助于提升模型在生成复杂角色形象时的表现。此外,数据集中的图像经过多阶段裁剪处理,确保了图像质量的一致性,为模型训练提供了高质量的数据支持。随着生成对抗网络(GAN)和变分自编码器(VAE)等技术的不断进步,该数据集在推动文本到图像生成技术的实际应用中具有重要的研究价值。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作