five

CyberHarem/viper_nikke

收藏
Hugging Face2024-01-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CyberHarem/viper_nikke
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: mit task_categories: - text-to-image tags: - art - not-for-all-audiences size_categories: - n<1K --- # Dataset of viper/バイパー/毒蛇/바이퍼 (Nikke: Goddess of Victory) This is the dataset of viper/バイパー/毒蛇/바이퍼 (Nikke: Goddess of Victory), containing 335 images and their tags. The core tags of this character are `long_hair, breasts, bangs, large_breasts, red_eyes, horns, brown_hair, hair_ornament, animal_ears, rabbit_ears, fake_animal_ears`, which are pruned in this dataset. Images are crawled from many sites (e.g. danbooru, pixiv, zerochan ...), the auto-crawling system is powered by [DeepGHS Team](https://github.com/deepghs)([huggingface organization](https://huggingface.co/deepghs)). ## List of Packages | Name | Images | Size | Download | Type | Description | |:-----------------|---------:|:------------|:-------------------------------------------------------------------------------------------------------------|:-----------|:---------------------------------------------------------------------| | raw | 335 | 611.82 MiB | [Download](https://huggingface.co/datasets/CyberHarem/viper_nikke/resolve/main/dataset-raw.zip) | Waifuc-Raw | Raw data with meta information (min edge aligned to 1400 if larger). | | 800 | 335 | 295.32 MiB | [Download](https://huggingface.co/datasets/CyberHarem/viper_nikke/resolve/main/dataset-800.zip) | IMG+TXT | dataset with the shorter side not exceeding 800 pixels. | | stage3-p480-800 | 843 | 646.47 MiB | [Download](https://huggingface.co/datasets/CyberHarem/viper_nikke/resolve/main/dataset-stage3-p480-800.zip) | IMG+TXT | 3-stage cropped dataset with the area not less than 480x480 pixels. | | 1200 | 335 | 517.23 MiB | [Download](https://huggingface.co/datasets/CyberHarem/viper_nikke/resolve/main/dataset-1200.zip) | IMG+TXT | dataset with the shorter side not exceeding 1200 pixels. | | stage3-p480-1200 | 843 | 1010.80 MiB | [Download](https://huggingface.co/datasets/CyberHarem/viper_nikke/resolve/main/dataset-stage3-p480-1200.zip) | IMG+TXT | 3-stage cropped dataset with the area not less than 480x480 pixels. | ### Load Raw Dataset with Waifuc We provide raw dataset (including tagged images) for [waifuc](https://deepghs.github.io/waifuc/main/tutorials/installation/index.html) loading. If you need this, just run the following code ```python import os import zipfile from huggingface_hub import hf_hub_download from waifuc.source import LocalSource # download raw archive file zip_file = hf_hub_download( repo_id='CyberHarem/viper_nikke', repo_type='dataset', filename='dataset-raw.zip', ) # extract files to your directory dataset_dir = 'dataset_dir' os.makedirs(dataset_dir, exist_ok=True) with zipfile.ZipFile(zip_file, 'r') as zf: zf.extractall(dataset_dir) # load the dataset with waifuc source = LocalSource(dataset_dir) for item in source: print(item.image, item.meta['filename'], item.meta['tags']) ``` ## List of Clusters List of tag clustering result, maybe some outfits can be mined here. ### Raw Text Version | # | Samples | Img-1 | Img-2 | Img-3 | Img-4 | Img-5 | Tags | |----:|----------:|:--------------------------------|:--------------------------------|:--------------------------------|:--------------------------------|:--------------------------------|:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| | 0 | 16 | ![](samples/0/clu0-sample0.png) | ![](samples/0/clu0-sample1.png) | ![](samples/0/clu0-sample2.png) | ![](samples/0/clu0-sample3.png) | ![](samples/0/clu0-sample4.png) | 1girl, looking_at_viewer, solo, open_jacket, pink_jacket, pleated_skirt, smile, midriff, cleavage, crop_top, long_sleeves, choker, bare_shoulders, blush, holding_phone, off_shoulder, open_mouth, smartphone, white_skirt, fishnet_pantyhose, mouth_mask, shirt, chain, simple_background, white_background | | 1 | 12 | ![](samples/1/clu1-sample0.png) | ![](samples/1/clu1-sample1.png) | ![](samples/1/clu1-sample2.png) | ![](samples/1/clu1-sample3.png) | ![](samples/1/clu1-sample4.png) | 1girl, looking_at_viewer, playboy_bunny, solo, cleavage, detached_collar, pink_leotard, rabbit_tail, white_background, wrist_cuffs, simple_background, strapless_leotard, white_pantyhose, open_mouth, smile, bare_shoulders, blush, fake_tail, pink_bowtie, pink_eyes, red_leotard | | 2 | 6 | ![](samples/2/clu2-sample0.png) | ![](samples/2/clu2-sample1.png) | ![](samples/2/clu2-sample2.png) | ![](samples/2/clu2-sample3.png) | ![](samples/2/clu2-sample4.png) | hairclip, smile, streaked_hair, cleavage, facial_mark, long_sleeves, looking_at_viewer, open_jacket, pink_hair, side_ponytail, blush, crop_top, midriff, open_mouth, pink_gloves, shirt, spiked_collar, tongue_out, virtual_youtuber, white_hair, 1girl, 2girls, ahoge, black_collar, hair_between_eyes, navel, shorts, solo, twintails | ### Table Version | # | Samples | Img-1 | Img-2 | Img-3 | Img-4 | Img-5 | 1girl | looking_at_viewer | solo | open_jacket | pink_jacket | pleated_skirt | smile | midriff | cleavage | crop_top | long_sleeves | choker | bare_shoulders | blush | holding_phone | off_shoulder | open_mouth | smartphone | white_skirt | fishnet_pantyhose | mouth_mask | shirt | chain | simple_background | white_background | playboy_bunny | detached_collar | pink_leotard | rabbit_tail | wrist_cuffs | strapless_leotard | white_pantyhose | fake_tail | pink_bowtie | pink_eyes | red_leotard | hairclip | streaked_hair | facial_mark | pink_hair | side_ponytail | pink_gloves | spiked_collar | tongue_out | virtual_youtuber | white_hair | 2girls | ahoge | black_collar | hair_between_eyes | navel | shorts | twintails | |----:|----------:|:--------------------------------|:--------------------------------|:--------------------------------|:--------------------------------|:--------------------------------|:--------|:--------------------|:-------|:--------------|:--------------|:----------------|:--------|:----------|:-----------|:-----------|:---------------|:---------|:-----------------|:--------|:----------------|:---------------|:-------------|:-------------|:--------------|:--------------------|:-------------|:--------|:--------|:--------------------|:-------------------|:----------------|:------------------|:---------------|:--------------|:--------------|:--------------------|:------------------|:------------|:--------------|:------------|:--------------|:-----------|:----------------|:--------------|:------------|:----------------|:--------------|:----------------|:-------------|:-------------------|:-------------|:---------|:--------|:---------------|:--------------------|:--------|:---------|:------------| | 0 | 16 | ![](samples/0/clu0-sample0.png) | ![](samples/0/clu0-sample1.png) | ![](samples/0/clu0-sample2.png) | ![](samples/0/clu0-sample3.png) | ![](samples/0/clu0-sample4.png) | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 1 | 12 | ![](samples/1/clu1-sample0.png) | ![](samples/1/clu1-sample1.png) | ![](samples/1/clu1-sample2.png) | ![](samples/1/clu1-sample3.png) | ![](samples/1/clu1-sample4.png) | X | X | X | | | | X | | X | | | | X | X | | | X | | | | | | | X | X | X | X | X | X | X | X | X | X | X | X | X | | | | | | | | | | | | | | | | | | | 2 | 6 | ![](samples/2/clu2-sample0.png) | ![](samples/2/clu2-sample1.png) | ![](samples/2/clu2-sample2.png) | ![](samples/2/clu2-sample3.png) | ![](samples/2/clu2-sample4.png) | X | X | X | X | | | X | X | X | X | X | | | X | | | X | | | | | X | | | | | | | | | | | | | | | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X |
提供机构:
CyberHarem
原始信息汇总

数据集概述

数据集名称: viper/バイパー/毒蛇/바이퍼 (Nikke: Goddess of Victory)

数据集内容: 包含335张图像及其标签。

核心标签: long_hair, breasts, bangs, large_breasts, red_eyes, horns, brown_hair, hair_ornament, animal_ears, rabbit_ears, fake_animal_ears

数据来源: 图像从多个网站爬取,如danbooru, pixiv, zerochan等,由DeepGHS Team提供技术支持。

数据集包列表

名称 图像数量 大小 类型 描述
raw 335 611.82 MiB Waifuc-Raw 包含元信息的原始数据,最小边对齐至1400像素。
800 335 295.32 MiB IMG+TXT 短边不超过800像素的数据集。
stage3-p480-800 843 646.47 MiB IMG+TXT 三阶段裁剪数据集,区域不小于480x480像素。
1200 335 517.23 MiB IMG+TXT 短边不超过1200像素的数据集。
stage3-p480-1200 843 1010.80 MiB IMG+TXT 三阶段裁剪数据集,区域不小于480x480像素。

数据集加载

提供原始数据集(包括标记的图像)供waifuc加载。加载代码示例:

python import os import zipfile

from huggingface_hub import hf_hub_download from waifuc.source import LocalSource

下载原始档案文件

zip_file = hf_hub_download( repo_id=CyberHarem/viper_nikke, repo_type=dataset, filename=dataset-raw.zip, )

提取文件至目录

dataset_dir = dataset_dir os.makedirs(dataset_dir, exist_ok=True) with zipfile.ZipFile(zip_file, r) as zf: zf.extractall(dataset_dir)

使用waifuc加载数据集

source = LocalSource(dataset_dir) for item in source: print(item.image, item.meta[filename], item.meta[tags])

标签聚类结果

# 样本数 标签
0 16 1girl, looking_at_viewer, solo, open_jacket, pink_jacket, pleated_skirt, smile, ...
1 12 1girl, looking_at_viewer, playboy_bunny, solo, cleavage, detached_collar, pink_leotard, ...
2 6 hairclip, smile, streaked_hair, cleavage, facial_mark, long_sleeves, looking_at_viewer, ...
搜集汇总
数据集介绍
main_image_url
构建方式
在数字艺术与动漫角色研究领域,高质量图像数据集的构建对于风格分析与生成模型训练至关重要。本数据集聚焦于游戏《Nikke: Goddess of Victory》中的角色“Viper”,通过自动化爬虫系统从Danbooru、Pixiv、Zerochan等多个知名艺术社区采集原始图像。采集过程中,系统对图像进行了预处理,确保较长边对齐至1400像素以维持视觉一致性,并剔除了角色的核心标签,以提供更为纯净的数据基础。最终整合了335张图像及其对应标签,形成了结构化的原始数据包。
特点
该数据集在动漫角色图像收集中展现出鲜明的专项性,专注于单一角色的多维度视觉呈现。其核心特征在于提供了多种预处理版本,包括按短边限制尺寸的800像素与1200像素版本,以及经过三阶段裁剪、确保区域不小于480x480像素的增强版本,共计843张图像,适应不同分辨率需求下的模型训练。数据集还附有详细的标签聚类分析,通过可视化样本与标签共现表格,揭示了角色在不同服饰与场景下的语义组合模式,为风格解耦与条件生成研究提供了结构化参考。
使用方法
针对文本到图像生成任务,研究者可通过下载提供的ZIP压缩包直接获取图像与文本标签对,用于模型微调或评估。对于进阶应用,数据集支持利用Waifuc工具加载原始数据包,该工具能够解析图像元信息与标签,便于进行数据流式处理与扩展分析。用户只需通过Hugging Face Hub下载原始归档文件,解压后即可通过LocalSource接口迭代访问每张图像的像素数据、文件名及标签列表,实现与现有机器学习流程的无缝集成。
背景与挑战
背景概述
在数字艺术与生成式人工智能蓬勃发展的背景下,专注于特定角色的图像数据集成为训练精细化文本到图像模型的关键资源。CyberHarem/viper_nikke数据集应运而生,由DeepGHS团队构建并于近期发布,专注于手机游戏《Nikke: 胜利女神》中的角色“Viper”。该数据集汇集了335张从Danbooru、Pixiv等主流艺术社区爬取的图像,并附有经过修剪的详细标签。其核心研究问题在于为角色一致性图像生成提供高质量、高标注精度的训练数据,旨在推动动漫风格角色生成技术在细节还原与风格保真度方面的进步,对相关领域的研究与应用具有重要支撑作用。
当前挑战
该数据集致力于解决动漫风格角色图像生成中角色特征一致性与细节还原的挑战,其核心在于如何从多样化的社区来源中,精准地提取并标注同一角色的多姿态、多服饰变体,以克服生成模型常见的特征混淆与细节丢失问题。在构建过程中,挑战主要源于数据源的异构性,包括图像质量、分辨率、标签体系的差异,以及自动化爬取与清洗过程中对核心特征标签(如‘长头发’、‘兔耳’)进行有效识别与统一所面临的复杂性。此外,确保数据在符合伦理与版权规范的前提下进行收集与处理,亦是构建此类数据集不可忽视的挑战。
常用场景
经典使用场景
在动漫风格图像生成领域,该数据集聚焦于特定角色Viper的视觉呈现,为文本到图像生成模型提供了高质量的标注训练素材。其经典使用场景在于支持生成对抗网络或扩散模型学习角色特征与文本标签之间的映射关系,通过精细的服饰、姿态和场景标签,模型能够生成高度一致且多样化的角色图像,满足动漫艺术创作中对角色一致性的严格要求。
衍生相关工作
围绕该数据集衍生的经典工作主要集中在动漫风格生成模型的优化与扩展上。例如,基于其标签体系的研究改进了条件生成模型对复杂服饰与配件的渲染能力;亦有工作利用其聚类结果探索角色姿态与服装的组合生成。这些研究不仅提升了生成图像的细节真实度,还推动了标签驱动生成技术在二次元创作工具中的集成与普及。
数据集最近研究
最新研究方向
在动漫风格图像生成领域,针对特定角色的高质量数据集正成为研究热点。CyberHarem/viper_nikke数据集聚焦于游戏《Nikke:胜利女神》中的Viper角色,其精细标注的335张图像为角色一致性生成提供了宝贵资源。当前研究前沿集中于利用此类数据集探索少样本学习与风格迁移技术,旨在实现跨姿态与服饰的角色特征稳定保持。随着生成式人工智能在创意产业的深入应用,该类数据集通过结构化标签聚类,为可控图像合成算法的优化提供了关键训练基准,推动了个性化数字内容创作的技术革新。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作