CyberHarem/charles_ausburne_azurlane
收藏Hugging Face2024-01-14 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CyberHarem/charles_ausburne_azurlane
下载链接
链接失效反馈官方服务:
资源简介:
---
license: mit
task_categories:
- text-to-image
tags:
- art
- not-for-all-audiences
size_categories:
- n<1K
---
# Dataset of charles_ausburne/チャールズ・オースバーン/查尔斯·奥斯本 (Azur Lane)
This is the dataset of charles_ausburne/チャールズ・オースバーン/查尔斯·奥斯本 (Azur Lane), containing 14 images and their tags.
The core tags of this character are `blonde_hair, long_hair, hat, purple_eyes, hair_ornament, hairclip, beret, white_headwear, v-shaped_eyebrows, very_long_hair`, which are pruned in this dataset.
Images are crawled from many sites (e.g. danbooru, pixiv, zerochan ...), the auto-crawling system is powered by [DeepGHS Team](https://github.com/deepghs)([huggingface organization](https://huggingface.co/deepghs)).
## List of Packages
| Name | Images | Size | Download | Type | Description |
|:-----------------|---------:|:----------|:---------------------------------------------------------------------------------------------------------------------------|:-----------|:---------------------------------------------------------------------|
| raw | 14 | 8.66 MiB | [Download](https://huggingface.co/datasets/CyberHarem/charles_ausburne_azurlane/resolve/main/dataset-raw.zip) | Waifuc-Raw | Raw data with meta information (min edge aligned to 1400 if larger). |
| 800 | 14 | 6.87 MiB | [Download](https://huggingface.co/datasets/CyberHarem/charles_ausburne_azurlane/resolve/main/dataset-800.zip) | IMG+TXT | dataset with the shorter side not exceeding 800 pixels. |
| stage3-p480-800 | 25 | 12.15 MiB | [Download](https://huggingface.co/datasets/CyberHarem/charles_ausburne_azurlane/resolve/main/dataset-stage3-p480-800.zip) | IMG+TXT | 3-stage cropped dataset with the area not less than 480x480 pixels. |
| 1200 | 14 | 8.39 MiB | [Download](https://huggingface.co/datasets/CyberHarem/charles_ausburne_azurlane/resolve/main/dataset-1200.zip) | IMG+TXT | dataset with the shorter side not exceeding 1200 pixels. |
| stage3-p480-1200 | 25 | 13.78 MiB | [Download](https://huggingface.co/datasets/CyberHarem/charles_ausburne_azurlane/resolve/main/dataset-stage3-p480-1200.zip) | IMG+TXT | 3-stage cropped dataset with the area not less than 480x480 pixels. |
### Load Raw Dataset with Waifuc
We provide raw dataset (including tagged images) for [waifuc](https://deepghs.github.io/waifuc/main/tutorials/installation/index.html) loading. If you need this, just run the following code
```python
import os
import zipfile
from huggingface_hub import hf_hub_download
from waifuc.source import LocalSource
# download raw archive file
zip_file = hf_hub_download(
repo_id='CyberHarem/charles_ausburne_azurlane',
repo_type='dataset',
filename='dataset-raw.zip',
)
# extract files to your directory
dataset_dir = 'dataset_dir'
os.makedirs(dataset_dir, exist_ok=True)
with zipfile.ZipFile(zip_file, 'r') as zf:
zf.extractall(dataset_dir)
# load the dataset with waifuc
source = LocalSource(dataset_dir)
for item in source:
print(item.image, item.meta['filename'], item.meta['tags'])
```
## List of Clusters
List of tag clustering result, maybe some outfits can be mined here.
### Raw Text Version
| # | Samples | Img-1 | Img-2 | Img-3 | Img-4 | Img-5 | Tags |
|----:|----------:|:--------------------------------|:--------------------------------|:--------------------------------|:--------------------------------|:--------------------------------|:--------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 0 | 14 |  |  |  |  |  | 1girl, sailor_collar, solo, looking_at_viewer, smile, white_gloves, dress, open_mouth, blush, bangs_pinned_back, bloomers, sleeveless, yellow_neckerchief, feathers |
### Table Version
| # | Samples | Img-1 | Img-2 | Img-3 | Img-4 | Img-5 | 1girl | sailor_collar | solo | looking_at_viewer | smile | white_gloves | dress | open_mouth | blush | bangs_pinned_back | bloomers | sleeveless | yellow_neckerchief | feathers |
|----:|----------:|:--------------------------------|:--------------------------------|:--------------------------------|:--------------------------------|:--------------------------------|:--------|:----------------|:-------|:--------------------|:--------|:---------------|:--------|:-------------|:--------|:--------------------|:-----------|:-------------|:---------------------|:-----------|
| 0 | 14 |  |  |  |  |  | X | X | X | X | X | X | X | X | X | X | X | X | X | X |
license: MIT许可证
task_categories:
- 文本到图像(text-to-image)
tags:
- 艺术(art)
- 非全年龄段适配(not-for-all-audiences)
size_categories:
- 样本量小于1000(n<1K)
# 碧蓝航线(Azur Lane)角色查尔斯·奥斯本(charles_ausburne/チャールズ・オースバーン/查尔斯·奥斯本)数据集
本数据集收录了碧蓝航线角色查尔斯·奥斯本的14张图像及其配套标注标签。
该角色的核心标注标签包括`金发(blonde_hair)、长发(long_hair)、帽子(hat)、紫色眼眸(purple_eyes)、发饰(hair_ornament)、发夹(hairclip)、贝雷帽(beret)、白色头饰(white_headwear)、V形眉(v-shaped_eyebrows)、超长长发(very_long_hair)`,本数据集已在制作过程中对上述核心标签进行了修剪处理。
图像采集自多个平台(如danbooru、pixiv、zerochan等),自动爬取系统由DeepGHS团队(DeepGHS Team)开发,其Hugging Face组织主页为[https://huggingface.co/deepghs](https://huggingface.co/deepghs)。
## 数据包列表
| 数据包名称 | 图像数量 | 大小 | 下载链接 | 类型 | 描述 |
|:-----------------|---------:|:----------|:---------------------------------------------------------------------------------------------------------------------------|:-----------|:---------------------------------------------------------------------|
| 原始数据包(raw) | 14 | 8.66 MiB | [下载](https://huggingface.co/datasets/CyberHarem/charles_ausburne_azurlane/resolve/main/dataset-raw.zip) | Waifuc-Raw | 包含元数据的原始图像数据(若图像短边大于1400像素,则将其对齐至1400像素)。 |
| 800分辨率版本(800) | 14 | 6.87 MiB | [下载](https://huggingface.co/datasets/CyberHarem/charles_ausburne_azurlane/resolve/main/dataset-800.zip) | IMG+TXT | 短边尺寸不超过800像素的数据集。 |
| 三阶段裁剪800分辨率版本(stage3-p480-800) | 25 | 12.15 MiB | [下载](https://huggingface.co/datasets/CyberHarem/charles_ausburne_azurlane/resolve/main/dataset-stage3-p480-800.zip) | IMG+TXT | 经过三阶段裁剪的数据集,裁剪区域尺寸不小于480×480像素。 |
| 1200分辨率版本(1200) | 14 | 8.39 MiB | [下载](https://huggingface.co/datasets/CyberHarem/charles_ausburne_azurlane/resolve/main/dataset-1200.zip) | IMG+TXT | 短边尺寸不超过1200像素的数据集。 |
| 三阶段裁剪1200分辨率版本(stage3-p480-1200) | 25 | 13.78 MiB | [下载](https://huggingface.co/datasets/CyberHarem/charles_ausburne_azurlane/resolve/main/dataset-stage3-p480-1200.zip) | IMG+TXT | 经过三阶段裁剪的数据集,裁剪区域尺寸不小于480×480像素。 |
### 使用Waifuc加载原始数据集
我们提供了支持Waifuc加载的原始数据集(包含带标注的图像)。如需使用,请运行以下代码:
python
import os
import zipfile
from huggingface_hub import hf_hub_download
from waifuc.source import LocalSource
# 下载原始压缩包文件
zip_file = hf_hub_download(
repo_id='CyberHarem/charles_ausburne_azurlane',
repo_type='dataset',
filename='dataset-raw.zip',
)
# 将文件解压至指定目录
dataset_dir = 'dataset_dir'
os.makedirs(dataset_dir, exist_ok=True)
with zipfile.ZipFile(zip_file, 'r') as zf:
zf.extractall(dataset_dir)
# 使用Waifuc加载数据集
source = LocalSource(dataset_dir)
for item in source:
print(item.image, item.meta['filename'], item.meta['tags'])
## 聚类结果列表
本部分为标签聚类结果,可从中挖掘角色的不同穿搭风格。
### 原始文本版本
| 聚类编号 | 样本量 | 示例图1 | 示例图2 | 示例图3 | 示例图4 | 示例图5 | 标签列表 |
|----:|----------:|:--------------------------------|:--------------------------------|:--------------------------------|:--------------------------------|:--------------------------------|:--------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 0 | 14 |  |  |  |  |  | 单人少女(1girl)、水手领(sailor_collar)、单独出镜(solo)、注视镜头(looking_at_viewer)、微笑(smile)、白色手套(white_gloves)、连衣裙(dress)、张口(open_mouth)、脸红(blush)、固定后梳刘海(bangs_pinned_back)、灯笼裤(bloomers)、无袖(sleeveless)、黄色领巾(yellow_neckerchief)、羽毛装饰(feathers) |
### 表格版本
| 聚类编号 | 样本量 | 示例图1 | 示例图2 | 示例图3 | 示例图4 | 示例图5 | 1girl | sailor_collar | solo | looking_at_viewer | smile | white_gloves | dress | open_mouth | blush | bangs_pinned_back | bloomers | sleeveless | yellow_neckerchief | feathers |
|----:|---------:|:--------------------------------|:--------------------------------|:--------------------------------|:--------------------------------|:--------------------------------|:--------|:----------------|:-------|:--------------------|:--------|:---------------|:--------|:-------------|:--------|:--------------------|:-----------|:-------------|:---------------------|:-----------|
| 0 | 14 |  |  |  |  |  | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
提供机构:
CyberHarem
原始信息汇总
数据集概述
数据集名称
- 名称: charles_ausburne/チャールズ・オースバーン/查尔斯·奥斯本 (Azur Lane)
数据集内容
- 描述: 包含14张图像及其标签。
- 核心标签: blonde_hair, long_hair, hat, purple_eyes, hair_ornament, hairclip, beret, white_headwear, v-shaped_eyebrows, very_long_hair
数据集大小与格式
- 总图像数: 14
- 数据包列表:
- 名称: raw
- 图像数: 14
- 大小: 8.66 MiB
- 格式: Waifuc-Raw
- 描述: 原始数据,包含元信息(最小边对齐至1400像素,如果更大)。
- 名称: 800
- 图像数: 14
- 大小: 6.87 MiB
- 格式: IMG+TXT
- 描述: 短边不超过800像素的图像集。
- 名称: stage3-p480-800
- 图像数: 25
- 大小: 12.15 MiB
- 格式: IMG+TXT
- 描述: 三阶段裁剪,区域不小于480x480像素的图像集。
- 名称: 1200
- 图像数: 14
- 大小: 8.39 MiB
- 格式: IMG+TXT
- 描述: 短边不超过1200像素的图像集。
- 名称: stage3-p480-1200
- 图像数: 25
- 大小: 13.78 MiB
- 格式: IMG+TXT
- 描述: 三阶段裁剪,区域不小于480x480像素的图像集。
- 名称: raw
数据集使用
- 加载方式: 支持通过waifuc加载原始数据集。
数据集标签集群
- 集群列表:
- 样本数: 14
- 标签: 1girl, sailor_collar, solo, looking_at_viewer, smile, white_gloves, dress, open_mouth, blush, bangs_pinned_back, bloomers, sleeveless, yellow_neckerchief, feathers
数据集许可
- 许可: MIT
搜集汇总
数据集介绍

构建方式
在动漫角色图像数据集的构建领域,本数据集聚焦于《碧蓝航线》中的角色查尔斯·奥斯本。其构建过程依托自动化爬虫系统,从Danbooru、Pixiv、Zerochan等多个知名艺术社区系统性地采集原始图像。采集后的数据经过预处理,包括对图像尺寸的标准化调整,例如将较长边对齐至1400像素,并应用了核心标签修剪技术,以精炼角色特征描述,确保数据质量与一致性。
使用方法
针对文本到图像生成等任务,用户可直接下载提供的ZIP压缩包获取图像与标签文本对。对于进阶应用,数据集支持通过Waifuc工具加载原始数据,该工具能解析包含元信息的文件结构,便于编程访问图像及其关联标签。研究人员可根据需求选择不同预处理版本,以适配模型训练或视觉分析中对图像尺寸与质量的特定要求,实现高效的数据流水线集成。
背景与挑战
背景概述
在数字艺术与生成式人工智能蓬勃发展的时代,针对特定风格或角色的高质量图像数据需求日益增长。CyberHarem/charles_ausburne_azurlane数据集应运而生,由DeepGHS团队构建,专注于收录手机游戏《碧蓝航线》中角色查尔斯·奥斯本的图像及其标注。该数据集旨在为文本到图像生成模型提供精细化的训练素材,通过自动化爬虫系统从Danbooru、Pixiv等主流艺术社区采集图像,并辅以精心修剪的核心特征标签,如金发、长髮、贝雷帽等,以支持角色一致性生成的研究与应用。
当前挑战
该数据集致力于解决动漫风格角色图像生成的领域挑战,即如何基于文本描述精确合成具有特定视觉特征与一致性的角色形象。在构建过程中,面临多重挑战:其一,数据采集需平衡来源的多样性与版权合规性;其二,图像标注的准确性与完整性依赖于自动化系统的语义理解能力,如何有效识别并修剪核心特征标签是一大难点;其三,数据规模相对有限,可能影响模型训练的泛化性能;其四,多尺寸与裁剪版本的生成需保持图像质量与标注的对应关系,对预处理流程提出了技术要求。
常用场景
经典使用场景
在动漫风格图像生成领域,该数据集作为特定角色查尔斯·奥斯本的视觉资料库,为文本到图像生成模型提供了精准的训练样本。其核心价值在于通过精心标注的标签,如金发、长髮、紫色眼睛等特征,使模型能够学习并捕捉该角色的标志性外观与艺术风格,从而在生成任务中实现高保真度的角色还原。
解决学术问题
该数据集针对动漫角色生成中细节一致性与风格保真度的学术挑战,提供了解决方案。通过提供高质量、标签化的图像集合,它助力研究者探索细粒度属性控制、跨域风格迁移以及小样本学习等问题,推动了生成模型在特定角色建模上的精度提升,为动漫艺术与计算机视觉的交叉研究奠定了数据基础。
实际应用
在实际应用中,该数据集可直接服务于动漫内容创作、游戏角色设计以及个性化数字艺术生成。创作者与开发者能够利用其训练定制化模型,快速生成符合角色设定的插画或素材,显著提升内容生产效率,并为二次元文化衍生品的自动化创作提供了可靠的技术支持。
数据集最近研究
最新研究方向
在动漫风格图像生成领域,针对特定角色的精细化数据集正成为研究热点。以《碧蓝航线》角色查尔斯·奥斯本为例,此类小规模、高标注质量的数据集推动了生成式模型在细节控制与风格一致性方面的探索。前沿研究聚焦于利用此类数据提升模型对角色特征(如金发、紫色瞳孔、贝雷帽等)的精确复现能力,并结合标签聚类技术优化图像语义理解。相关进展不仅促进了二次元内容创作的自动化,也为跨模态生成任务提供了高质量的基准数据,对娱乐产业与计算机视觉交叉领域具有显著影响。
以上内容由遇见数据集搜集并总结生成



