ShinkaiGAN_Dataset

Hugging Face2024-11-07 更新2024-12-12 收录

下载链接：

https://huggingface.co/datasets/DN-Erazora/ShinkaiGAN_Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含三个主要部分：Real、Anime和Shinkai。每个部分在训练、验证和测试集中的图像数量分别为24,000、5,000和1,000。Real部分使用LHQ1024图像，Anime部分通过Stable Diffusion生成，Shinkai部分从Makoto Shinkai的动画电影中提取。每张图像的分辨率为1024x1024，标签0表示生成的动漫图像，标签1表示真实图像，标签2表示Makoto Shinkai的电影图像。

This dataset comprises three primary subsets: Real, Anime, and Shinkai. The number of images in the training, validation, and test splits for each subset is 24,000, 5,000, and 1,000 respectively. The Real subset utilizes LHQ1024 images, the Anime subset is generated via Stable Diffusion, and the Shinkai subset is extracted from Makoto Shinkai's animated films. Each image has a resolution of 1024×1024. The labels are defined as follows: label 0 represents generated anime images, label 1 represents real images, and label 2 represents images from Makoto Shinkai's films.

创建时间：

2024-10-29

原始信息汇总

ShinkaiGAN 数据集概述

数据集信息

特征

image: 图像数据，数据类型为 image
label: 标签，数据类型为 int64
filename: 文件名，数据类型为 string

数据分割

train: 训练集，包含 72000 个样本，大小为 99150189464.0 字节
validation: 验证集，包含 15000 个样本，大小为 20674090404.0 字节
test: 测试集，包含 3000 个样本，大小为 3997875105.0 字节

数据集大小

下载大小: 83930325553 字节
数据集总大小: 123822154973.0 字节

数据集结构

文件结构

├── train/ │ ├── real/ │ ├── anime/ │ └── shinkai/ ├── val/ │ ├── real/ │ ├── anime/ │ └── shinkai/ └── test/ ├── real/ ├── anime/ └── shinkai/

数据访问

split: train, test, validation
image index: 从样本数量中选择任意整数
features: label, filename, image

标签说明

label 0: 生成的动漫图像
label 1: 真实图像
label 2: 新海诚电影图像

示例

dataset["train"][0]["image"]

数据集概览

配对数据集

Real: 真实图像
Anime: 生成的动漫图像

非配对数据集

Shinkai: 新海诚电影图像

图像数量

Train: 24,000 张图像 x 3 = 72000 张图像
Validation: 5,000 张图像 x 3 = 15000 张图像
Test: 1,000 张图像 x 3 = 3000 张图像

图像组成

Real

来源: LHQ1024

Anime

生成方式: 使用 Stable Diffusion 从真实数据集生成
- Prompt: "anime artwork anime style, landscape. anime style, key visual, vibrant, studio anime, highly detailed, in makoto shinkai style"
- Negative Prompt: "photo, deformed, black and white, realism, disfigured, low contrast, cityscape, people, meteor, sunset."
- 参数:
  - num_steps = 10
  - guidance_scale = 0.2
  - controlnet_conditioning_scale = 0.9
  - seed = random.randint(0000000000, 9999999999)

Shinkai

来源: 新海诚电影，分辨率为 1080p，裁剪为 1080 x 1080
包含电影:
- Your Name (Kimi no nawa)
- Weathering with You (Tenki no Ko)
- Suzume
- Garden of Words
- 5 Centimeters per Second
- Children Who Chase Lost Voices

贡献者

Dwiyasa Nakula: Sepuluh Nopember Institute of Technology (Institut Technologi Sepuluh Nopember - ITS)
ShinkaiGAN Team: Sepuluh Nopember Institute of Technology (Institut Technologi Sepuluh Nopember - ITS)

搜集汇总

数据集介绍

构建方式

ShinkaiGAN_Dataset的构建过程体现了多源数据整合与生成技术的巧妙结合。数据集主要由三部分组成：真实图像、动漫图像以及新海诚风格的电影截图。真实图像来源于高质量的真实场景照片，动漫图像则通过Stable Diffusion模型生成，模型采用了特定的提示词和参数设置，以确保生成的图像符合新海诚风格。新海诚风格的电影截图则直接从其经典作品中裁剪而来，确保了图像的高质量和风格一致性。数据集的构建过程不仅注重数据的多样性，还通过严格的质量控制确保了数据的可用性。

使用方法

ShinkaiGAN_Dataset的使用方法简洁明了，用户可以通过指定数据集的分割类型（train、validation、test）和图像索引来访问特定图像。每个图像包含三个特征：标签、文件名和图像数据。标签用于区分图像类型（0表示生成动漫图像，1表示真实图像，2表示新海诚风格电影截图），文件名提供了图像的唯一标识，图像数据则以PIL格式存储，便于进一步处理和分析。用户可以通过简单的代码示例快速获取所需图像，如`dataset["train"][0]["image"]`，从而高效地利用数据集进行研究和开发。

背景与挑战

背景概述

ShinkaiGAN_Dataset是由印度尼西亚Sepuluh Nopember理工学院（ITS）的Dwiyasa Nakula及其团队于近年创建的一个图像数据集，专注于动漫风格图像生成与转换的研究。该数据集的核心研究问题在于如何通过生成对抗网络（GAN）技术，将真实场景图像转换为具有Makoto Shinkai风格的动漫图像。数据集包含真实图像、生成动漫图像以及直接从Makoto Shinkai电影中提取的图像，涵盖了《你的名字》、《天气之子》等多部经典作品。该数据集的发布为动漫风格生成领域提供了丰富的实验素材，推动了GAN技术在艺术创作中的应用。

当前挑战

ShinkaiGAN_Dataset在解决动漫风格生成问题时面临多重挑战。首先，生成动漫图像需要高度还原Makoto Shinkai独特的艺术风格，包括色彩、光影和构图等细节，这对模型的生成能力提出了极高要求。其次，数据集的构建过程中，如何从电影中提取高质量且具有代表性的图像片段，并确保其与生成图像的一致性，是一个复杂的技术难题。此外，数据集规模庞大，处理与存储高分辨率图像对计算资源的需求极高，进一步增加了构建与使用的难度。这些挑战不仅考验了研究团队的技术能力，也为后续研究提供了重要的改进方向。

常用场景

经典使用场景

ShinkaiGAN_Dataset在计算机视觉领域，尤其是图像生成与风格迁移研究中，展现了其独特的价值。该数据集通过提供真实图像、生成动漫图像以及新海诚风格的电影截图，为研究者提供了一个丰富的实验平台。经典的使用场景包括训练生成对抗网络（GANs）以实现从真实图像到动漫风格的转换，以及探索不同风格之间的迁移效果。

解决学术问题

ShinkaiGAN_Dataset解决了图像生成与风格迁移领域中的多个关键问题。首先，它通过提供高质量的真实图像与动漫图像对，为生成模型的训练提供了可靠的数据基础。其次，该数据集中的新海诚风格图像为研究特定艺术风格的迁移提供了独特的素材。这些问题的解决，推动了图像生成技术的进步，并为艺术创作与视觉特效提供了新的可能性。

实际应用

在实际应用中，ShinkaiGAN_Dataset被广泛用于动漫制作、游戏开发以及影视特效等领域。通过利用该数据集训练的模型，开发者能够快速生成具有特定艺术风格的图像，从而提升创作效率与视觉效果。此外，该数据集还为个性化图像生成与风格化滤镜的开发提供了技术支持，满足了用户对多样化视觉体验的需求。

数据集最近研究