MLP Faces Dataset

github2023-07-12 更新2024-05-31 收录

下载链接：

https://github.com/arfafax/MLP-Face-Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

一个包含从Derpibooru获取的约104k张经过裁剪的MLP角色面部图像的数据集。该数据集通过训练YOLOv3网络在约1500张面部图像上标注的特征创建而成。数据集不仅包含裁剪后的图像，还提供了包含检测到的面部边界框的CSV文件和一个用于根据这些CSV文件从Derpibooru下载并裁剪图像的脚本。

A dataset comprising approximately 104k cropped facial images of MLP characters sourced from Derpibooru. This dataset was created by training a YOLOv3 network on features annotated from around 1,500 facial images. In addition to the cropped images, the dataset includes a CSV file containing the detected facial bounding boxes and a script for downloading and cropping images from Derpibooru based on these CSV files.

创建时间：

2020-06-22

原始信息汇总

MLP Faces Dataset 概述

数据集描述

名称: MLP Faces Dataset
来源: 从 Derpibooru 获取的 SFW 裁剪 MLP 面部图像。
规模: 约 104,000 张裁剪的 MLP 面部图像。
创建方法: 通过训练 YOLOv3 网络于约 1500 张带有标注面部特征的图像创建。

数据内容

数据形式: 本仓库提供的是检测到的面部边界框的 CSV 文件，以及一个根据这些 CSV 文件从 Derpibooru 下载并裁剪图像的脚本。
面部尺寸: 提供了一个面部尺寸的直方图，展示了不同尺寸的分布情况。
角色分布: 提供了一个角色分布图，显示了不同角色的数量。

数据筛选标准

图像标签必须包含 safe 或 suggestive。
图像标签必须包含 anthro, pony, pegasus, unicorn, alicorn, earth pony 中的至少一个。
图像评分必须大于等于 25。
图像格式必须是 jpg, jpeg, png 之一。

数据处理

下载与裁剪: 使用提供的脚本下载原始图像并根据 CSV 文件裁剪。
图像分类: 根据图像尺寸，将裁剪后的图像分类至不同的目录：
- downscale: 尺寸大于 1024x1024 的图像。
- waifu2x: 尺寸在 512x512 至 1024x1024 之间的图像。
- waifu3x: 尺寸在 341x341 至 512x512 之间的图像。
- waifu4x: 尺寸小于 341x341 的图像。
图像处理: 使用 waifu2x-chainer 对图像进行放大处理，确保所有图像至少为 1024x1024 像素。
最终处理: 对图像进行降尺度处理至 1024x1024 像素，并预乘 alpha 通道以保持训练时的正确透明度。

数据用途

该数据集主要用于训练 StyleGAN2。

搜集汇总

数据集介绍

构建方式

MLP Faces数据集的构建过程基于Derpibooru平台上的图像资源，通过YOLOv3网络对约1500张标注了面部特征的图像进行训练，生成了约10.4万张裁剪后的面部图像。数据集的构建并未直接提供裁剪后的图像，而是通过CSV文件记录了检测到的面部边界框信息，并提供了脚本以从Derpibooru下载原始图像并根据CSV文件进行裁剪。图像筛选标准包括标签、评分和格式等多重条件，确保了数据的多样性和质量。

使用方法

使用MLP Faces数据集时，用户首先需要下载并安装aria2工具，随后通过提供的脚本从Derpibooru下载原始图像。下载完成后，运行`crop.py`脚本对图像进行裁剪，并根据图像尺寸将其分类存储。接着，用户需使用waifu2x-chainer工具对裁剪后的图像进行上采样处理，确保所有图像的分辨率达到1024x1024。最后，通过运行`downscale.py`和`premultiply_alpha.py`脚本，进一步调整图像尺寸并处理透明度通道，最终生成适合StyleGAN2模型训练的预处理图像。

背景与挑战

背景概述

MLP Faces Dataset是一个专注于《我的小马驹》（My Little Pony, MLP）角色面部图像的数据集，旨在为计算机视觉领域的研究提供高质量的图像资源。该数据集由Derpibooru平台上的图像构建而成，包含了约104,000张经过裁剪的MLP角色面部图像。数据集的构建基于YOLOv3网络，通过对约1500张标注了面部特征的图像进行训练，生成了面部检测的边界框信息。该数据集的核心研究问题在于如何通过自动化工具从大规模图像库中提取并处理特定角色的面部图像，以支持生成对抗网络（GAN）等深度学习模型的训练。MLP Faces Dataset的发布为图像生成、面部识别等领域的研究提供了重要的数据支持。

当前挑战

MLP Faces Dataset在构建和应用过程中面临多重挑战。首先，数据集的构建依赖于从Derpibooru平台筛选图像，这要求对图像标签进行复杂的过滤，以确保图像内容符合安全性和角色类型的要求。其次，由于图像的分辨率和尺寸差异较大，数据集需要通过多步处理（如裁剪、上采样和下采样）来统一图像尺寸，这增加了数据预处理的复杂性。此外，数据集的应用场景主要集中在生成对抗网络（如StyleGAN2）的训练中，这对图像质量和一致性提出了较高要求，尤其是在处理透明通道（alpha通道）时，需要额外的技术手段来确保图像的正确渲染。这些挑战不仅考验了数据集的构建技术，也对后续的研究应用提出了更高的标准。

常用场景

经典使用场景

MLP Faces Dataset 主要用于生成对抗网络（GAN）的训练，特别是StyleGAN2的模型训练。该数据集通过提供大量经过裁剪和标注的MLP（My Little Pony）面部图像，为研究人员提供了一个丰富的资源库，用于探索和优化图像生成技术。数据集中的图像经过预处理，包括裁剪、上采样和下采样，以确保图像质量的一致性，从而提升模型训练的效果。

解决学术问题

该数据集解决了图像生成领域中高质量训练数据稀缺的问题。通过提供大量经过精确标注的面部图像，研究人员可以更有效地训练GAN模型，生成逼真的图像。此外，数据集的预处理步骤（如上采样和下采样）也为研究图像分辨率对生成效果的影响提供了实验基础，推动了图像生成技术的进步。

实际应用

在实际应用中，MLP Faces Dataset 可用于开发基于GAN的图像生成工具，如虚拟角色生成器、动画制作辅助工具等。这些工具可以广泛应用于娱乐产业、游戏开发以及虚拟现实领域，帮助创作者快速生成高质量的虚拟角色图像，提升内容创作的效率和质量。

数据集最近研究