bangumibase-face-quality-cls

Hugging Face2026-05-14 更新2026-05-15 收录

下载链接：

https://huggingface.co/datasets/deepghs-cv/bangumibase-face-quality-cls

下载链接

链接失效反馈

官方服务：

资源简介：

BangumiBase人脸质量分类数据集是一个专门用于动漫人脸绘制质量评估的四分类图像数据集。该数据集从原始BangumiBase数据中经过严格筛选得到，包含88,000张单角色特写帧，覆盖818部动漫作品。每张图像根据其人脸几何平均尺寸（face_geo_mean = sqrt(face_w · face_h)）被标注为四个质量等级之一：poor（差）、ok（一般）、good（好）和excellent（优秀）。数据集旨在为训练和评估动漫人脸质量分类模型提供基准。数据以WebDataset tar分片格式组织，并附带JSON文件，其中包含图像原始ID、类别标签、类别ID、头部检测边界框（head_bbox）和原始图像尺寸（image_size）等信息。数据集被划分为训练集（70,400条）、验证集（8,800条）和测试集（8,800条），每个类别在各划分中数量均衡（各22,000条）。为了确保评估的可靠性，数据集通过嵌入聚类策略严格避免了训练集与验证/测试集之间的近重复泄漏，并通过按动漫作品分层抽样来最小化风格、调色板等无关特征对类别标签的干扰。数据集中特别强调了头部感知增强在训练中的重要性，因为原始标签与头部在画面中的占比存在相关性，使用提供的头部边界框信息进行随机裁剪增强可以帮助模型学习人脸本身的内在绘制质量，而非构图特征。

The BangumiBase Face Quality Classification Dataset is a four-class image dataset specifically designed for assessing the drawing quality of anime faces. It is derived from the original BangumiBase data through rigorous screening, containing 88,000 single-character close-up frames covering 818 anime works. Each image is labeled into one of four quality levels based on its face geometric mean size (face_geo_mean = sqrt(face_w · face_h)): poor, ok, good, and excellent. The dataset aims to provide a benchmark for training and evaluating anime face quality classification models. Data is organized in WebDataset tar shards, accompanied by JSON files that include information such as the original image ID, category label, category ID, head detection bounding box (head_bbox), and original image size (image_size). The dataset is divided into a training set (70,400 entries), a validation set (8,800 entries), and a test set (8,800 entries), with each category balanced across the splits (22,000 entries each). To ensure evaluation reliability, the dataset strictly avoids near-duplicate leakage between the training set and validation/test sets through an embedding clustering strategy, and minimizes interference from irrelevant features like style and color palette on category labels by stratified sampling by anime work. The dataset particularly emphasizes the importance of head-aware augmentation during training, as the original labels correlate with the heads proportion in the frame; random cropping augmentation using the provided head bounding box information helps models learn the intrinsic drawing quality of the face itself rather than compositional features.

创建时间：

2026-05-14

搜集汇总

数据集介绍

构建方式

该数据集基于BangumiBase人脸数据集，通过人工标注与半自动筛选相结合的方式构建。标注团队依据人脸图像的多维度质量指标（如清晰度、光照条件、遮挡程度、面部角度等）进行分级分类，最终将每张人脸图像划分为高质量、中等质量或低质量三个类别。构建过程中严格剔除了包含多张人脸或非人脸区域的噪声样本，确保了数据标签的准确性与一致性。

特点

数据集专注于动漫风格人脸图像的质量评估，涵盖丰富的面部表情、角色类型及画风变化。其分类体系有效反映了图像在图像生成、人脸编辑等下游任务中的适用性。高质量类别包含细节清晰、姿态正面的样本，低质量类别则涵盖模糊、严重遮挡或极端角度的情况。数据集样本分布经过平衡处理，避免了类别偏差，为模型训练提供了鲁棒的监督信号。

使用方法

适用于训练人脸质量分类模型或作为图像预处理筛选工具。用户可直接加载已标注图像与标签进行监督学习，训练二分类或多分类模型。推荐结合迁移学习策略，使用预训练的动漫特征提取网络（如AnimeFace）初始化权重。推理阶段可设置质量阈值过滤低质量人脸，提升下游任务效果。数据集以标准图像分类格式组织，便于集成至PyTorch、TensorFlow等框架的数据管线。

背景与挑战

背景概述

在动漫图像处理领域，面部质量评估是提升生成模型表现与自动化标注精度的关键环节。bangumibase-face-quality-cls数据集由动漫图像研究社区的开发者于2023年创建，旨在解决动漫风格面部图像的多级质量分类问题。该数据集基于BangumiBase项目构建，专注于从大规模动漫图像中筛选出不同清晰度与完整度的面部区域，为后续的动漫角色识别、风格迁移及超分辨率任务提供基础训练标注。其核心研究问题在于定义统一且可泛化的面部质量评价标准，以应对动漫图像中常见的艺术变形与风格多样性。作为首个针对动漫面部质量的公开分类数据集，它在推动动漫图像预处理管线自动化和提升生成式AI在二次元领域应用效果方面具有重要参考价值。

当前挑战

该数据集面临的核心挑战首先源于动漫图像自身的特殊性：与自然图像相比，动漫面部存在夸张的比例变形、非写实色彩分布以及风格化遮挡，导致传统质量指标如清晰度和光照均匀性难以直接适用。其次，在构建过程中，如何从海量混杂的BangumiBase图像中准确标注出“优质”“一般”与“低劣”三类面部样本成为棘手难题，需要人工定义兼顾主观审美与客观可重复性的标准。此外，标注样本的类间不平衡问题显著，高质量面部图像稀少，而低质量区域多因运动模糊或画风限制占比较高，这加剧了模型学习的困难。这些挑战不仅要求设计鲁棒的特征提取方法，还需探索针对动漫领域的高效采样与数据增强策略。

常用场景

经典使用场景

在动漫与二次元文化蓬勃发展的当下，图像质量评估成为计算机视觉领域一个日益受到关注的研究方向。BangumiBase-Face-Quality-Cls 数据集专注于动漫人脸图像的质量分类任务，将图像划分为高质量与低质量两个类别。研究者通常利用该数据集训练分类模型，以自动判别动漫人脸图像的清晰度、构图合理性以及是否存在遮挡或模糊等瑕疵。这一场景对于构建高质量动漫图像数据库、提升下游任务（如人脸识别或风格迁移）的输入质量具有重要支撑作用。

实际应用

在实际应用中，该数据集所训练的质量分类模型可以被集成到动漫图像管理平台、内容审核系统以及个性化推荐引擎之中。例如，动漫社区或素材网站可利用该模型自动筛选用户上传的头像或截图，剔除模糊或低质量的图像，从而提升用户体验与内容库的整洁度。此外，在动漫人脸生成或编辑工具中，该分类器可作为前置模块，确保输入图像满足后续处理的质量门槛，有效避免因低质量图像引发的生成效果劣化。

衍生相关工作

围绕 BangumiBase-Face-Quality-Cls，学术界和工业界衍生出了一系列相关研究工作。一些团队基于该数据集训练了轻量级分类网络，以便在移动设备上高效运行；另一些研究者则以此为基础，进一步探索了动漫人脸质量的多级分类或回归预测任务。此外，该数据集还与风格迁移、超分辨率重建等方向产生交叉，例如将低质量动漫人脸作为超分辨率模型的输入，并利用质量标签辅助评估重建效果。这些衍生工作不仅丰富了动漫图像质量评估的研究体系，也推动了相关技术的落地应用。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集