five

HumanBeauty

收藏
arXiv2025-03-31 更新2025-04-02 收录
下载链接:
https://humanaesexpert.github.io/HumanAesExpert/
下载链接
链接失效反馈
官方服务:
资源简介:
HumanBeauty数据集是首个专门为人类图像美学评估任务构建的大规模数据集,由清华大学和快手科技共同开发。该数据集包含108,586张高质量的人类图像,分为HumanBeauty-58k和HumanBeauty-50k两个部分。HumanBeauty-58k从公开的美学评估数据集中筛选并统一了评分标准,而HumanBeauty-50k则通过严格的采集和标注流程,基于12维美学标准进行了细致的标注。数据集旨在为人类图像美学评估提供全面和细粒度的数据支持,推动相关领域的研究与应用。

The HumanBeauty Dataset is the first large-scale dataset specifically constructed for the task of human image aesthetic assessment, jointly developed by Tsinghua University and Kuaishou Technology. This dataset contains 108,586 high-quality human images, which are divided into two subsets: HumanBeauty-58k and HumanBeauty-50k. HumanBeauty-58k screens and unifies the scoring criteria from publicly available aesthetic assessment datasets, while HumanBeauty-50k undergoes strict collection and annotation procedures with detailed annotations based on a 12-dimensional aesthetic standard. The dataset aims to provide comprehensive and fine-grained data support for human image aesthetic assessment, and promote research and applications in related fields.
提供机构:
清华大学, 快手科技
创建时间:
2025-03-31
搜集汇总
数据集介绍
main_image_url
构建方式
HumanBeauty数据集的构建采用了多阶段严谨的流程,融合了公开数据筛选与专业人工标注。研究团队首先从6个开源数据集中通过人脸检测算法筛选出58,564张人像,并采用Min-Max归一化统一评分尺度。针对现有数据在图像覆盖度和标注维度上的不足,团队联合368名经专业培训的志愿者,基于创新的12维美学标准(涵盖面部亮度、身体形态、环境等要素),对50,022张网络采集图像进行多轮次人工标注,每张图像由至少9名评分者完成12个维度的独立评估,最终通过均值计算获得各维度MOS分数。
使用方法
数据集设计支持多模态模型的端到端训练与评估。对于整体美学评估任务,研究者可将图像与标准化提问模板(如“请评价此人像美学质量”)组合为QA对,通过LM头将连续分数映射为五级文本标签(差/一般/良/优/卓越)。针对细粒度分析,12维评分可转化为条件式问答对(如“从12个维度评估人像美学”),配合专用专家头进行层次化预测。实验表明,采用三头协同架构(LM头、回归头和专家头)结合元投票器的方案,能有效平衡文本理解与连续评分能力,在PLCC(0.863)和细粒度MAE(0.241-0.284)等指标上达到最优。
背景与挑战
背景概述
HumanBeauty数据集由清华大学与快手科技联合团队于2025年创建,是首个专注于人类图像美学评估(HIAA)的大规模标注数据集。该数据集包含10.8万张高质量人类图像,其中5万张通过严格的12维美学标准进行人工标注,其余5.8万张从公开数据集中筛选并统一标注。其创新性体现在建立了涵盖面部特征、体型、环境等12个美学维度的评估体系,突破了传统图像美学评估(IAA)在人类中心图像领域的局限性。该数据集为社交媒体内容优化、生成式AI工作流等应用场景提供了量化评估基准,推动了多模态基础模型在专业美学认知方向的发展。
当前挑战
HumanBeauty数据集面临的核心挑战包含两方面:在领域问题层面,需解决人类图像美学评估中主观性强、维度耦合的难题,传统IAA方法在面部特征与体型等细粒度维度关联性建模上表现欠佳;在构建过程中,数据采集需平衡面部与全身图像的覆盖度,避免现有数据集常见的头部区域偏置问题,同时通过迭代训练-测试协议确保368名标注者对12维标准的一致性。此外,从6个异构公开数据集提取人类图像时,需处理不同评分量纲的归一化问题,并克服原始数据中细粒度标注缺失的缺陷。
常用场景
经典使用场景
HumanBeauty数据集在人类图像美学评估(HIAA)领域具有广泛的应用价值。该数据集通过提供108K高质量人类图像及其多维度美学标注,为研究人员提供了丰富的实验材料。在经典使用场景中,HumanBeauty常用于训练和评估视觉语言模型(VLM)在美学评分任务中的表现。例如,研究者可以利用该数据集开发能够自动评估人类图像美学质量的算法,这些算法能够从面部亮度、轮廓清晰度、服装搭配等多个维度进行综合评分。
解决学术问题
HumanBeauty数据集有效解决了人类图像美学评估领域长期存在的数据匮乏问题。传统的美学评估研究多集中于通用图像,缺乏针对人类图像的专门数据集。该数据集不仅提供了大量标注数据,还创新性地提出了12维美学评估标准,涵盖了面部特征、身体形态、环境等多个关键维度。这一标准为后续研究提供了统一的美学评估框架,使得主观的美学感受能够转化为可量化的计算指标,显著推动了HIAA领域的发展。
实际应用
在实际应用方面,HumanBeauty数据集在社交媒体内容推荐、AI生成图像优化等领域展现出重要价值。例如,社交媒体平台可以利用基于该数据集训练的模型,自动筛选和推荐美学质量较高的用户上传图片,从而提升平台内容质量。此外,在AI生成人类图像的工作流中,该数据集可以作为质量评估的标准,帮助优化生成模型输出结果。这些应用不仅提高了自动化系统的效率,也为用户提供了更优质的美学体验。
数据集最近研究
最新研究方向
HumanBeauty数据集作为首个专注于人类图像美学评估(HIAA)的大规模数据集,近年来在计算机视觉与多媒体领域引发了广泛关注。其创新的12维度美学标注体系(涵盖面部亮度、身体轮廓等细粒度特征)为多模态基础模型研究提供了全新范式。当前前沿研究集中在三个方向:一是基于视觉语言模型(VLM)的多头协同架构设计,如论文提出的Expert Head与MetaVoter机制,通过融合回归预测与文本理解能力实现美学维度解耦;二是跨领域迁移学习,利用该数据集增强生成式AI在虚拟试衣、数字人创建等场景的审美对齐能力;三是社会计算应用,通过量化分析社交媒体图像美学特征优化内容推荐系统。2024年Qwen2VL、Llama3等大模型的对比实验表明,该数据集推动了HIAA任务指标(PLCC/SRCC)平均提升127%和78%,成为连接主观审美与客观计算的重要基准。
相关研究论文
  • 1
    HumanAesExpert: Advancing a Multi-Modality Foundation Model for Human Image Aesthetic Assessment清华大学, 快手科技 · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作