five

HumanBeauty|图像美学数据集|数据标注数据集

收藏
arXiv2025-03-31 更新2025-04-02 收录
图像美学
数据标注
下载链接:
https://humanaesexpert.github.io/HumanAesExpert/
下载链接
链接失效反馈
资源简介:
HumanBeauty数据集是首个专门为人类图像美学评估任务构建的大规模数据集,由清华大学和快手科技共同开发。该数据集包含108,586张高质量的人类图像,分为HumanBeauty-58k和HumanBeauty-50k两个部分。HumanBeauty-58k从公开的美学评估数据集中筛选并统一了评分标准,而HumanBeauty-50k则通过严格的采集和标注流程,基于12维美学标准进行了细致的标注。数据集旨在为人类图像美学评估提供全面和细粒度的数据支持,推动相关领域的研究与应用。
提供机构:
清华大学, 快手科技
创建时间:
2025-03-31
AI搜集汇总
数据集介绍
main_image_url
构建方式
HumanBeauty数据集的构建采用了多阶段严谨的流程,融合了公开数据筛选与专业人工标注。研究团队首先从6个开源数据集中通过人脸检测算法筛选出58,564张人像,并采用Min-Max归一化统一评分尺度。针对现有数据在图像覆盖度和标注维度上的不足,团队联合368名经专业培训的志愿者,基于创新的12维美学标准(涵盖面部亮度、身体形态、环境等要素),对50,022张网络采集图像进行多轮次人工标注,每张图像由至少9名评分者完成12个维度的独立评估,最终通过均值计算获得各维度MOS分数。
使用方法
数据集设计支持多模态模型的端到端训练与评估。对于整体美学评估任务,研究者可将图像与标准化提问模板(如“请评价此人像美学质量”)组合为QA对,通过LM头将连续分数映射为五级文本标签(差/一般/良/优/卓越)。针对细粒度分析,12维评分可转化为条件式问答对(如“从12个维度评估人像美学”),配合专用专家头进行层次化预测。实验表明,采用三头协同架构(LM头、回归头和专家头)结合元投票器的方案,能有效平衡文本理解与连续评分能力,在PLCC(0.863)和细粒度MAE(0.241-0.284)等指标上达到最优。
背景与挑战
背景概述
HumanBeauty数据集由清华大学与快手科技联合团队于2025年创建,是首个专注于人类图像美学评估(HIAA)的大规模标注数据集。该数据集包含10.8万张高质量人类图像,其中5万张通过严格的12维美学标准进行人工标注,其余5.8万张从公开数据集中筛选并统一标注。其创新性体现在建立了涵盖面部特征、体型、环境等12个美学维度的评估体系,突破了传统图像美学评估(IAA)在人类中心图像领域的局限性。该数据集为社交媒体内容优化、生成式AI工作流等应用场景提供了量化评估基准,推动了多模态基础模型在专业美学认知方向的发展。
当前挑战
HumanBeauty数据集面临的核心挑战包含两方面:在领域问题层面,需解决人类图像美学评估中主观性强、维度耦合的难题,传统IAA方法在面部特征与体型等细粒度维度关联性建模上表现欠佳;在构建过程中,数据采集需平衡面部与全身图像的覆盖度,避免现有数据集常见的头部区域偏置问题,同时通过迭代训练-测试协议确保368名标注者对12维标准的一致性。此外,从6个异构公开数据集提取人类图像时,需处理不同评分量纲的归一化问题,并克服原始数据中细粒度标注缺失的缺陷。
常用场景
经典使用场景
HumanBeauty数据集在人类图像美学评估(HIAA)领域具有广泛的应用价值。该数据集通过提供108K高质量人类图像及其多维度美学标注,为研究人员提供了丰富的实验材料。在经典使用场景中,HumanBeauty常用于训练和评估视觉语言模型(VLM)在美学评分任务中的表现。例如,研究者可以利用该数据集开发能够自动评估人类图像美学质量的算法,这些算法能够从面部亮度、轮廓清晰度、服装搭配等多个维度进行综合评分。
解决学术问题
HumanBeauty数据集有效解决了人类图像美学评估领域长期存在的数据匮乏问题。传统的美学评估研究多集中于通用图像,缺乏针对人类图像的专门数据集。该数据集不仅提供了大量标注数据,还创新性地提出了12维美学评估标准,涵盖了面部特征、身体形态、环境等多个关键维度。这一标准为后续研究提供了统一的美学评估框架,使得主观的美学感受能够转化为可量化的计算指标,显著推动了HIAA领域的发展。
实际应用
在实际应用方面,HumanBeauty数据集在社交媒体内容推荐、AI生成图像优化等领域展现出重要价值。例如,社交媒体平台可以利用基于该数据集训练的模型,自动筛选和推荐美学质量较高的用户上传图片,从而提升平台内容质量。此外,在AI生成人类图像的工作流中,该数据集可以作为质量评估的标准,帮助优化生成模型输出结果。这些应用不仅提高了自动化系统的效率,也为用户提供了更优质的美学体验。
数据集最近研究
最新研究方向
HumanBeauty数据集作为首个专注于人类图像美学评估(HIAA)的大规模数据集,近年来在计算机视觉与多媒体领域引发了广泛关注。其创新的12维度美学标注体系(涵盖面部亮度、身体轮廓等细粒度特征)为多模态基础模型研究提供了全新范式。当前前沿研究集中在三个方向:一是基于视觉语言模型(VLM)的多头协同架构设计,如论文提出的Expert Head与MetaVoter机制,通过融合回归预测与文本理解能力实现美学维度解耦;二是跨领域迁移学习,利用该数据集增强生成式AI在虚拟试衣、数字人创建等场景的审美对齐能力;三是社会计算应用,通过量化分析社交媒体图像美学特征优化内容推荐系统。2024年Qwen2VL、Llama3等大模型的对比实验表明,该数据集推动了HIAA任务指标(PLCC/SRCC)平均提升127%和78%,成为连接主观审美与客观计算的重要基准。
相关研究论文
  • 1
    HumanAesExpert: Advancing a Multi-Modality Foundation Model for Human Image Aesthetic Assessment清华大学, 快手科技 · 2025年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国区域地面气象要素驱动数据集 v2.0(1951-2024)

中国区域地面气象要素驱动数据集(China Meteorological Forcing Data,以下简称 CMFD)是为支撑中国区域陆面、水文、生态等领域研究而研发的一套高精度、高分辨率、长时间序列数据产品。本页面发布的 CMFD 2.0 包含了近地面气温、气压、比湿、全风速、向下短波辐射通量、向下长波辐射通量、降水率等气象要素,时间分辨率为 3 小时,水平空间分辨率为 0.1°,时间长度为 74 年(1951~2024 年),覆盖了 70°E~140°E,15°N~55°N 空间范围内的陆地区域。CMFD 2.0 融合了欧洲中期天气预报中心 ERA5 再分析数据与气象台站观测数据,并在辐射、降水数据产品中集成了采用人工智能技术制作的 ISCCP-ITP-CNN 和 TPHiPr 数据产品,其数据精度较 CMFD 的上一代产品有显著提升。 CMFD 历经十余年的发展,其间发布了多个重要版本。2019 年发布的 CMFD 1.6 是完全采用传统数据融合技术制作的最后一个 CMFD 版本,而本次发布的 CMFD 2.0 则是 CMFD 转向人工智能技术制作的首个版本。此版本与 1.6 版具有相同的时空分辨率和基础变量集,但在其它诸多方面存在大幅改进。除集成了采用人工智能技术制作的辐射和降水数据外,在制作 CMFD 2.0 的过程中,研发团队尽可能采用单一来源的再分析数据作为输入并引入气象台站迁址信息,显著缓解了 CMFD 1.6 中因多源数据拼接和气象台站迁址而产生的虚假气候突变。同时,CMFD 2.0 数据的时间长度从 CMFD 1.6 的 40 年大幅扩展到了 74 年,并将继续向后延伸。CMFD 2.0 的网格空间范围虽然与 CMFD 1.6 相同,但其有效数据扩展到了中国之外,能够更好地支持跨境区域研究。为方便用户使用,CMFD 2.0 还在基础变量集之外提供了若干衍生变量,包括近地面相对湿度、雨雪分离降水产品等。此外,CMFD 2.0 摒弃了 CMFD 1.6 中通过 scale_factor 和 add_offset 参数将实型数据化为整型数据的压缩技术,转而直接将实型数据压缩存储于 NetCDF4 格式文件中,从而消除了用户使用数据时进行解压换算的困扰。 本数据集原定版本号为 1.7,但鉴于本数据集从输入数据到研制技术都较上一代数据产品有了大幅的改变,故将其版本号重新定义为 2.0。

国家青藏高原科学数据中心 收录

Amazon电影评论数据集

该数据集包含从1997年8月至2012年10月期间,Amazon用户对253,059种产品的7,911,684条评论。数据集被添加了真实标签,这些标签是通过爬取/抓取Amazon.com获得的,用于分类产品。

github 收录

MeSH

MeSH(医学主题词表)是一个用于索引和检索生物医学文献的标准化词汇表。它包含了大量的医学术语和概念,用于描述医学文献中的主题和内容。MeSH数据集包括主题词、副主题词、树状结构、历史记录等信息,广泛应用于医学文献的分类和检索。

www.nlm.nih.gov 收录

Hang Seng Index

恒生指数(Hang Seng Index)是香港股市的主要股票市场指数,由恒生银行旗下的恒生指数有限公司编制。该指数涵盖了香港股票市场中最具代表性的50家上市公司,反映了香港股市的整体表现。

www.hsi.com.hk 收录

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录