PIQ23|人像图像质量数据集|图像评估数据集
收藏arXiv2023-04-12 更新2024-07-30 收录
下载链接:
https://github.com/DXOMARK-Research/PIQ2023
下载链接
链接失效反馈资源简介:
PIQ23是一个专门针对人像的图像质量评估数据集,包含5116张来自50个预定义场景的图像,这些图像由100种不同品牌和型号的智能手机拍摄。数据集涵盖了广泛的用途,并包括了不同性别和种族的个人,他们都明确且知情地同意将其照片用于公开研究。数据集通过成对比较(PWC)由30多位图像质量专家对三个图像属性进行标注:面部细节保留、面部目标曝光和整体图像质量。
创建时间:
2023-04-12
原始信息汇总
PIQ23: An Image Quality Assessment Dataset for Portraits
数据集概述
- 名称:PIQ23
- 类型:人像特定图像质量评估数据集
- 图像数量:5116张
- 设备:超过100种智能手机
- 场景:预定义的多种场景
- 参与者:来自不同年龄、性别和种族的个体
- 许可:明确且知情的同意用于公共研究
- 标注:由30多名图像质量专家进行的成对比较(PWC)
- 属性:面部细节保留、面部目标曝光、整体图像质量
数据集结构
├── Details ├── Overall ├── Exposure ├── Scores_Details.csv ├── Scores_Overall.csv └── Scores_Exposure.csv
- 文件命名:{img_nb}_{scene_name}_{scene_idx}.{ext}
- CSV文件条目:
- IMAGE PATH:图像的相对路径
- IMAGE:图像名称
- JOD:图像的jod分数
- JOD STD:jod标准差
- CI LOW:置信区间的下限
- CI HIGH:置信区间的上限
- CI RANGE:CI HIGH - CI LOW
- QUALITY LEVEL:初步质量等级
- CLUSTER:最终质量等级
- TOTAL COMPARISONS:该图像的总比较次数
- SCENE:场景名称
- ATTRIBUTE:属性(Exposure, Details 或 Overall)
- SCENE IDX:场景索引(从0到49)
- CONDITION:光照条件(Outdoor, Indoor, Lowlight 或 Night)
测试分割
- 设备分割:
- 测试集包含每个场景约30%的图像
- 避免设备偏差,选择不同质量水平和价格范围的设备
- 设备分割CSV文件位于 "Test splitDevice Split.csv"
- 不同属性的测试和训练CSV文件位于 "Test splitDevice Split"
- 场景分割:
- 选择15/50个场景进行测试,覆盖每种条件约30%的图像
- 场景分割CSV文件位于 "Test splitScene Split.csv"
- 不同属性的测试和训练CSV文件位于 "Test splitScene Split"
- 场景示例位于 "Test splitScene SplitScene examples"
基准测试
- 实验说明:
- 结果代表所有场景的中位数指标
- 选择在测试集上获得最高SROCC的模型
- 模型基础分辨率为1200,HyperIQA变体为1344(224*6)
引用
bibtex @InProceedings{Chahine_2023_CVPR, author = {Chahine, Nicolas and Calarasanu, Stefania and Garcia-Civiero, Davide and Cayla, Theo and Ferradans, Sira and Ponce, Jean}, title = {An Image Quality Assessment Dataset for Portraits}, booktitle = {Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)}, month = {June}, year = {2023}, pages = {9968-9978} }
许可
- 仅限非商业研究用途
- 不得复制、出售、交易或用于任何商业目的
- 根据作者要求移除任何图像集
联系
- 如有问题,请联系:piq2023@dxomark.com
AI搜集汇总
数据集介绍

构建方式
PIQ23 数据集的构建方式独具匠心。它由 5116 张肖像照片组成,这些照片由 100 部来自 14 个品牌的智能手机拍摄,涵盖了 50 个预定义的场景,包括户外、室内、低光和夜景等。为了确保数据集的多样性和实用性,研究人员采用了多种智能手机镜头焦距,例如变焦、广角和自拍镜头,以及不同的相机模式,例如夜间模式和散景模式。此外,研究人员还收集了各种性别和种族的个人照片,以最大限度地减少数据集的偏差。为了确保注释的一致性和准确性,研究人员邀请了超过 30 位图像质量专家对每张照片进行了成对比较,并根据三个图像属性进行了注释:面部细节保留、面部目标曝光和整体图像质量。
特点
PIQ23 数据集具有以下特点:1. 数据集规模庞大,包含 5116 张肖像照片,涵盖了多种场景、设备和使用案例;2. 数据集注释由图像质量专家进行,确保了注释的一致性和准确性;3. 数据集采用了成对比较的注释方法,这种方法在图像质量评估实验中被证明是更一致的;4. 数据集考虑了性别和种族的多样性,以最大限度地减少数据集的偏差;5. 数据集提供了深入的统计分析,用于评估注释的一致性和准确性。
使用方法
PIQ23 数据集可用于多种用途,例如:1. 训练和评估图像质量评估模型;2. 研究肖像图像质量评估的属性和方法;3. 评估智能手机相机的图像质量。使用 PIQ23 数据集时,研究人员需要遵循以下步骤:1. 了解数据集的构成和注释方法;2. 选择合适的图像质量评估模型;3. 使用数据集训练和评估模型;4. 分析模型的性能和局限性。
背景与挑战
背景概述
在智能手机摄影日益普及的背景下,尤其是人像摄影领域,对图像质量评估的需求不断增长。智能手机制造商在开发相机时,会使用感知质量标准,这一过程昂贵且耗时。为了替代部分手动评估,基于自动学习的图像质量评估(IQA)方法应运而生。然而,由于IQA过程的客观性和一致性存在挑战,因此需要开发一个新的框架来评估和比较主观判断。PIQ23数据集由DXOMARK公司的研究人员于2023年创建,旨在解决这些问题,它包含5116张由100部智能手机拍摄的50个预定义场景的人像图像,涵盖了多种品牌和型号。该数据集由超过30位图像质量专家通过成对比较(PWC)进行注释,包括面部细节保留、面部目标曝光和整体图像质量三个属性。PIQ23数据集为IQA研究提供了一个新的方向,并推动了智能手机人像摄影的发展。
当前挑战
PIQ23数据集在构建过程中面临了几个挑战。首先,人像图像质量评估是一个主观的过程,不同观察者之间的意见可能存在分歧,这给数据集的注释和一致性带来了挑战。其次,PIQ23数据集包含多个场景,每个场景都有其独特的质量尺度,这导致了域偏移问题。为了解决这个问题,研究人员提出了一个新的深度BIQA方法,结合语义信息和多任务学习,以适应每个场景的质量尺度。最后,PIQ23数据集的注释需要大量的时间和人力,这增加了构建数据集的难度。尽管如此,PIQ23数据集为IQA研究提供了一个重要的资源,并为智能手机人像摄影的发展做出了贡献。
常用场景
经典使用场景
PIQ23数据集主要应用于人像图像质量评估(IQA)领域,特别是针对智能手机拍摄的人像照片。该数据集包含了5116张由100部智能手机拍摄的图像,涵盖了50个预定义的场景,并涉及不同品牌、型号和用例。数据集由30多名图像质量专家对三个图像属性进行了成对比较(PWC)标注:人脸细节保留、人脸目标曝光和整体图像质量。这些标注为研究人像图像质量评估提供了宝贵的参考数据,并可用于训练和评估IQA模型,从而帮助智能手机制造商提高相机性能和图像质量。
实际应用
PIQ23数据集在实际应用中具有广泛的应用前景。首先,它可以用于评估和比较不同智能手机相机的人像图像质量,帮助制造商改进相机设计和优化算法。其次,PIQ23数据集可以用于训练和评估IQA模型,从而实现自动化的人像图像质量评估,为社交媒体、在线照片编辑和打印服务等应用提供质量保证。此外,PIQ23数据集还可以用于研究人像图像质量与美学、心理感知等因素之间的关系,为人像摄影艺术和技术的发展提供理论指导。
衍生相关工作
PIQ23数据集的发布推动了人像图像质量评估领域的研究进展。基于PIQ23数据集,研究人员提出了多种新的IQA模型和算法,例如SEM-HyperIQA,它结合了语义信息和多任务学习,有效地解决了领域偏移问题,提高了IQA模型的性能。此外,PIQ23数据集还促进了人像图像质量评估方法的标准化和规范化,为人像图像质量评估领域的研究和应用奠定了基础。
以上内容由AI搜集并总结生成
