five

Datasets-PhotoFramer-Assessment

收藏
Hugging Face2026-04-18 更新2026-04-19 收录
下载链接:
https://huggingface.co/datasets/zhiyuanyou/Datasets-PhotoFramer-Assessment
下载链接
链接失效反馈
官方服务:
资源简介:
PhotoFramer Composition Assessment Datasets 是一个用于图像构图评估的数据集,属于图像文本到图像的任务类别。数据集整合了来自 AVA、CADB、GAIC 和 KUPCP 等多个子数据集的图像资源,并提供了相应的元数据文件。数据集的结构包括多个子文件夹,分别存储不同来源的图像和元数据,同时还提供了图像大小调整的脚本(resize_img.py)。该数据集适用于图像构图分析、图像生成和计算机视觉相关的研究与应用。
创建时间:
2026-04-18
原始信息汇总

PhotoFramer Composition Assessment Datasets 数据集概述

数据集基本信息

  • 许可证: MIT
  • 主要语言: 英语 (en)
  • 任务类别: 图像-文本到图像 (image-text-to-image)

数据集来源与构成

本数据集为 PhotoFramer 项目中的构图评估数据集。数据集通过整合以下四个公开数据集构建而成:

  1. AVA 数据集
  2. CADB 数据集
  3. GAIC 数据集
  4. KU_PCP 数据集

文件组织结构

数据集要求按以下目录结构组织文件:

|-- PhotoFramer-Assessment |-- Datasets |-- AVA_dataset |-- ava_images/.jpg |-- metas |-- CADB_Dataset |-- images/.jpg |-- metas |-- GAIC |-- images/train/.jpg |-- images/test/.jpg |-- metas |-- KU_PCP_Dataset |-- train_img/.jpg |-- train_img_1024/.jpg |-- test_img/.jpg |-- test_img_1024/.jpg |-- metas |-- resize_img.py

说明KU_PCP_Dataset 文件夹下的 train_img_1024test_img_1024 文件夹需通过运行该文件夹内的 resize_img.py 脚本生成。

使用说明

  1. 从本仓库下载元数据文件。
  2. 分别从 AVA、CADB、GAIC 和 KUPCP 数据集中下载所有源图像。
  3. 按照上述目录结构组织文件。

相关资源

  • 项目主页: https://zhiyuanyou.github.io/photoframer/
  • 代码仓库: https://github.com/zhiyuanyou/PhotoFramer-Assessment
  • 论文: https://arxiv.org/abs/2512.00993

引用

如果本数据集对您的研究或应用有帮助,请使用以下 BibTeX 格式引用: bibtex @inproceedings{photoframer, title={PhotoFramer: Multi-modal Image Composition Instruction}, author={You, Zhiyuan and Wang, Ke and Zhang, He and Cai, Xin and Gu, Jinjin and Xue, Tianfan and Dong, Chao and Zhang, Zhoutong}, booktitle={IEEE/CVF Conference on Computer Vision and Pattern Recognition}, year={2026} }

搜集汇总
数据集介绍
main_image_url
构建方式
在计算机视觉与图像美学评估领域,PhotoFramer Composition Assessment数据集通过整合多个权威美学基准构建而成。其构建过程始于从AVA、CADB、GAIC及KU_PCP等现有数据集中系统性地下载原始图像,随后依据预设的目录结构进行组织,并利用配套脚本对部分图像进行分辨率统一处理,最终形成结构清晰、便于访问的多源图像集合。
特点
该数据集的核心特点在于其多源集成性与结构化设计,它汇聚了来自不同美学评估任务的图像资源,为构图质量评估提供了丰富的视觉素材。数据集通过标准化的元数据管理与图像预处理,确保了数据的一致性与可比性,同时其层次化的文件夹布局极大地方便了研究者按需调用与扩展。
使用方法
为有效利用该数据集,用户需首先按照README中指定的目录结构放置图像与元数据文件。随后,可通过运行附带的Python脚本完成图像尺寸调整等预处理步骤,进而直接加载处理后的图像与对应元数据,用于训练或评估图像构图分析、美学评分等相关计算机视觉模型。
背景与挑战
背景概述
在计算机视觉与图像美学评估领域,构图质量是衡量图像艺术价值与视觉吸引力的核心维度。PhotoFramer Composition Assessment Datasets由研究团队于2026年构建,并发表于IEEE/CVF计算机视觉与模式识别会议,旨在通过多模态方法解决图像构图自动评估的复杂问题。该数据集整合了AVA、CADB、GAIC及KU_PCP等多个权威美学数据集,为图像构图分析提供了大规模、多样化的基准资源,显著推动了图像生成与编辑技术中构图优化方向的发展。
当前挑战
该数据集致力于应对图像构图质量自动评估的挑战,其核心在于建模人类对视觉平衡、焦点引导及空间布局的深层感知,这要求算法不仅能识别物体,还需理解美学原则。在构建过程中,研究团队面临多源数据整合的复杂性,包括不同数据集的图像格式、分辨率及标注标准的统一,同时需通过图像尺寸调整等预处理步骤确保数据一致性,这些工作为构图评估模型的稳健训练奠定了基础。
常用场景
经典使用场景
在计算机视觉与美学评估领域,PhotoFramer Composition Assessment数据集为图像构图质量的量化分析提供了关键支撑。该数据集整合了AVA、CADB、GAIC和KU_PCP等多个权威美学评估数据源,构建了涵盖广泛视觉风格的图像集合,常用于训练和评估深度学习模型在构图评分、裁剪建议等任务上的性能。研究者通过该数据集能够系统探索图像中主体布局、视觉平衡与美学规则之间的关联,为自动化构图优化奠定数据基础。
实际应用
在实际应用层面,PhotoFramer数据集为智能图像处理工具的开发提供了重要参考。基于该数据集训练的模型可集成于摄影辅助系统、社交媒体平台或专业编辑软件中,实现实时构图分析与优化建议。例如,在移动摄影应用中,它能够引导用户调整拍摄角度;在广告设计领域,则可辅助生成符合视觉美学的版面布局,提升内容传播效果,体现了学术研究向产业实践的转化价值。
衍生相关工作
围绕PhotoFramer数据集,已衍生出一系列聚焦图像构图与美学计算的经典研究工作。这些工作主要包括基于深度学习的构图评分模型、端到端的智能裁剪算法,以及结合视觉-文本多模态信号的构图指令生成系统。相关成果不仅发表于CVPR等顶级会议,还推动了开源工具链的发展,为后续研究如动态构图调整、跨风格美学迁移等方向提供了方法论与基准借鉴。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作