five

AIGC-PanoIQA

收藏
github2026-03-29 更新2026-03-31 收录
下载链接:
https://github.com/shuaibilx/AIGC-PanoIQA
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个大规模基准数据集,包含1,440个AIGC全景图对和超过10,000个视口补丁,用于评估AI生成全景图在视觉质量、舒适性和一致性三个关键维度的客观质量。数据集通过定制的Unity VR应用程序收集了主观平均意见分数(MOS),确保了真实的沉浸式评估。

This is a large-scale benchmark dataset comprising 1,440 AIGC panoramic image pairs and over 10,000 viewport patches, designed to evaluate the objective quality of AI-generated panoramic images across three critical dimensions: visual quality, comfort, and consistency. Subjective Mean Opinion Scores (MOS) were collected for this dataset via a customized Unity VR application, ensuring authentic immersive assessments.
创建时间:
2026-03-29
原始信息汇总

AIGC-PanoIQA 数据集概述

数据集基本信息

  • 数据集名称:AIGC-PanoIQA
  • 官方描述:首个文本+图像到图像的全景数据集,用于评估AI生成全景图在三个关键维度的客观质量:视觉质量(感知)、舒适度和一致性。
  • 发布状态:部分发布(2026年03月),完整数据集和源代码将在论文发表后公开。
  • 许可证:MIT

数据集规模与内容

  • 全景图对数量:1,440对
  • 视口补丁数量:10,000+个
  • 生成模型:Stable Diffusion、NanoBanana pro、Flux
  • 数据维度:提供视觉质量、舒适度、一致性的多维标注

数据收集与标注

  • 主观评估方法:使用基于Unity开发的自定义VR IQA应用程序,在头戴式显示器中进行沉浸式评估。
  • 评估指标:收集主观平均意见分数(MOS),涵盖视觉质量、舒适度和一致性。

数据集获取

  • 下载地址:https://pan.quark.cn/s/b2c3621d8a18
  • 提取码:wi8M

相关论文

  • 论文状态:正在审稿中(2026年03月)
  • 实现框架:本仓库包含AIGC-PanoIQA框架的官方PyTorch实现及对应的大规模基准数据集。
搜集汇总
数据集介绍
main_image_url
构建方式
在人工智能生成内容质量评估领域,构建一个专门针对全景图像的数据集具有重要价值。AIGC-PanoIQA数据集的构建采用了系统化的生成与标注流程,首先利用Stable Diffusion、NanoBanana pro及Flux等多种先进生成模型,创建了1440对全景图像样本,并从中提取了超过一万个视口图像块。主观质量评估通过基于Unity平台自主研发的虚拟现实应用程序完成,研究者在头戴式显示设备中收集了用户在视觉质量、舒适度与一致性三个维度的平均意见分数,确保了评估过程的沉浸感与真实性。
特点
该数据集作为首个结合文本与图像提示生成的全景图像质量评估基准,其规模与设计理念均处于前沿。数据集不仅提供了大规模的人工智能生成全景图像对,还包含了从这些全景图中提取的丰富视口样本,为多角度分析提供了基础。其核心特点在于引入了沉浸式虚拟现实环境下的主观评分,使得质量评估更贴近真实用户体验,同时覆盖了视觉感知、舒适度与内容一致性等多个关键质量维度,为全面评估生成式全景图像的质量建立了新的标准。
使用方法
对于研究人员而言,该数据集为开发与验证全景图像质量评估模型提供了重要资源。使用者可通过提供的下载链接获取数据集,其中包含生成的全景图像对、提取的视口块以及对应的多维度主观评分标签。这些数据可直接用于训练或测试质量评估算法,特别是在探索多模态融合或解耦学习框架时,能够支持对视觉质量、舒适度与一致性等细分属性的独立或联合建模。数据集的结构化设计便于进行性能基准测试,推动人工智能生成内容质量评估领域的技术发展。
背景与挑战
背景概述
随着人工智能生成内容(AIGC)技术的迅猛发展,全景图像作为虚拟现实与沉浸式媒体的核心载体,其质量评估已成为计算机视觉与多媒体领域的前沿课题。在此背景下,AIGC-PanoIQA数据集应运而生,由相关研究团队于2026年创建,作为首个专注于文本+图像到图像生成的全景图像质量评估基准。该数据集旨在系统性地解决AI生成全景图像在视觉质量、舒适度与一致性三个维度的客观评价问题,通过大规模的主观评分收集与多模态数据融合,为生成式全景内容的量化分析提供了重要支撑,对推动沉浸式媒体质量评估标准的发展具有显著影响力。
当前挑战
在AI生成全景图像质量评估领域,核心挑战在于如何准确量化生成内容在沉浸式环境中的多维感知特性,包括视觉逼真度、观看舒适性以及空间一致性,这些因素直接影响虚拟现实用户体验的真实感与安全性。数据集构建过程中,研究团队面临了多重技术难题:首先,需设计并开发基于Unity的定制化VR应用程序,以在头戴式显示器中收集真实的主观平均意见分数,确保评估过程的沉浸性与可靠性;其次,从数千对全景图像及其提取的视口中进行高质量、多维度标注,涉及大规模数据处理与人工评分协调,对资源与流程优化提出了较高要求。
常用场景
经典使用场景
在沉浸式媒体与人工智能生成内容领域,全景图像的质量评估面临独特挑战。AIGC-PanoIQA数据集作为首个文本+图像到全景图像的基准数据集,其经典使用场景在于为研究者提供了一个标准化的测试平台,用于开发和验证全景图像质量评估模型。通过包含1,440对AI生成的全景图像及其对应的主观评分,该数据集支持对视觉质量、舒适度和一致性三个维度的系统性分析,为模型训练与性能比较奠定了坚实基础。
实际应用
在实际应用层面,AIGC-PanoIQA数据集对虚拟现实、增强现实以及沉浸式媒体内容制作具有显著价值。基于该数据集训练的评估模型可集成到AI生成工具链中,实时监控和优化全景内容的视觉保真度与观看舒适性,从而提升用户体验。此外,它还能为内容平台提供自动化质量审核机制,确保AI生成的全景图像符合行业标准,促进高质量沉浸式内容的规模化生产与分发。
衍生相关工作
围绕AIGC-PanoIQA数据集,已衍生出多项经典研究工作,特别是在多模态融合网络架构设计方面。例如,基于该数据集的解耦多模态融合网络,通过分离处理视觉特征与舒适度、一致性特征,实现了更精准的质量预测。这些工作不仅推动了全景图像质量评估算法的进步,还启发了跨模态表示学习、沉浸式主观评估方法等领域的新探索,为后续研究提供了重要参考。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作