Q-EVAL-100K

github2025-03-17 更新2025-03-06 收录

下载链接：

https://github.com/zzc-1998/Q-Eval

下载链接

链接失效反馈

官方服务：

资源简介：

Q-EVAL-100K数据集旨在评估文本到视觉内容的视觉质量和对齐水平，包含了960K的人类标注数据，覆盖了100K个实例（60K图像和40K视频）。该数据集支持文本到图像和文本到视频模型，并提出了Q-Eval-Score模型，用于统一评估视觉质量和对齐，特别改进了处理长文本提示对齐的能力。

The Q-EVAL-100K dataset is designed to evaluate the visual quality and alignment level of text-to-visual content. It contains 960,000 human-annotated data samples, covering 100,000 instances (60,000 images and 40,000 videos). This dataset supports both text-to-image and text-to-video models, and proposes the Q-Eval-Score model for unified evaluation of visual quality and alignment, which particularly enhances the capability of handling alignment for long-text prompts.

创建时间：

2025-03-02

原始信息汇总

Q-Eval-100K 数据集概述

数据集基本信息

名称: Q-Eval-100K
用途: 评估文本到视觉内容的视觉质量和对齐水平
规模: 100K实例（60K图像和40K视频）
标注数量: 960K人类标注
标注类型: 平均意见分数（MOS）

数据集特点

覆盖范围: 包含文本到图像和文本到视频模型
标注维度: 视觉质量和对齐水平
改进点: 特别针对长文本提示对齐进行了优化

数据集应用

模型开发: 用于开发评估视觉质量和对齐的统一模型
性能表现: 在视觉质量和对齐方面表现出色，具有强大的泛化能力

数据集访问

获取地址: AGI-Eval

引用信息

bibtex @misc{zhang2025qeval100kevaluatingvisualquality, title={Q-Eval-100K: Evaluating Visual Quality and Alignment Level for Text-to-Vision Content}, author={Zicheng Zhang and Tengchuan Kou and Shushi Wang and Chunyi Li and Wei Sun and Wei Wang and Xiaoyu Li and Zongyu Wang and Xuezhi Cao and Xiongkuo Min and Xiaohong Liu and Guangtao Zhai}, year={2025}, eprint={2503.02357}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2503.02357}, }

搜集汇总

数据集介绍

构建方式

Q-Eval-100K数据集的构建旨在服务于图像与文本内容匹配的质量评估和校准水平研究。该数据集的构建基于对大量图像与文本配对的细致筛选和分类，确保了数据的多样性与准确性，为视觉质量与对齐程度评价提供了坚实基础。

使用方法

使用Q-Eval-100K数据集，研究者可以依据其提供的图像与文本配对进行质量评估和对齐度分析。数据集的访问和使用遵循相关开放数据协议，用户可以直接从指定平台下载，并在遵守数据使用条款的前提下，应用于算法训练、模型评估等研究活动。

背景与挑战

背景概述

Q-Eval-100K数据集，作为评价文本至视觉内容的质量与对齐程度的研究工具，是在NTIRE 2025 XGC Track 2竞赛背景下应运而生的。该数据集由专注于图像与文本关系研究的团队或机构创建，旨在为视觉质量评估和图像与文本对齐级别评价提供标准化基准。自推出以来，Q-Eval-100K在图像处理、自然语言处理以及多模态内容理解等领域产生了广泛影响，推动了相关技术的发展和应用。

当前挑战

在数据集构建过程中，研究人员面临的挑战包括如何准确量化视觉质量与文本对齐程度，以及如何确保数据集的多样性和代表性。此外，数据集在解决文本与图像匹配质量评估问题时，也遭遇了如何有效区分主观质量感受与客观质量标准的挑战。构建过程中的技术难题，如数据标注的一致性和准确性，也是必须克服的关键问题。

常用场景

经典使用场景

在当前计算机视觉与自然语言处理交叉领域的研究中，Q-Eval-100K数据集被广泛用于评估文本到视觉内容的质量与对齐程度。该数据集通过提供大量配对的文本与图像，成为检验模型在视觉问答、图像生成等任务上的性能基准。

解决学术问题

Q-Eval-100K数据集解决了学术研究中如何量化评估视觉内容与文本描述之间一致性的问题，对于提高跨模态任务中的模型性能，优化算法设计，以及提升模型解释性等方面具有重要意义。该数据集为研究者提供了一个统一的评价标准，促进了相关领域的公平比较与进步。

实际应用

在实际应用中，Q-Eval-100K数据集的应用场景广泛，包括但不限于智能内容审核、图像搜索、以及增强现实（AR）等领域。通过该数据集的评估，企业可以更有效地筛选和优化其视觉内容生成算法，以满足用户对高质量视觉体验的需求。

数据集最近研究