five

AIGVQA-DB|AI生成视频数据集|视频质量评估数据集

收藏
arXiv2024-11-26 更新2024-11-29 收录
AI生成视频
视频质量评估
下载链接:
https://github.com/wangjiarui153/AIGV-Assessor
下载链接
链接失效反馈
资源简介:
AIGVQA-DB是由上海交通大学图像通信与网络工程研究所创建的大规模数据集,包含36,576个由15种先进文本到视频生成模型生成的AI生成视频。数据集通过1,048个多样化的提示生成,并经过系统注释流程,收集了370,000个专家评分。创建过程包括视频生成、注释和评分,旨在解决AI生成视频的感知质量评估问题,特别是在不真实物体、不自然运动和视觉元素不一致等独特失真方面。该数据集的应用领域广泛,包括娱乐、艺术、设计和广告等,旨在提高视频质量评估的准确性和全面性。
提供机构:
上海交通大学图像通信与网络工程研究所
创建时间:
2024-11-26
AI搜集汇总
数据集介绍
main_image_url
构建方式
AIGVQA-DB is meticulously constructed to address the unique challenges posed by AI-generated videos (AIGVs). The dataset comprises 36,576 AIGVs, each generated by 15 advanced text-to-video models using 1,048 diverse prompts. A systematic annotation pipeline is devised, incorporating both scoring and ranking processes to collect 370k expert ratings. This comprehensive approach ensures a robust evaluation of perceptual quality, capturing intricate details such as unrealistic objects, unnatural movements, and inconsistent visual elements.
使用方法
Researchers and practitioners can leverage AIGVQA-DB to benchmark and evaluate text-to-video generation models. The dataset supports various analyses, including quality regression tasks and pairwise preference comparisons. By utilizing the provided expert ratings and model outputs, users can develop and fine-tune VQA models, enhancing their ability to predict precise video quality scores and accurately assess video pair preferences. The dataset is publicly available, fostering collaborative research and innovation in the field of AI-generated video quality assessment.
背景与挑战
背景概述
AIGVQA-DB, a large-scale dataset comprising 36,576 AI-generated videos (AIGVs) annotated with MOS scores and pairwise comparisons, was introduced by researchers from Shanghai Jiao Tong University. This dataset was created to address the pressing need for effective video quality assessment (VQA) models specifically designed for AIGVs. The core research problem revolves around accurately assessing the perceptual quality of AIGVs, which often suffer from unique distortions such as unrealistic objects, unnatural movements, or inconsistent visual elements. The dataset's creation involved generating videos using 15 advanced text-to-video models and 1,048 diverse prompts, followed by a systematic annotation pipeline that collected 370k expert ratings. AIGVQA-DB has significantly impacted the field by providing a comprehensive benchmark for evaluating the capabilities of text-to-video models from multiple perspectives.
当前挑战
The primary challenge addressed by AIGVQA-DB is the accurate assessment of perceptual quality in AI-generated videos, which often exhibit unique distortions not seen in natural videos. Traditional VQA methods struggle with these specific distortions, such as spatial artifacts, temporal inconsistencies, and misalignment between generated content and text prompts. Additionally, the dataset's construction faced challenges in generating a diverse set of high-quality videos and ensuring the reliability of expert ratings through a systematic annotation pipeline. The dataset also highlights the need for more comprehensive metrics that can reflect human preferences for individual videos, beyond traditional fidelity-based evaluations. This necessitates the development of novel VQA models that can capture intricate quality attributes and provide accurate and robust quality assessments.
常用场景
经典使用场景
AIGVQA-DB 数据集的经典使用场景主要集中在评估和改进文本到视频生成模型的感知质量。通过提供大规模的 AI 生成视频数据集,研究人员可以开发和验证新的视频质量评估模型,特别是针对 AI 生成视频中常见的失真类型,如不真实的物体、不自然的运动或视觉元素不一致等问题。此外,该数据集还可用于训练和测试基于时空特征和大型多模态模型(LMM)的评估方法,以捕捉 AI 生成视频的复杂质量属性。
解决学术问题
AIGVQA-DB 数据集解决了当前视频质量评估模型在评估 AI 生成视频时面临的常见学术问题。传统视频质量评估方法主要针对专业生成内容(PGC)和用户生成内容(UGC),难以处理 AI 生成视频中的独特失真。该数据集通过提供大规模的 AI 生成视频及其专家评分,促进了更全面和精确的评估模型的开发,从而推动了视频质量评估领域的研究进展。
实际应用
AIGVQA-DB 数据集在实际应用中具有广泛的应用场景。例如,在娱乐、艺术、设计和广告等领域,内容创作者可以使用该数据集来评估和改进其 AI 生成视频的质量。此外,视频平台和社交媒体可以利用该数据集来筛选和推荐高质量的 AI 生成视频,提升用户体验。该数据集还可用于开发和优化视频编辑工具,帮助用户生成更高质量的视频内容。
数据集最近研究
最新研究方向
在人工智能生成的视频(AIGVs)领域,最新的研究方向集中在开发和评估针对AIGVs的感知质量评估模型。随着大规模多模态模型(LMMs)的快速发展,AIGVs的应用范围不断扩大,这使得对AIGVs的质量评估变得尤为重要。当前的研究主要集中在构建大规模数据集,如AIGVQA-DB,该数据集包含36,576个由15种先进文本到视频模型生成的视频,并通过系统注释流程收集了370,000个专家评分。基于此数据集,研究者们提出了AIGV-Assessor模型,该模型利用时空特征和LMM框架来捕捉AIGVs的复杂质量属性,从而准确预测视频质量分数和视频对偏好。这些研究不仅推动了AIGVs的质量评估技术,还为视频生成模型的性能基准测试提供了新的标准。
相关研究论文
  • 1
    AIGV-Assessor: Benchmarking and Evaluating the Perceptual Quality of Text-to-Video Generation with LMM上海交通大学图像通信与网络工程研究所 · 2024年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国气象数据

本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。

github 收录

典型分布式光伏出力预测数据集

光伏电站出力数据每5分钟从电站机房监控系统获取;气象实测数据从气象站获取,气象站建于电站30号箱变附近,每5分钟将采集的数据通过光纤传输到机房;数值天气预报数据利用中国电科院新能源气象应用机房的WRF业务系统(包括30TF计算刀片机、250TB并行存储)进行中尺度模式计算后输出预报产品,每日8点前通过反向隔离装置推送到电站内网预测系统。

国家基础学科公共科学数据中心 收录

SWaT Dataset

SWaT Dataset是一个用于工业控制系统(ICS)安全研究的数据集,包含了模拟的网络攻击和正常操作的数据。该数据集由新加坡科技设计大学(Singapore University of Technology and Design)发布,旨在帮助研究人员开发和测试用于检测工业控制系统中网络攻击的算法和模型。

itrust.sutd.edu.sg 收录

PDT Dataset

PDT数据集是由山东计算机科学中心(国家超级计算济南中心)和齐鲁工业大学(山东省科学院)联合开发的无人机目标检测数据集,专门用于检测树木病虫害。该数据集包含高分辨率和低分辨率两种版本,共计5775张图像,涵盖了健康和受病虫害影响的松树图像。数据集的创建过程包括实地采集、数据预处理和人工标注,旨在为无人机在农业中的精准喷洒提供高精度的目标检测支持。PDT数据集的应用领域主要集中在农业无人机技术,旨在提高无人机在植物保护中的目标识别精度,解决传统检测模型在实际应用中的不足。

arXiv 收录

THUCNews

THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。

github 收录