five

Large-scale Generated Video Quality assessment (LGVQ)|AI视频生成数据集|视频质量评估数据集

收藏
arXiv2024-07-31 更新2024-08-06 收录
AI视频生成
视频质量评估
下载链接:
http://arxiv.org/abs/2407.21408v1
下载链接
链接失效反馈
资源简介:
LGVQ数据集是由多个研究机构合作构建的大规模生成视频质量评估数据集,包含2808个AI生成的视频,这些视频由6种主流文本到视频生成算法基于468个文本提示生成。数据集的创建旨在从主观和客观角度系统地研究AI生成视频的质量评估问题。数据集的创建过程包括选择文本提示、生成视频、以及邀请54名参与者对视频的空间质量、时间质量和文本到视频的对齐质量进行评分。LGVQ数据集主要应用于视频生成技术的质量评估,旨在解决AI生成视频的质量评估难题,特别是在捕捉复杂失真和语义层面质量特征方面。
提供机构:
研究机构未明确提及
创建时间:
2024-07-31
AI搜集汇总
数据集介绍
main_image_url
构建方式
LGVQ数据集的构建旨在系统性地研究AIGC视频质量评估问题,从主观和客观两个角度进行。该数据集由2,808个AIGC视频组成,这些视频是由6种视频生成模型使用468个精心挑选的文本提示生成的。与之前的VQA实验不同,LGVQ数据集从三个维度评估AIGC视频的感知质量:空间质量、时间质量和文本到视频的对齐度,这三个维度对当前视频生成技术至关重要。
使用方法
使用LGVQ数据集的方法包括主观质量评估和客观质量评估。主观质量评估涉及邀请参与者对每个视频的空间质量、时间质量和文本到视频的对齐度进行评分。客观质量评估则是在LGVQ数据集上测试现有的质量评估指标,以分析它们在评估AIGC视频质量方面的能力。此外,还可以使用UGVQ模型进行综合评估,该模型能够同时评估AIGC视频的三个质量维度。
背景与挑战
背景概述
随着生成模型和数字媒体技术的迅猛发展,人工智能生成内容(AIGC)媒体近年来受到了广泛关注。AIGC视频,尤其是基于文本的视频生成技术,已经成为电影、游戏、广告等多个领域的重要应用。然而,AIGC视频在生成过程中容易产生空间和时间的失真,如模糊的对象和背景、动作不连贯等,此外,AIGC视频与原始文本之间的不一致也可能影响其应用效果。为了评估AIGC视频的感知质量,研究人员创建了大规模生成视频质量评估(LGVQ)数据集,该数据集包含由6种视频生成模型生成的2,808个AIGC视频,这些视频基于468个精心挑选的文本提示生成。LGVQ数据集从空间质量、时间质量和文本到视频的对齐三个维度评估了AIGC视频的感知质量,这对于当前的视频生成技术具有重要意义。该数据集和提出的统一生成视频质量评估(UGVQ)模型将公开发布,以促进AIGC视频质量评估指标的发展。
当前挑战
AIGC视频的质量评估面临着一些挑战。首先,AIGC视频表现出高度复杂的失真,如不自然的动作、不合逻辑的对象等,这使得质量评估变得困难。其次,现有的质量评估指标在LGVQ数据集上的表现不佳,无法有效地评估AIGC视频的感知质量。此外,如何有效地评估AIGC视频的感知质量对于衡量视频生成技术的进步、从T2V模型生成的候选视频中筛选出最佳的AIGC视频以及优化视频生成技术至关重要。最后,LGVQ数据集的构建过程中,如何确保生成的视频内容尽可能覆盖广泛的现实场景,以及如何选择合适的T2V模型和文本提示,也是需要考虑的挑战。
常用场景
经典使用场景
该数据集主要用于评估由人工智能生成的视频内容的感知质量,特别是针对那些使用文本描述自动创建视频的内容。在评估过程中,LGVQ数据集从空间质量、时间质量和文本到视频的对应关系三个方面对视频进行评估。此外,该数据集还可以用于比较和评估现有的视频质量评估指标,并揭示当前指标在AIGC视频上的局限性。
解决学术问题
LGVQ数据集解决了如何有效地评估由人工智能生成的视频内容的感知质量的问题。在以往的视频生成研究中,只有少数指标被用于评估视频生成方法的有效性,如IS、FID、FVD、KVD、CLIP和CLIPScore等。然而,这些指标往往不能完全捕捉到视频的复杂性和多样性,特别是对于由人工智能生成的视频。LGVQ数据集的建立,为视频质量评估提供了一个新的基准,并促进了质量评估指标的发展。
实际应用
LGVQ数据集的实际应用场景包括但不限于:1)用于电影、游戏、广告等行业的人工智能生成内容的感知质量评估;2)用于选择最佳的人工智能生成视频;3)用于优化视频生成技术。此外,LGVQ数据集还可以用于开发新的视频质量评估模型,以更好地评估由人工智能生成的视频内容的感知质量。
数据集最近研究
最新研究方向
在视频生成技术迅速发展的背景下,人工智能生成内容(AIGC)视频的质量评估显得尤为重要。LGVQ数据集的构建,为AIGC视频的主观质量评估提供了新的视角,涵盖了空间质量、时间质量和文本-视频对齐三个维度,这对于当前的视频生成技术至关重要。同时,通过对现有质量评估指标的基准测试,揭示了当前指标在AIGC视频质量评估方面的局限性。因此,研究如何构建一个能够准确评估AIGC视频质量的综合评估模型,成为了该领域的前沿研究方向。
相关研究论文
  • 1
    Benchmarking AIGC Video Quality Assessment: A Dataset and Unified Model研究机构未明确提及 · 2024年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中亚主要国家的原油资源的储量、产量、消费量及其占世界比重(1985-2016)

中亚五国中,石油资源主要分布在哈萨克斯坦、乌兹别克斯坦、土库曼斯坦三个国家。根据BP世界能源统计年鉴,经整理、抽取、计算和汇总后,形成中亚主要国家(哈萨克斯坦、乌兹别克斯坦、土库曼斯坦)原油资源的储量、产量、消费量及其占世界比重的统计表。 主要指标包括: (1)储量,1991-2016年,单位:百万吨 (2)产量,1985-2016年,单位:百万吨 (3)储产比,1991-2016年,单位:百万吨 (4)消费量,1985-2016年,单位:百万吨 (5)产消差额,1985-2016年,单位:百万吨 此外,以上数据均包括中亚地区的哈萨克斯坦、乌兹别克斯坦、土库曼斯坦、三国汇总以及世界总量的情况。

地球大数据科学工程 收录

flames-and-smoke-datasets

该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。

github 收录

UniProt

UniProt(Universal Protein Resource)是全球公认的蛋白质序列与功能信息权威数据库,由欧洲生物信息学研究所(EBI)、瑞士生物信息学研究所(SIB)和美国蛋白质信息资源中心(PIR)联合运营。该数据库以其广度和深度兼备的蛋白质信息资源闻名,整合了实验验证的高质量数据与大规模预测的自动注释内容,涵盖从分子序列、结构到功能的全面信息。UniProt核心包括注释详尽的UniProtKB知识库(分为人工校验的Swiss-Prot和自动生成的TrEMBL),以及支持高效序列聚类分析的UniRef和全局蛋白质序列归档的UniParc。其卓越的数据质量和多样化的检索工具,为基础研究和药物研发提供了无可替代的支持,成为生物学研究中不可或缺的资源。

www.uniprot.org 收录

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

Office-31, Office-Home, VisDA-2017, DomainNet

Office-31是一个包含31个类别的办公用品图像数据集,Office-Home包含65个类别的日常用品图像数据集,VisDA-2017是一个用于视觉领域自适应挑战的数据集,DomainNet是一个大规模的多领域图像数据集。

github 收录