GAIA

github2024-05-27 更新2024-05-31 收录

下载链接：

https://github.com/zijianchen98/GAIA

下载链接

链接失效反馈

官方服务：

资源简介：

一个通用的AI生成动作数据集

A general-purpose AI-generated motion dataset

创建时间：

2024-05-27

原始信息汇总

GAIA数据集概述

数据集名称

GAIA: Rethinking Action Quality Assessment for AI-Generated Videos

数据集目的

评估动作质量对AI生成视频质量的影响。
从因果推理三段论的新视角收集注释，将动作过程分解为动作主体、动作完整性和动作-场景交互三个部分。

数据集内容

视频数量: 9,180个视频
视频命名规则: (model name)_(action keyword).mp4
附加文件: MOS.csv，包含每个视频的最终动作主体、完整性和交互的评分。

数据集结构

数据集构建方法

采用因果推理三段论方法，分解动作过程为三个部分，并收集了971,244个评分。

数据集评估

评估了18种流行的文本到视频(T2V)模型在生成视觉合理动作方面的能力。
模型比较包括开源实验室研究和大规模商业应用。

数据集下载

可通过OneDrive或Baidu Netdisk使用代码utra下载。

联系信息

第一作者: Zijian Chen, zijian.chen@sjtu.edu.cn

引用信息

@article{chen2024gaia, title={GAIA: Rethinking Action Quality Assessment for AI-Generated Videos}, author={Chen, Zijian and Sun, Wei and Tian, Yuan and Jia, Jun and Zhang, Zicheng and Wang, Jiarui and Huang, Ru and Min, Xiongkuo and Zhai, Guangtao and Zhang, Wenjun}, journal={arXiv preprint arXiv:2406.06087}, year={2024} }

搜集汇总

数据集介绍

构建方式

在GAIA数据集的构建过程中，研究团队采用了一种基于因果推理三段论的新颖视角来收集注释。具体而言，将动作过程分解为三个部分：动作主体作为大前提、动作完整性作为小前提、动作与场景的互动作为结论。这种策略的合理性在于，动作主体的视觉显著性信息对动作的可见性有深远影响，而人类在感知这些生成的人工制品方面表现出色。此外，这种三段论的顺序与人类的推理过程自然契合。最终，研究团队收集了971,244个评分，涵盖了9,180个视频-动作对。

特点

GAIA数据集的显著特点在于其注释的精细度和全面性。通过采用因果推理三段论的方法，数据集不仅涵盖了动作主体、动作完整性和动作与场景互动的多个维度，还确保了这些维度的评分与人类感知和推理过程的高度一致性。此外，数据集包含了9,180个视频，涵盖了多种动作类别，为研究AI生成视频的动作质量评估提供了丰富的资源。

使用方法

GAIA数据集的使用方法相对直观。用户可以通过提供的链接（OneDrive或百度网盘）下载数据集，视频文件按照模型名称和动作关键词命名，便于检索。数据集中的MOS.csv文件提供了每个视频在动作主体、动作完整性和动作与场景互动三个维度的评分。用户可以根据这些评分进行模型评估和算法开发，特别是在AI生成视频的动作质量评估领域。

背景与挑战

背景概述

GAIA数据集由上海交通大学和华东理工大学的研究团队于2024年创建，旨在解决AI生成视频中动作质量评估的难题。该数据集的核心研究问题是如何从动作主体、动作完整性和动作与场景的交互三个维度，全面评估AI生成视频的动作质量。这一研究不仅填补了现有动作质量评估（AQA）方法在AI生成视频领域的空白，还为提升AI视频生成技术的质量提供了重要参考。

当前挑战

GAIA数据集在构建过程中面临多项挑战。首先，如何从因果推理的三段论视角，准确分解和评估动作过程的各个维度，是一个复杂且新颖的问题。其次，现有AQA研究主要集中在真实视频的特定领域动作上，而GAIA需要处理AI生成视频中的广泛动作类别，这增加了评估的难度。此外，数据集的构建涉及大量视频和评分数据的收集与处理，确保数据质量和一致性也是一大挑战。

常用场景

经典使用场景

在人工智能生成的视频领域，GAIA数据集的经典使用场景主要集中在动作质量评估（AQA）上。该数据集通过收集9,180个视频和971,244个评分，提供了对AI生成视频中动作质量的全面评估。研究者可以利用这些数据来训练和验证模型，以评估和提升AI生成视频中的动作表现，从而提高视频的整体质量和用户体验。

衍生相关工作

GAIA数据集的发布催生了一系列相关研究和工作。例如，有研究者基于GAIA数据集开发了新的动作质量评估模型，显著提升了评估的准确性和效率。此外，还有研究探讨了如何将GAIA数据集中的评估方法应用于其他类型的视频生成任务，如虚拟现实和增强现实中的动作生成。这些工作不仅扩展了GAIA数据集的应用范围，也为相关领域的研究提供了新的思路和方法。

数据集最近研究