five

GAIA

收藏
github2024-05-27 更新2024-05-31 收录
下载链接:
https://github.com/zijianchen98/GAIA
下载链接
链接失效反馈
官方服务:
资源简介:
一个通用的AI生成动作数据集

A general-purpose AI-generated motion dataset
创建时间:
2024-05-27
原始信息汇总

GAIA数据集概述

数据集名称

  • GAIA: Rethinking Action Quality Assessment for AI-Generated Videos

数据集目的

  • 评估动作质量对AI生成视频质量的影响。
  • 从因果推理三段论的新视角收集注释,将动作过程分解为动作主体、动作完整性和动作-场景交互三个部分。

数据集内容

  • 视频数量: 9,180个视频
  • 视频命名规则: (model name)_(action keyword).mp4
  • 附加文件: MOS.csv,包含每个视频的最终动作主体、完整性和交互的评分。

数据集结构

GAIA |-- videos | |-- Anmidiff_Abseiling.mp4 | |-- Anmidiff_Admiration.mp4 | |-- ... | |-- zeroScope_Zumba.mp4 |-- MOS.csv

数据集构建方法

  • 采用因果推理三段论方法,分解动作过程为三个部分,并收集了971,244个评分。

数据集评估

  • 评估了18种流行的文本到视频(T2V)模型在生成视觉合理动作方面的能力。
  • 模型比较包括开源实验室研究和大规模商业应用。

数据集下载

联系信息

  • 第一作者: Zijian Chen, zijian.chen@sjtu.edu.cn

引用信息

@article{chen2024gaia, title={GAIA: Rethinking Action Quality Assessment for AI-Generated Videos}, author={Chen, Zijian and Sun, Wei and Tian, Yuan and Jia, Jun and Zhang, Zicheng and Wang, Jiarui and Huang, Ru and Min, Xiongkuo and Zhai, Guangtao and Zhang, Wenjun}, journal={arXiv preprint arXiv:2406.06087}, year={2024} }

搜集汇总
数据集介绍
main_image_url
构建方式
在GAIA数据集的构建过程中,研究团队采用了一种基于因果推理三段论的新颖视角来收集注释。具体而言,将动作过程分解为三个部分:动作主体作为大前提、动作完整性作为小前提、动作与场景的互动作为结论。这种策略的合理性在于,动作主体的视觉显著性信息对动作的可见性有深远影响,而人类在感知这些生成的人工制品方面表现出色。此外,这种三段论的顺序与人类的推理过程自然契合。最终,研究团队收集了971,244个评分,涵盖了9,180个视频-动作对。
特点
GAIA数据集的显著特点在于其注释的精细度和全面性。通过采用因果推理三段论的方法,数据集不仅涵盖了动作主体、动作完整性和动作与场景互动的多个维度,还确保了这些维度的评分与人类感知和推理过程的高度一致性。此外,数据集包含了9,180个视频,涵盖了多种动作类别,为研究AI生成视频的动作质量评估提供了丰富的资源。
使用方法
GAIA数据集的使用方法相对直观。用户可以通过提供的链接(OneDrive或百度网盘)下载数据集,视频文件按照模型名称和动作关键词命名,便于检索。数据集中的MOS.csv文件提供了每个视频在动作主体、动作完整性和动作与场景互动三个维度的评分。用户可以根据这些评分进行模型评估和算法开发,特别是在AI生成视频的动作质量评估领域。
背景与挑战
背景概述
GAIA数据集由上海交通大学和华东理工大学的研究团队于2024年创建,旨在解决AI生成视频中动作质量评估的难题。该数据集的核心研究问题是如何从动作主体、动作完整性和动作与场景的交互三个维度,全面评估AI生成视频的动作质量。这一研究不仅填补了现有动作质量评估(AQA)方法在AI生成视频领域的空白,还为提升AI视频生成技术的质量提供了重要参考。
当前挑战
GAIA数据集在构建过程中面临多项挑战。首先,如何从因果推理的三段论视角,准确分解和评估动作过程的各个维度,是一个复杂且新颖的问题。其次,现有AQA研究主要集中在真实视频的特定领域动作上,而GAIA需要处理AI生成视频中的广泛动作类别,这增加了评估的难度。此外,数据集的构建涉及大量视频和评分数据的收集与处理,确保数据质量和一致性也是一大挑战。
常用场景
经典使用场景
在人工智能生成的视频领域,GAIA数据集的经典使用场景主要集中在动作质量评估(AQA)上。该数据集通过收集9,180个视频和971,244个评分,提供了对AI生成视频中动作质量的全面评估。研究者可以利用这些数据来训练和验证模型,以评估和提升AI生成视频中的动作表现,从而提高视频的整体质量和用户体验。
衍生相关工作
GAIA数据集的发布催生了一系列相关研究和工作。例如,有研究者基于GAIA数据集开发了新的动作质量评估模型,显著提升了评估的准确性和效率。此外,还有研究探讨了如何将GAIA数据集中的评估方法应用于其他类型的视频生成任务,如虚拟现实和增强现实中的动作生成。这些工作不仅扩展了GAIA数据集的应用范围,也为相关领域的研究提供了新的思路和方法。
数据集最近研究
最新研究方向
在人工智能生成的视频领域,动作质量评估(AQA)的研究正逐步转向对AI生成视频的整体质量影响进行深入探讨。GAIA数据集的最新研究方向聚焦于从因果推理的三段论视角出发,将动作过程分解为动作主体、动作完整性和动作与场景的交互三个部分,以此为基础进行精细化的动作质量评估。这种研究方法不仅提升了评估的准确性,还为AI生成视频的质量控制提供了新的理论框架和实践指导。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作