SPORTU

Name: SPORTU
Creator: 加州大学欧文分校
Published: 2024-10-11 10:58:38
License: 暂无描述

arXiv2024-10-11 更新2024-10-15 收录

下载链接：

https://github.com/haotianxia/SPORTU

下载链接

链接失效反馈

官方服务：

资源简介：

SPORTU是一个综合性的体育理解基准数据集，由加州大学欧文分校等机构创建，旨在评估多模态大语言模型在体育领域的推理能力。数据集包含两个部分：SPORTU-text和SPORTU-video。SPORTU-text包含900个多选题，涵盖规则理解和策略分析，通过文本问答测试模型的推理能力；SPORTU-video则包含1,701个慢动作视频片段和12,048个问答对，评估从简单的体育识别到复杂的犯规检测和规则应用的多层次推理。数据集的创建过程包括人工注释和多角度视频采集，旨在解决体育分析和应用中的复杂推理问题。

SPORTU is a comprehensive sports understanding benchmark dataset created by institutions including the University of California, Irvine, aiming to evaluate the reasoning capabilities of multimodal large language models in the sports domain. The dataset consists of two components: SPORTU-text and SPORTU-video. SPORTU-text contains 900 multiple-choice questions covering rule comprehension and strategy analysis, which tests the model's reasoning ability through text-based question answering. SPORTU-video, on the other hand, includes 1,701 slow-motion video clips and 12,048 question-answer pairs, evaluating multi-level reasoning ranging from simple sports recognition to complex foul detection and rule application. The dataset's creation process involves manual annotation and multi-angle video collection, aiming to address complex reasoning challenges in sports analysis and applications.

提供机构：

加州大学欧文分校

创建时间：

2024-10-11

搜集汇总

数据集介绍

构建方式

SPORTU数据集通过整合文本和视频两种模态，构建了一个全面的体育理解基准。SPORTU-text部分包含900个多选题，每个问题都附有人工注释的解释，旨在测试模型对规则理解和策略分析的能力。SPORTU-video部分则包含1,701个慢动作视频片段，涵盖7种不同的体育项目，并设计了12,048个问答对，分为简单、中等和困难三个难度级别，以评估模型在不同层次上的推理能力。

特点

SPORTU数据集的显著特点在于其多模态和多层次的设计。SPORTU-text部分通过详细的解释，确保了对模型推理过程的深入评估。SPORTU-video部分则利用慢动作视频，捕捉关键动作细节，特别是那些在实时镜头中容易被忽略的细微动作，从而更有效地评估模型的表现。此外，数据集还涵盖了多种体育项目，确保了评估的全面性和多样性。

使用方法

SPORTU数据集适用于评估多模态大语言模型在体育理解方面的能力。研究者可以使用SPORTU-text部分来测试模型对体育规则和策略的理解，通过多选题和详细的解释来分析模型的推理过程。SPORTU-video部分则可以用于评估模型在视频理解方面的能力，特别是对慢动作视频中复杂动作的识别和规则应用。通过结合文本和视频两种模态，SPORTU提供了一个全面的评估框架，帮助研究者深入了解模型在体育领域的理解和推理能力。

背景与挑战

背景概述

SPORTU数据集由加州大学欧文分校、加州大学圣巴巴拉分校、斯坦福大学和莱斯大学的研究人员于2024年创建，旨在评估多模态大语言模型（MLLMs）在复杂体育场景中的推理能力。该数据集包含两个主要部分：SPORTU-text和SPORTU-video。SPORTU-text包含900个多选题，旨在测试模型通过问答形式对体育规则和策略的理解，而SPORTU-video则包含1,701个慢动作视频片段和12,048个问答对，用于评估模型在视频中的多层次推理能力。SPORTU的引入填补了现有体育问答数据集的空白，为MLLMs在体育理解和推理方面的能力提供了全面的评估。

当前挑战

SPORTU数据集面临的挑战主要集中在两个方面：一是解决领域问题的挑战，即如何有效地评估模型在体育理解和推理中的能力；二是构建过程中遇到的挑战，包括如何确保视频和文本数据的高质量和一致性。具体挑战包括：1) 现有体育问答数据集在评估模型深度推理和规则理解方面的不足；2) 视频数据的多角度和慢动作特性增加了模型理解和推理的难度；3) 需要开发新的评估方法来准确衡量模型在复杂体育场景中的表现。这些挑战要求研究人员在数据集构建和模型评估方法上进行创新。

常用场景

经典使用场景

SPORTU数据集的经典使用场景在于评估多模态大语言模型（MLLMs）在体育理解任务中的表现。通过整合文本和视频数据，SPORTU-text部分通过900道多选题测试模型对规则、策略和场景的理解能力，而SPORTU-video部分则通过1,701段慢动作视频和12,048对问答对，评估模型在识别运动、检测犯规和应用规则等复杂任务中的表现。

解决学术问题

SPORTU数据集解决了现有体育问答数据集在全面评估模型体育理解能力方面的不足。它不仅涵盖了文本和视频两种模态，还通过多层次的难度设计，从简单的运动识别到复杂的规则应用，全面评估模型的深度推理能力。这为学术界提供了一个标准化的基准，有助于推动多模态大语言模型在体育领域的研究和应用。

衍生相关工作

SPORTU数据集的发布催生了多项相关研究工作，特别是在多模态体育分析和理解领域。例如，基于SPORTU的评估结果，研究者们提出了改进模型推理能力和规则理解的新方法。此外，SPORTU还激发了对多角度视频输入处理的研究，以提高模型在不同视角下的理解和判断一致性。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集