five

SPORTU|体育分析数据集|多模态推理数据集

收藏
arXiv2024-10-11 更新2024-10-15 收录
体育分析
多模态推理
下载链接:
https://github.com/haotianxia/SPORTU
下载链接
链接失效反馈
资源简介:
SPORTU是一个综合性的体育理解基准数据集,由加州大学欧文分校等机构创建,旨在评估多模态大语言模型在体育领域的推理能力。数据集包含两个部分:SPORTU-text和SPORTU-video。SPORTU-text包含900个多选题,涵盖规则理解和策略分析,通过文本问答测试模型的推理能力;SPORTU-video则包含1,701个慢动作视频片段和12,048个问答对,评估从简单的体育识别到复杂的犯规检测和规则应用的多层次推理。数据集的创建过程包括人工注释和多角度视频采集,旨在解决体育分析和应用中的复杂推理问题。
提供机构:
加州大学欧文分校
创建时间:
2024-10-11
AI搜集汇总
数据集介绍
main_image_url
构建方式
SPORTU数据集通过整合文本和视频两种模态,构建了一个全面的体育理解基准。SPORTU-text部分包含900个多选题,每个问题都附有人工注释的解释,旨在测试模型对规则理解和策略分析的能力。SPORTU-video部分则包含1,701个慢动作视频片段,涵盖7种不同的体育项目,并设计了12,048个问答对,分为简单、中等和困难三个难度级别,以评估模型在不同层次上的推理能力。
特点
SPORTU数据集的显著特点在于其多模态和多层次的设计。SPORTU-text部分通过详细的解释,确保了对模型推理过程的深入评估。SPORTU-video部分则利用慢动作视频,捕捉关键动作细节,特别是那些在实时镜头中容易被忽略的细微动作,从而更有效地评估模型的表现。此外,数据集还涵盖了多种体育项目,确保了评估的全面性和多样性。
使用方法
SPORTU数据集适用于评估多模态大语言模型在体育理解方面的能力。研究者可以使用SPORTU-text部分来测试模型对体育规则和策略的理解,通过多选题和详细的解释来分析模型的推理过程。SPORTU-video部分则可以用于评估模型在视频理解方面的能力,特别是对慢动作视频中复杂动作的识别和规则应用。通过结合文本和视频两种模态,SPORTU提供了一个全面的评估框架,帮助研究者深入了解模型在体育领域的理解和推理能力。
背景与挑战
背景概述
SPORTU数据集由加州大学欧文分校、加州大学圣巴巴拉分校、斯坦福大学和莱斯大学的研究人员于2024年创建,旨在评估多模态大语言模型(MLLMs)在复杂体育场景中的推理能力。该数据集包含两个主要部分:SPORTU-text和SPORTU-video。SPORTU-text包含900个多选题,旨在测试模型通过问答形式对体育规则和策略的理解,而SPORTU-video则包含1,701个慢动作视频片段和12,048个问答对,用于评估模型在视频中的多层次推理能力。SPORTU的引入填补了现有体育问答数据集的空白,为MLLMs在体育理解和推理方面的能力提供了全面的评估。
当前挑战
SPORTU数据集面临的挑战主要集中在两个方面:一是解决领域问题的挑战,即如何有效地评估模型在体育理解和推理中的能力;二是构建过程中遇到的挑战,包括如何确保视频和文本数据的高质量和一致性。具体挑战包括:1) 现有体育问答数据集在评估模型深度推理和规则理解方面的不足;2) 视频数据的多角度和慢动作特性增加了模型理解和推理的难度;3) 需要开发新的评估方法来准确衡量模型在复杂体育场景中的表现。这些挑战要求研究人员在数据集构建和模型评估方法上进行创新。
常用场景
经典使用场景
SPORTU数据集的经典使用场景在于评估多模态大语言模型(MLLMs)在体育理解任务中的表现。通过整合文本和视频数据,SPORTU-text部分通过900道多选题测试模型对规则、策略和场景的理解能力,而SPORTU-video部分则通过1,701段慢动作视频和12,048对问答对,评估模型在识别运动、检测犯规和应用规则等复杂任务中的表现。
解决学术问题
SPORTU数据集解决了现有体育问答数据集在全面评估模型体育理解能力方面的不足。它不仅涵盖了文本和视频两种模态,还通过多层次的难度设计,从简单的运动识别到复杂的规则应用,全面评估模型的深度推理能力。这为学术界提供了一个标准化的基准,有助于推动多模态大语言模型在体育领域的研究和应用。
衍生相关工作
SPORTU数据集的发布催生了多项相关研究工作,特别是在多模态体育分析和理解领域。例如,基于SPORTU的评估结果,研究者们提出了改进模型推理能力和规则理解的新方法。此外,SPORTU还激发了对多角度视频输入处理的研究,以提高模型在不同视角下的理解和判断一致性。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

MultiTalk

MultiTalk数据集是由韩国科学技术院创建,包含超过420小时的2D视频,涵盖20种不同语言,旨在解决多语言环境下3D说话头生成的问题。该数据集通过自动化管道从YouTube收集,每段视频都配有语言标签和伪转录,部分视频还包含伪3D网格顶点。数据集的创建过程包括视频收集、主动说话者验证和正面人脸验证,确保数据质量。MultiTalk数据集的应用领域主要集中在提升多语言3D说话头生成的准确性和表现力,通过引入语言特定风格嵌入,使模型能够捕捉每种语言独特的嘴部运动。

arXiv 收录

VQA

我们提出了自由形式和开放式视觉问答 (VQA) 的任务。给定图像和关于图像的自然语言问题,任务是提供准确的自然语言答案。反映许多现实世界的场景,例如帮助视障人士,问题和答案都是开放式的。视觉问题有选择地针对图像的不同区域,包括背景细节和底层上下文。因此,与生成通用图像说明的系统相比,在 VQA 上取得成功的系统通常需要对图像和复杂推理有更详细的理解。此外,VQA 适合自动评估,因为许多开放式答案仅包含几个单词或一组封闭的答案,可以以多项选择的形式提供。我们提供了一个数据集包含 100,000 的图像和问题并讨论它提供的信息。提供了许多 VQA 基线,并与人类表现进行了比较。

OpenDataLab 收录

中亚主要国家的原油资源的储量、产量、消费量及其占世界比重(1985-2016)

中亚五国中,石油资源主要分布在哈萨克斯坦、乌兹别克斯坦、土库曼斯坦三个国家。根据BP世界能源统计年鉴,经整理、抽取、计算和汇总后,形成中亚主要国家(哈萨克斯坦、乌兹别克斯坦、土库曼斯坦)原油资源的储量、产量、消费量及其占世界比重的统计表。 主要指标包括: (1)储量,1991-2016年,单位:百万吨 (2)产量,1985-2016年,单位:百万吨 (3)储产比,1991-2016年,单位:百万吨 (4)消费量,1985-2016年,单位:百万吨 (5)产消差额,1985-2016年,单位:百万吨 此外,以上数据均包括中亚地区的哈萨克斯坦、乌兹别克斯坦、土库曼斯坦、三国汇总以及世界总量的情况。

地球大数据科学工程 收录

中国行政区划shp数据

   中国行政区划数据是重要的基础地理信息数据,目前不同来源的全国行政区划数据非常多,但能够开放获取的高质量行政区域数据少之又少。基于此,锐多宝的地理空间制作一套2013-2023年可开放获取的高质量行政区划数据。该套数据以2022年国家基础地理信息数据中的县区划数据作为矢量基础,辅以高德行政区划数据、天地图行政区划数据,参考历年来民政部公布的行政区划为属性基础,具有时间跨度长、属性丰富、国界准确、更新持续等特性。   中国行政区划数据统计截止时间是2023年2月12日,包含省、市、县、国界、九段线等矢量shp数据。该数据基于2020年行政区划底图,按时间顺序依次制作了2013-2023年初的行政区划数据。截止2023年1月1日,我国共有34个省级单位,分别是4个直辖市、23个省、5个自治区和2个特别行政区。截止2023年1月1日,我国共有333个地级单位,分别是293个地级市、7个地区、30个自治州和3个盟,其中38个矢量要素未纳入统计(比如直辖市北京等、特别行政区澳门等、省直辖县定安县等)。截止2023年1月1日,我国共有2843个县级单位,分别是1301个县、394个县级市、977个市辖区、117个自治县、49个旗、3个自治旗、1个特区和1个林区,其中9个矢量要素未纳入县级类别统计范畴(比如特别行政区香港、无县级单位的地级市中山市东莞市等)。

CnOpenData 收录

中国1km分辨率逐月NDVI数据集(2001-2023年)

中国1km分辨率逐月NDVI数据集(2001-2023年)根据MODIS MOD13A2数据进行月度最大值合成、镶嵌和裁剪后制作而成,包含多个TIF文件,每个TIF文件对应该月最大值NDVI数据,文件以时间命名。数据值域改为-0.2~1,不再需要除以一万,另外范围扩大到中国及周边地区,可以自行裁剪。数据分为两个文件夹,MVC文件夹中为MOD13A2 NDVI逐月最大值合成结果,mod1k_SGfilter为MVC中数据S-G滤波后的结果。

国家地球系统科学数据中心 收录