five

SPORTU|体育分析数据集|多模态推理数据集

收藏
arXiv2024-10-11 更新2024-10-15 收录
体育分析
多模态推理
下载链接:
https://github.com/haotianxia/SPORTU
下载链接
链接失效反馈
资源简介:
SPORTU是一个综合性的体育理解基准数据集,由加州大学欧文分校等机构创建,旨在评估多模态大语言模型在体育领域的推理能力。数据集包含两个部分:SPORTU-text和SPORTU-video。SPORTU-text包含900个多选题,涵盖规则理解和策略分析,通过文本问答测试模型的推理能力;SPORTU-video则包含1,701个慢动作视频片段和12,048个问答对,评估从简单的体育识别到复杂的犯规检测和规则应用的多层次推理。数据集的创建过程包括人工注释和多角度视频采集,旨在解决体育分析和应用中的复杂推理问题。
提供机构:
加州大学欧文分校
创建时间:
2024-10-11
AI搜集汇总
数据集介绍
main_image_url
构建方式
SPORTU数据集通过整合文本和视频两种模态,构建了一个全面的体育理解基准。SPORTU-text部分包含900个多选题,每个问题都附有人工注释的解释,旨在测试模型对规则理解和策略分析的能力。SPORTU-video部分则包含1,701个慢动作视频片段,涵盖7种不同的体育项目,并设计了12,048个问答对,分为简单、中等和困难三个难度级别,以评估模型在不同层次上的推理能力。
特点
SPORTU数据集的显著特点在于其多模态和多层次的设计。SPORTU-text部分通过详细的解释,确保了对模型推理过程的深入评估。SPORTU-video部分则利用慢动作视频,捕捉关键动作细节,特别是那些在实时镜头中容易被忽略的细微动作,从而更有效地评估模型的表现。此外,数据集还涵盖了多种体育项目,确保了评估的全面性和多样性。
使用方法
SPORTU数据集适用于评估多模态大语言模型在体育理解方面的能力。研究者可以使用SPORTU-text部分来测试模型对体育规则和策略的理解,通过多选题和详细的解释来分析模型的推理过程。SPORTU-video部分则可以用于评估模型在视频理解方面的能力,特别是对慢动作视频中复杂动作的识别和规则应用。通过结合文本和视频两种模态,SPORTU提供了一个全面的评估框架,帮助研究者深入了解模型在体育领域的理解和推理能力。
背景与挑战
背景概述
SPORTU数据集由加州大学欧文分校、加州大学圣巴巴拉分校、斯坦福大学和莱斯大学的研究人员于2024年创建,旨在评估多模态大语言模型(MLLMs)在复杂体育场景中的推理能力。该数据集包含两个主要部分:SPORTU-text和SPORTU-video。SPORTU-text包含900个多选题,旨在测试模型通过问答形式对体育规则和策略的理解,而SPORTU-video则包含1,701个慢动作视频片段和12,048个问答对,用于评估模型在视频中的多层次推理能力。SPORTU的引入填补了现有体育问答数据集的空白,为MLLMs在体育理解和推理方面的能力提供了全面的评估。
当前挑战
SPORTU数据集面临的挑战主要集中在两个方面:一是解决领域问题的挑战,即如何有效地评估模型在体育理解和推理中的能力;二是构建过程中遇到的挑战,包括如何确保视频和文本数据的高质量和一致性。具体挑战包括:1) 现有体育问答数据集在评估模型深度推理和规则理解方面的不足;2) 视频数据的多角度和慢动作特性增加了模型理解和推理的难度;3) 需要开发新的评估方法来准确衡量模型在复杂体育场景中的表现。这些挑战要求研究人员在数据集构建和模型评估方法上进行创新。
常用场景
经典使用场景
SPORTU数据集的经典使用场景在于评估多模态大语言模型(MLLMs)在体育理解任务中的表现。通过整合文本和视频数据,SPORTU-text部分通过900道多选题测试模型对规则、策略和场景的理解能力,而SPORTU-video部分则通过1,701段慢动作视频和12,048对问答对,评估模型在识别运动、检测犯规和应用规则等复杂任务中的表现。
解决学术问题
SPORTU数据集解决了现有体育问答数据集在全面评估模型体育理解能力方面的不足。它不仅涵盖了文本和视频两种模态,还通过多层次的难度设计,从简单的运动识别到复杂的规则应用,全面评估模型的深度推理能力。这为学术界提供了一个标准化的基准,有助于推动多模态大语言模型在体育领域的研究和应用。
衍生相关工作
SPORTU数据集的发布催生了多项相关研究工作,特别是在多模态体育分析和理解领域。例如,基于SPORTU的评估结果,研究者们提出了改进模型推理能力和规则理解的新方法。此外,SPORTU还激发了对多角度视频输入处理的研究,以提高模型在不同视角下的理解和判断一致性。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

中国交通事故深度调查(CIDAS)数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心 收录

中国气象数据

本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。

github 收录

AISHELL/AISHELL-1

Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。

hugging_face 收录

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录