Sports-QA|体育视频理解数据集|问答系统数据集

arXiv2024-02-15 更新2024-06-21 收录

体育视频理解

问答系统

下载链接：

https://github.com/HopLee6/Sports-QA

下载链接

链接失效反馈

资源简介：

Sports-QA数据集是专为体育视频问答任务设计的大型数据集，包含约94,000个问答对，涵盖多种体育项目。该数据集通过从MultiSports和FineGym数据集中提取高质量体育视频和专业动作标签构建而成。数据集中的问题类型多样，包括描述性、时间性、因果性和反事实条件问题，旨在评估模型对专业体育动作的理解和精细运动分析的能力。Sports-QA数据集不仅适用于视频问答任务，还可用于多标签分类和体育视频字幕生成等其他任务，为体育视频理解领域提供了全面的评估平台。

提供机构：

墨尔本大学计算与信息系统学院

创建时间：

2024-01-03

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

Breast Ultrasound Images (BUSI)

小型（约500×500像素）超声图像，适用于良性和恶性病变的分类和分割任务。

github 收录

VoxBox

VoxBox是一个大规模语音语料库，由多样化的开源数据集构建而成，用于训练文本到语音（TTS）系统。

github 收录

CosyVoice 2

CosyVoice 2是由阿里巴巴集团开发的多语言语音合成数据集，旨在通过大规模多语言数据集训练，实现高质量的流式语音合成。数据集通过有限标量量化技术改进语音令牌的利用率，并结合预训练的大型语言模型作为骨干，支持流式和非流式合成。数据集的创建过程包括文本令牌化、监督语义语音令牌化、统一文本-语音语言模型和块感知流匹配模型等步骤。该数据集主要应用于语音合成领域，旨在解决高延迟和低自然度的问题，提供接近人类水平的语音合成质量。

arXiv 收录

中亚主要国家的原油资源的储量、产量、消费量及其占世界比重（1985-2016）

中亚五国中，石油资源主要分布在哈萨克斯坦、乌兹别克斯坦、土库曼斯坦三个国家。根据BP世界能源统计年鉴，经整理、抽取、计算和汇总后，形成中亚主要国家（哈萨克斯坦、乌兹别克斯坦、土库曼斯坦）原油资源的储量、产量、消费量及其占世界比重的统计表。主要指标包括：（1）储量，1991-2016年，单位：百万吨（2）产量，1985-2016年，单位：百万吨（3）储产比，1991-2016年，单位：百万吨（4）消费量，1985-2016年，单位：百万吨（5）产消差额，1985-2016年，单位：百万吨此外，以上数据均包括中亚地区的哈萨克斯坦、乌兹别克斯坦、土库曼斯坦、三国汇总以及世界总量的情况。

地球大数据科学工程收录

OpenPose

OpenPose数据集包含人体姿态估计的相关数据，主要用于训练和评估人体姿态检测算法。数据集包括多视角的图像和视频，标注了人体关键点位置，适用于研究人体姿态识别和动作分析。

github.com 收录