five

SportsMoments

收藏
arXiv2025-08-21 更新2025-11-25 收录
下载链接:
https://github.com/vl2g/MATR/tree/main/sportsmoments
下载链接
链接失效反馈
官方服务:
资源简介:
SportsMoments数据集由印度理工学院焦特布尔分校的研究人员创建,旨在为视频到视频时刻检索(Vid2VidMR)任务提供基准数据。数据集涵盖了足球和板球两种最受欢迎的体育运动,包含一系列视频片段,这些片段经过精心挑选,能够代表体育运动中的关键时刻。数据集的创建过程涉及从大量的体育视频中提取出具有代表性的片段,并对这些片段进行标注,以提供准确的时刻定位信息。SportsMoments数据集的应用领域包括体育视频分析、教育内容创作和电子学习、监控系统等,旨在帮助研究人员开发更精确的视频时刻检索模型,从而解决实际问题。

SportsMoments Dataset was created by researchers at the Indian Institute of Technology Jodhpur, aiming to provide a benchmark dataset for the video-to-video moment retrieval (Vid2VidMR) task. The dataset covers two of the most popular sports, football and cricket, and contains a series of carefully curated video clips that represent key moments in sports. The development process of the SportsMoments Dataset involves extracting representative segments from a large volume of sports videos and annotating these segments to deliver accurate moment localization information. Application scenarios of the SportsMoments Dataset include sports video analysis, educational content creation and e-learning, surveillance systems, among others. It is intended to assist researchers in developing more precise video moment retrieval models to solve real-world problems.
提供机构:
印度理工学院焦特布尔分校
创建时间:
2025-08-21
搜集汇总
数据集介绍
main_image_url
构建方式
SportsMoments数据集聚焦于体育视频分析领域,通过系统化采集与标注构建而成。研究团队从公开平台获取了80场完整的足球和板球比赛视频,总时长约176.6小时,并由具备专业体育知识的标注者根据29个预定义动作类别(包括13个足球动作和16个板球动作)进行精细标注。标注过程中采用双人独立标注机制,确保时间戳标注的准确性,最终形成约77万对查询-目标视频样本,并按照动作类别将数据集划分为训练、验证和测试三个互斥子集。
特点
该数据集的核心特点体现在其领域专业性与结构创新性。作为首个专注于细粒度体育动作的跨视频检索数据集,它涵盖了足球和板球运动中诸如‘倒钩射门’‘闪避弹跳球’等专业动作,突破了传统数据集仅标注宏观动作类别的局限。数据划分采用类别不相交策略,有效避免了动作类别的跨集重叠,为模型泛化能力评估提供了可靠基准。此外,数据集构建充分考虑了视频模态的时序特性,通过原始比赛视频的完整保留,确保了动作上下文信息的完整性。
使用方法
该数据集主要用于视频到视频时刻检索任务的模型训练与评估。研究者可将查询视频与目标视频输入模型,通过时序对齐机制定位语义匹配的片段。典型使用流程包括:利用训练集学习视频间时序关联特征,在验证集调整模型超参数,最终在测试集评估模型定位精度。评估指标采用交并比均值与召回率等标准度量,模型需输出目标视频中与查询视频语义对应的起止时间戳。数据集配套提供标准化数据加载接口,支持端到端训练流程的快速实现。
背景与挑战
背景概述
SportsMoments数据集于2025年由印度理工学院焦特布尔分校与微软研究院联合推出,聚焦于视频间时刻检索任务。该数据集旨在解决体育视频分析中复杂动作的细粒度定位问题,涵盖足球和板球两大运动领域,包含29类精细动作标注。其构建基于176.6小时完整比赛视频,通过专业标注人员标记时序边界,填补了现有数据集在体育领域高粒度事件表征的空白,为视频理解研究提供了重要基准。
当前挑战
该数据集核心挑战在于视频间语义对齐的复杂性,需解决跨视频帧级语义匹配与时序依赖建模难题。构建过程中面临体育动作时空动态性强、类内差异显著等困难,同时需确保标注质量与类间判别性。技术层面需克服长视频序列处理效率与多模态特征融合的优化问题,这些因素共同构成了数据集应用与扩展的关键瓶颈。
常用场景
经典使用场景
在体育视频分析领域,SportsMoments数据集为视频到视频时刻检索任务提供了关键支持,通过捕捉足球和板球等运动中的精细动作片段,如'倒钩射门'或'盖帽击球',使得模型能够基于查询视频在目标视频中准确定位语义匹配的瞬间。该数据集包含约77万对查询-目标视频对,覆盖29个动作类别,为研究复杂动作的时序对齐问题奠定了坚实基础。
实际应用
该数据集在体育训练和赛事分析中具有重要应用价值,教练员可通过展示标准动作视频片段,快速检索运动员训练视频中的对应时刻以进行技术校正。在智能视频编辑领域,系统能自动识别并剪辑比赛中的精彩瞬间,如进球或犯规场景。此外,在安防监控中,该技术可用于跨摄像头追踪特定行为模式,提升异常事件检测效率。
衍生相关工作
基于SportsMoments数据集,研究者开发了MATR等创新模型,其双阶段对齐机制和自监督预训练策略为视频时序分析开辟了新方向。该数据集还促进了文本-视频检索方法的跨模态适配研究,如UniVTG和QD-DETR等模型的视频查询变体。后续工作进一步探索了多模态查询融合和长视频理解等延伸课题,持续推动着时序定位技术的前沿发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作