FineBadminton
收藏arXiv2025-08-11 更新2025-08-13 收录
下载链接:
https://finebadminton.github.io/FineBadminton/
下载链接
链接失效反馈官方服务:
资源简介:
FineBadminton是一个专门为羽毛球视频理解设计的细粒度数据集,包含了3215个回合剪辑和33325个击球。该数据集拥有独特的多层次语义标注层次结构,包括基础动作、战术语义和决策评估,为深入理解羽毛球比赛提供了前所未有的深度。数据集的创建过程采用了创新的多语言大语言模型驱动的自动化标注流程,结合了人工精炼,确保了高质量标注。数据集旨在解决当前视频分析在深度体育视频分析中的挑战,并促进细粒度视频理解和体育智能中多语言大语言模型的发展。
FineBadminton is a fine-grained dataset specifically designed for badminton video understanding, containing 3215 rally clips and 33325 shots. It features a unique multi-level semantic annotation hierarchy, including basic movements, tactical semantics, and decision-making evaluations, providing unprecedented depth for in-depth comprehension of badminton matches. The dataset was developed using an innovative multilingual large language model (LLM)-driven automated annotation pipeline combined with manual refinement to ensure high-quality annotations. This dataset aims to address current challenges in deep sports video analysis, and promote the development of fine-grained video understanding and multilingual large language models in sports intelligence.
提供机构:
哈尔滨工业大学深圳校区
创建时间:
2025-08-11
原始信息汇总
FineBadminton: 羽毛球视频多层级细粒度数据集
摘要
- FineBadminton是一个新颖的大规模数据集,专为全面理解羽毛球运动设计。
- 数据集特点:
- 独特的多层级语义标注体系(基础动作、战术语义和决策评估)
- 创新的标注流程:结合MLLM生成建议与人工优化
- 配套推出FBBench基准测试,用于严格评估MLLMs在时空推理和战术理解方面的能力
- 提出优化基线方法:
- 击球中心关键帧选择
- 坐标引导浓缩
数据集特点
- 多层级标注示例(图1):
- 单个回合中不同击球时刻的标注
- 包含三个层级:基础动作、战术语义、决策评估
- 标注流程(图2):
- 三阶段流程:结构解析→语义解释→评估优化
基准测试(FBBench)
- 基准结构(表1):
- 空间维度
- 时间维度
- 持续时间
- 数量
- 任务类别:
- 计数
- 动作
- 位置
- 认知
技术规格
- 视频示例:
- 文件名:0011_001.mp4
- 分辨率:1280x720
- 帧率:25.0fps
- 总帧数:327帧
- 持续时间:13.08秒
数据集比较优势
- 具有层次化标注(HA)
- 包含细粒度标签(FGL)
- 支持动作质量评估(AQA)
搜集汇总
数据集介绍

构建方式
FineBadminton数据集通过多阶段流程构建,首先从羽毛球世界联合会(BWF)官方发布的专业比赛视频中精选素材,确保分辨率和帧率的一致性。随后采用创新的多级语义标注方案,包括基础动作、战术语义和决策评估三个层次,结合MLLM驱动的自动化标注流程与人工专家校验,确保标注的精细度和专业性。标注过程中还设计了定制化的GUI工具,并实施严格的质量控制协议,以保障数据的高质量和一致性。
特点
FineBadminton数据集以其多层次的语义标注体系脱颖而出,涵盖基础动作的11类主分类和20个子分类,战术语义的轨迹动态与球员意图分析,以及决策评估的专家评分和文本描述。该数据集包含3,215个回合片段和33,325次击球,平均每回合持续12.4秒,并辅以详尽的自由文本描述,为羽毛球视频的细粒度分析提供了前所未有的深度和广度。其独特的层级结构不仅支持动作识别,还能解读战术意义并评估其对比赛的影响。
使用方法
该数据集适用于多模态大语言模型(MLLMs)在细粒度视频理解任务中的训练与评估。用户可通过FBBench基准测试系统评估模型在计数、动作识别、位置推理和战术认知等任务上的表现。数据集支持两种使用方式:直接利用其层级标注进行模型微调,或通过提出的优化基线策略(如击球中心关键帧选择和坐标引导信息浓缩)提升模型效率。开放式的问答任务设计还允许研究者探索模型在战术分析和决策评估方面的生成能力。
背景与挑战
背景概述
FineBadminton数据集由哈尔滨工业大学(深圳)、山东大学和中国电子技术标准化研究院的研究团队于2025年联合发布,旨在解决多模态大语言模型(MLLMs)在高速复杂运动场景中细粒度视频理解的瓶颈问题。作为首个融合多层级语义标注(基础动作、战术语义、决策评估)的羽毛球专业数据集,其创新性地采用MLLM驱动的人工协同标注流程,覆盖3215个比赛回合和33325次击球动作,填补了现有羽毛球数据集在战术意图分析和执行质量评估方面的空白。该数据集通过BWF官方赛事视频构建,以720P以上分辨率及25FPS帧率标准,为体育视频分析领域提供了兼具时空细粒度和领域专业性的新基准。
当前挑战
FineBadminton需应对双重挑战:在领域问题层面,羽毛球运动的瞬时击球变化(如跳杀与劈杀的动作差异)和战术动态性(如对角线调动与假动作意图识别)要求模型具备亚秒级时空推理能力;在构建层面,高密度事件标注(单回合平均12.4秒含10.4次击球)导致人工标注成本激增,为此团队开发了基于VideoMAE的击球检测模块与轨迹追踪算法,并通过专家验证的20类击球子标签体系解决动作歧义问题。此外,决策评估层需平衡主观判断(如击球质量星级评分)与客观事实标注,采用双人独立标注-仲裁修正机制确保评估一致性。
常用场景
经典使用场景
FineBadminton数据集作为首个多层级语义标注的羽毛球视频分析资源,其经典应用场景聚焦于多模态大语言模型(MLLMs)在高速运动中的细粒度理解。通过融合基础动作分类(如跳杀与滑板吊球的区分)、战术语义解析(如识别交叉球路欺骗性击球)及决策评估(专家级击球质量评分),该数据集为研究者提供了从微观技术动作到宏观战术演进的完整分析链条,尤其适用于需要时空推理与领域知识结合的复杂场景。
实际应用
在实际应用层面,FineBadminton已赋能职业羽毛球训练的智能化转型。教练团队可利用其战术语义标注构建对抗策略分析系统,通过解析选手击球轨迹与意图的关联性,生成针对性训练方案。赛事解说领域则基于决策评估层的质量评分与文本描述,开发了自动生成技术要点分析的AI辅助工具。此外,体育科技公司正将其应用于实时比赛数据可视化,为观众提供击球质量星级、战术路径热力图等深度观赛体验。
衍生相关工作
该数据集衍生出两类标志性研究:其一为基于命中关键帧选择(Hit-Centric Keyframe Selection)的模型优化方法,如Qwen2.5VL-7B通过该策略在FBBench上实现42.06%准确率,超越商业模型;其二为跨模态推理框架的创新,例如VideoLLaMA3结合坐标引导浓缩(Coordinate-Guided Condensation)开发的时空注意力机制,显著提升了长回合战术连贯性分析能力。这些工作共同构成了体育视频理解领域的新范式。
以上内容由遇见数据集搜集并总结生成



