WomenSports
收藏arXiv2025-07-15 更新2025-08-15 收录
下载链接:
https://data.mendeley.com/datasets/m39ymdv48s/3
下载链接
链接失效反馈官方服务:
资源简介:
WomenSports数据集是一个包含女性体育动作分类的图像数据集,共包含50个类别。该数据集旨在解决现有数据集中女性体育动作图像数据不足的问题,为小规模训练数据下的机器学习技术提供支持。数据集涵盖了多种体育活动,运动、环境和运动员之间的互动具有广泛的变化。此外,该研究还提出了一种卷积神经网络(CNN)用于深度特征提取,并应用了通道注意力机制来提高特征表示。该数据集适用于体育工程、人工智能和数据分析和相关领域的研究。
The WomenSports dataset is an image dataset for women’s sports action classification, comprising 50 distinct categories. This dataset aims to address the shortage of women’s sports action image data in existing datasets, and provides support for machine learning techniques trained on limited-scale training datasets. The dataset covers a wide range of sports activities, with extensive variations in the interactions between sports, environments and athletes. In addition, this study proposes a convolutional neural network (CNN) for deep feature extraction, and applies channel attention mechanism to enhance feature representation. This dataset is suitable for research in sports engineering, artificial intelligence, data analysis and other related fields.
提供机构:
印度哈尔迪亚理工学院计算机科学与工程学院, 印度比拉尼校园计算机科学与信息系统系
创建时间:
2025-07-15
搜集汇总
数据集介绍

构建方式
WomenSports数据集的构建过程充分体现了科学性与严谨性。研究团队从多个权威来源系统采集数据,包括知名体育赛事网站、专业图片库和公开摄影档案。为确保数据的代表性和多样性,研究人员精心筛选了50个体育类别,涵盖篮球、足球、网球等主流运动以及击剑等小众项目。在标注环节,由三位兼具体育专业背景和图像处理经验的领域专家组成团队,采用独立标注-交叉验证的工作流程,通过共识机制解决标注分歧,确保标签的准确性和一致性。数据清洗阶段严格执行质量控制标准,剔除了重复、低质量或存在歧义的图像样本。
特点
该数据集的核心价值在于其独特的专业属性和技术特点。作为目前首个专注于女性运动员运动动作的大规模图像数据集,WomenSports包含33,504张高质量图像,覆盖50个精细分类的体育类别。数据分布采用创新的5%-5%-90%划分策略(训练-验证-测试),专门针对小样本学习场景设计。数据集呈现出显著的内外部多样性:在类间差异方面,不同运动项目的视觉特征区分明显;在类内变化方面,同类动作捕捉了不同环境、光照条件和运动阶段的变化。所有图像均经过标准化处理,确保符合计算机视觉任务的输入要求,同时保留了真实场景的复杂背景和动态特征。
使用方法
该数据集支持多种计算机视觉任务的基准测试和研究探索。在使用ResNet-50等预训练CNN架构时,建议采用论文提出的区域池化与通道注意力融合框架,通过划分四个非重叠区域并施加通道注意力机制来提升特征表示能力。实验表明,结合高斯模糊和随机翻转等数据增强技术能有效提升模型在小样本条件下的泛化性能。评估协议推荐采用分层抽样确保类别平衡,使用top-1准确率、top-3准确率和F1分数等多维度指标进行综合评估。对于迁移学习应用,可从Mendeley数据仓库获取标准化后的数据集版本,并建议使用256×256输入分辨率配合224×224随机裁剪进行预处理。
背景与挑战
背景概述
WomenSports数据集由Palash Ray、Mahuya Sasmal和Asish Bera等研究人员于2025年创建,旨在解决女性体育运动动作分类中数据不足的问题。该数据集包含50个类别的女性体育运动动作图像,涵盖了从篮球、足球到击剑等多种运动项目。研究团队来自印度哈尔迪亚理工学院和比拉理工学院,他们通过收集公开网站和开源数据集中的图像,构建了这一专门针对女性运动员的数据集。WomenSports的发布填补了现有数据集中女性运动动作代表性不足的空白,为计算机视觉和深度学习在体育分析领域的应用提供了重要资源。
当前挑战
WomenSports数据集面临的挑战主要包括两个方面:领域问题的挑战和构建过程中的挑战。在领域问题方面,该数据集旨在解决女性体育运动动作分类任务,但由于运动动作的复杂性和多样性,如何准确捕捉和分类细微的动作差异成为一大挑战。此外,不同运动项目之间的类内差异(如同一运动的不同动作)和类间相似性(如不同运动的相似姿势)也增加了分类难度。在构建过程中,研究人员需要处理数据来源的多样性、图像质量的参差不齐以及标注的一致性等问题。特别是针对女性运动员的数据稀缺性,使得数据收集和标注工作更具挑战性。
常用场景
经典使用场景
在计算机视觉和体育工程领域,WomenSports数据集被广泛应用于女性运动员动作的视觉分类研究。该数据集通过捕捉50种不同体育项目中的动态动作,为深度学习模型提供了丰富的训练样本。特别是在小规模训练数据的场景下,该数据集通过其多样化的动作变化和环境背景,成为评估算法鲁棒性和泛化能力的理想选择。
实际应用
该数据集的实际应用涵盖体育训练分析、自动化裁判系统和实时动作监测工具开发。教练团队可利用其进行运动员动作优化分析,体育组织则基于此开发自动识别技术,如比赛中的违规动作检测。此外,在虚拟现实体育训练和智能体育装备研发中,该数据集的动作分类能力也展现出重要价值。
衍生相关工作
围绕WomenSports数据集已衍生出多项经典研究,包括基于区域池化和通道注意力的深度特征融合方法、小样本学习在体育动作识别中的适应性研究等。相关成果进一步推动了SYD-Net等细粒度动作识别框架的发展,并为跨域动作分析(如舞蹈姿势识别)提供了迁移学习基础。
以上内容由遇见数据集搜集并总结生成



