five

Billiards Sports Dataset|台球运动数据集|数据分析数据集

收藏
arXiv2024-07-29 更新2024-07-31 收录
台球运动
数据分析
下载链接:
https://drive.google.com/drive/folders/1NBqonYLr_cParMMn4xSeE0KTJNhjeYuG?usp=sharing
下载链接
链接失效反馈
资源简介:
本数据集名为Billiards Sports Dataset,由香港大学和南洋理工大学创建,专注于收集和分析台球运动的数据。数据集包含3,019条比赛框架记录,6,637条回合记录和2,082条击球记录,来源于过去二十年内的94个国际职业9球锦标赛。数据集的创建旨在通过分析击球布局、轨迹和详细统计数据,支持台球运动的战术发现、相似比赛检索和性能研究等任务。该数据集的应用领域广泛,包括机器学习、数据挖掘、计算几何、计算机视觉和体育科学,旨在通过数据分析提升台球运动的竞技水平和观赏性。
提供机构:
香港大学,南洋理工大学
创建时间:
2024-07-29
AI搜集汇总
数据集介绍
main_image_url
构建方式
本数据集的构建方式主要涉及从9球比赛中收集数据,包括开球布局(即开球后台球的位置)、击球轨迹(以轨迹形式表示的击球痕迹)以及详细的统计数据和性能指标。这些数据是通过使用Kinovea软件从YouTube上过去二十年公开的专业台球比赛视频中提取的。数据集涵盖了94个国际职业9球锦标赛,涉及227名职业球员,共计3,019个局记录、6,637个轮记录和2,082个击球记录。
特点
Billiards Sports Dataset的特点在于它提供了丰富的布局数据,这些数据不仅包括台球的位置和身份,还包括与台球相关的上下文信息,如球袋的类型和位置。此外,数据集还包含了丰富的标签信息,如清台标签、胜利标签和连续入球数标签,这些标签信息可以支持各种机器学习任务,如布局预测、布局生成和相似布局检索。
使用方法
用户可以使用Billiards Sports Dataset进行台球运动分析,包括战术发现、相似游戏检索、性能研究等。例如,用户可以使用BLCNN模型进行开球布局预测,预测开球后是否会清台、是否能够赢得比赛以及连续入球的数量。此外,用户还可以使用BLGAN模型生成高质量的开球布局,这些布局不仅容易清台,而且与现实中的布局非常相似。最后,用户可以使用BL2Vec模型进行相似布局检索,找到与查询布局相似的布局,从而进行实时比赛结果预测、球员表现分析和历史布局参考。
背景与挑战
背景概述
在体育数据分析领域,利用GPS传感器和摄像头等设备捕捉体育比赛数据并进行分析已成为常态,例如篮球和足球等领域。然而,台球运动在这方面的研究相对较少,主要原因是缺乏公开可用的台球数据集。为了填补这一空白,研究人员收集了包含台球运动数据的“Billiards Sports Dataset”,该数据集包含了击球后的台球布局、击球轨迹和详细统计数据等信息。该数据集的创建旨在推动台球运动分析的发展,并支持诸如教练、球员和球迷等不同用户的需求。
当前挑战
该数据集的研究主要面临以下挑战:1) 台球布局预测的挑战,包括预测击球后是否清台、是否赢得比赛以及连续进球的数量;2) 台球布局生成的挑战,包括生成逼真且高质量的布局;3) 台球布局检索的挑战,包括如何有效地测量两个台球布局之间的相似性。此外,在构建过程中,研究人员还面临了数据采集、特征提取和模型训练等方面的挑战。
常用场景
经典使用场景
Billiards Sports Dataset 在台球运动分析中具有广泛应用。通过对台球布局、轨迹和统计数据的研究,该数据集可用于台球战术发现、相似游戏检索、表现研究等方面。教练、球员和球迷等不同用户可以通过该数据集更好地了解台球运动,从而提高比赛表现和观赏体验。
衍生相关工作
Billiards Sports Dataset 衍生了多项相关研究,如台球布局预测、台球布局生成和台球布局相似度检索等。这些研究为台球运动分析提供了新的方法和技术,推动了台球运动分析领域的发展。此外,该数据集还促进了机器学习、数据挖掘、计算几何、计算机视觉和体育科学等领域的交叉研究。
数据集最近研究
最新研究方向
在台球运动领域,最新的研究方向集中在使用先进的数据分析和机器学习技术来提升游戏体验和训练效率。Billiards Sports Dataset 为这一领域的研究提供了丰富的数据基础,包括击球布局、轨迹和详细的统计数据。研究人员利用这些数据开发了多种分析方法,如击球布局预测、生成和相似布局检索,以帮助教练、球员和球迷更好地理解游戏。例如,BLCNN 模型用于预测击球布局的结果,BLGAN 模型用于生成高质量的击球布局,而 BL2Vec 模型则用于检索相似的击球布局。这些研究成果不仅提升了台球数据分析的准确性和效率,还为台球运动领域带来了新的可能性,如个性化训练计划和实时比赛预测。
相关研究论文
  • 1
    Billiards Sports Analytics: Datasets and Tasks香港大学,南洋理工大学 · 2024年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

THUCNews

THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。

github 收录

Med-MAT

Med-MAT是一个包含106个开源医学数据集的视觉问答(VQA)数据集,旨在推动医学多模态大语言模型(MLLMs)的泛化实验和训练。数据集通过将图像-标签对转换为VQA格式,展示了组合泛化(CG)是MLLMs理解未见图像的关键机制。数据集包括106个医学数据集的问答对、53个按模态、解剖区域和任务(MAT)分类的子集的问答对,以及部分数据集的图像下载链接。

huggingface 收录

网易云音乐数据集

该数据集包含了网易云音乐平台上的歌手信息、歌曲信息和歌单信息,数据通过爬虫技术获取并整理成CSV格式,用于音乐数据挖掘和推荐系统构建。

github 收录

红外谱图数据库

收集整理红外谱图实验手册等数据,建成了红外谱图数据库。本数据库收录了常见化合物的红外谱图。主要包括化合物数据和对应的红外谱图数据。其中,原始红外谱图都进行了数字化处理,从而使谱峰检索成为可能。用户可以在数据库中检索指定化合物的谱图,也可以提交谱图/谱峰数据,以检索与之相似的谱图数据,以协助进行谱图鉴定。

国家基础学科公共科学数据中心 收录