hbfreed/Picklebot-130K
收藏Hugging Face2024-05-01 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/hbfreed/Picklebot-130K
下载链接
链接失效反馈官方服务:
资源简介:
Picklebot130k数据集包含大约130千个来自2016年至2023年MLB比赛中的球和击球的视频剪辑,这些视频以.mp4格式存储,并调整为224x224分辨率。数据集由Henry Freed整理,采用MIT许可证。数据集主要用于通过神经网络判断球和击球,但也可能需要重新标记以用于其他用途。数据集的结构包括所有视频的.tar.xz文件和三个包含标签的.csv文件(训练、验证、测试)。数据来源于Baseball Savant的Statcast Search,并经过裁剪和降采样处理。
Picklebot130k数据集包含大约130千个来自2016年至2023年MLB比赛中的球和击球的视频剪辑,这些视频以.mp4格式存储,并调整为224x224分辨率。数据集由Henry Freed整理,采用MIT许可证。数据集主要用于通过神经网络判断球和击球,但也可能需要重新标记以用于其他用途。数据集的结构包括所有视频的.tar.xz文件和三个包含标签的.csv文件(训练、验证、测试)。数据来源于Baseball Savant的Statcast Search,并经过裁剪和降采样处理。
提供机构:
hbfreed
原始信息汇总
数据集概述
基本信息
- 名称: Picklebot130k
- 类型: 视频分类
- 标签: 棒球, 体育, 视频分类, 计算机视觉
- 大小: 100K<n<1M
- 许可证: MIT
- 创建者: Henry Freed
数据集描述
- 内容: 包含130,000个视频片段,记录了2016至2023年MLB比赛中的好球和坏球。
- 格式: 视频为.mp4格式,分辨率调整为224x224。
数据集结构
- 文件格式: 数据集以.tar.xz文件形式存储所有视频,标签信息存储在三个.csv文件中(训练集、验证集、测试集)。
- 标签信息: 包括投球位置(Zone)和投球类型(如Fastball、Sinker等)。
数据集用途
- 原始用途: 用于通过神经网络判定好球和坏球。
- 潜在用途: 可能需要重新标记以适应其他用途。
数据来源
- 原始数据: 从Baseball Savant的Statcast Search页面抓取。
- 数据处理: 视频下载后,从1280x720裁剪并缩放到224x244分辨率,帧率为15fps。部分视频片段手动修剪以去除噪音。
限制与注意事项
- 数据局限: 仅包含好球和坏球,不包括挥棒未中、界外球等其他情况。
- 数据偏差: 大多数投手和击球手为右撇子,未进行平衡处理。



