five

rebas.tw Open Data

收藏
github2024-07-04 更新2024-07-05 收录
下载链接:
https://github.com/rebas-tw/rebas.tw-open-data
下载链接
链接失效反馈
官方服务:
资源简介:
野球革命|台灣棒球進階資料庫|原始數據共享計劃。该数据集包含台灣棒球比赛的详细数据,分为6张主要表格,通过json格式存储,涵盖比赛、打者成绩、投手成绩、打席内容、事件和跑者等信息。

Baseball Revolution | Taiwanese Baseball Advanced Database | Raw Data Sharing Project. This dataset contains detailed data of Taiwanese baseball games, which is divided into 6 main tables, stored in JSON format, and covers information such as game records, batter statistics, pitcher statistics, plate appearance details, game events and base runners.
创建时间:
2024-07-03
原始信息汇总

rebas.tw Open Data

野球革命|台灣棒球進階資料庫|原始數據共享計劃

原始數據

部分資料為手動紀錄,非球場儀器量測。

共享緣起

台灣棒球參與人數眾多,不乏許多熱切關注也有程式或數據分析能力的球迷。原始資料的取得,至今仍是許多好想法會被擱置的主要原因之一。野球革命網站成立後秉持著大多數據免費的精神,也是希望有興趣的球迷能夠有更方便的管道取得我們分析後的成果。

共享目標

我們希望透過資料的分享,讓所有人省去最繁瑣的步驟-資料蒐集的同時,也同樣能將結果分享給大家。無論最終成果是個網站、APP、文章、甚至是表格都沒有問題,數據是中性客觀的,加上每個人的觀點就會越發有趣!

資料結構

我們將資料分成 6 張主要的表格,透過 json 格式巢狀儲存:

表格名稱 表格定義 關係
game 比賽
batterBox 打者成績
pitcherBox 投手成績
PA 打席內容 一場比賽有 1 - n 個 PA
event 事件(投球, 盜壘等) 一個 PA 有 1 - n 個 event
runner 跑者 一個 event 有 0 - n 個 runner

使用原則

在標註來源的情況下,可以任意使用數據,詳細可參考 ODC-By License

問題回報

如您使用資料時發現以下問題,歡迎使用 Github Repo 內的 Issue 進行回報:

  1. 資料明顯錯誤
  2. 資料缺漏
  3. 資料格式不符實際使用情境
  4. 其他跟公開資料有直接相關聯的問題
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建基于对台湾棒球比赛的手动记录,而非依赖于球场的仪器测量。数据来源广泛,涵盖了比赛、打者成绩、投手成绩、打席内容、事件(如投球、盗垒等)以及跑者信息。这些数据通过JSON格式进行存储,并被组织成六个主要表格,每个表格之间通过特定的关系进行连接,确保数据的完整性和一致性。
特点
该数据集的显著特点在于其开放性和多样性。首先,数据集的开放性体现在其共享目标上,旨在为所有对棒球数据分析感兴趣的人提供便利,省去数据收集的繁琐步骤。其次,数据集的多样性体现在其涵盖了从比赛到具体事件的多个层面,为研究者提供了丰富的分析维度。此外,数据集的结构化设计也使得数据易于访问和处理。
使用方法
使用该数据集时,用户可以在标明来源的前提下自由使用数据。数据集的结构化设计使得用户可以通过访问六个主要表格来获取所需信息,每个表格通过JSON格式存储,便于解析和处理。用户可以通过GitHub页面下载数据,并根据提供的schema文件了解数据的详细结构。此外,用户还可以通过联系开发者获取更多详细资料或报告数据使用中的问题。
背景与挑战
背景概述
rebas.tw Open Data,由野球革命團隊創建,旨在為台灣棒球愛好者提供一個進階資料庫。該數據集的誕生源於對棒球數據分析需求的深刻理解,特別是對於那些具備程式和數據分析能力的球迷。野球革命網站自成立以來,一直秉持著數據共享的理念,旨在消除數據獲取的障礙,從而激發更多的創新應用和研究。該數據集的發布不僅豐富了台灣棒球數據的生態系統,也為相關研究提供了寶貴的資源。
当前挑战
rebas.tw Open Data在構建過程中面臨多重挑戰。首先,由於部分資料為手動紀錄而非球場儀器量測,數據的準確性和一致性成為主要問題。其次,數據的結構化和標準化也是一大挑戰,特別是在處理複雜的棒球事件和打席內容時。此外,隨著數據量的增加,如何保持數據的高效管理和更新,以及如何應對不同用戶的特定需求,都是該數據集需要持續解決的問題。
常用场景
经典使用场景
rebas.tw Open Data 数据集在棒球分析领域中具有广泛的应用。其经典使用场景包括但不限于:通过分析打者成績(batterBox)和投手成績(pitcherBox)表格,研究球员的表现趋势和策略优化;利用打席內容(PA)和事件(event)表格,深入探讨比赛中的关键时刻和战术决策;以及通过跑者(runner)表格,分析跑垒策略和效率。这些分析不仅有助于提升球队的整体表现,还能为教练和球员提供有价值的战术参考。
衍生相关工作
rebas.tw Open Data 数据集的开放共享激发了众多相关研究和工作。例如,有研究者利用该数据集开发了新的棒球数据分析算法,显著提升了球员表现预测的准确性。同时,基于此数据集的学术论文和研究报告层出不穷,涵盖了从基础统计分析到高级机器学习模型的广泛领域。此外,该数据集还催生了多个棒球分析工具和平台的开发,如智能化的比赛分析软件和球员数据管理系统,进一步推动了棒球数据分析技术的发展和应用。
数据集最近研究
最新研究方向
在台灣棒球領域,rebas.tw Open Data數據集的最新研究方向主要集中在利用進階數據分析來提升球隊表現和戰略決策。研究者們通過分析打者成績、投手成績、打席內容及事件等數據,探索球員的表現模式和比賽策略的優化。此外,該數據集也促進了機器學習和人工智能在棒球分析中的應用,幫助預測比賽結果和球員未來表現。這些研究不僅提升了棒球運動的科學性,也為球迷和教練提供了更深入的洞察和決策支持。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作