dataset-football|足球统计数据集|数据分析数据集
收藏DATASET-FOOTBALL
描述
创建一个提供足球比赛历史统计数据的数据集。
收集的统计数据
- 传球次数
- 射门次数
- 控球率
- 黄牌和犯规次数
- 角球次数
- 射正和射偏次数
- 平均控球时间
- 拦截次数和成功铲球次数
附加数据
-
获取球队的未来比赛数据。
-
比赛结束后立即更新比赛数据。
-
按联赛和球队对欧洲球队的比赛进行分类,以便于操作。
-
自动化整个过程
-
包含的足球联赛,如:
- 法甲
- 英超
- 西甲
- 意甲
- 德甲
- 欧冠
- 以及其他更多联赛
安装
-
克隆仓库:
bash git clone https://github.com/Arnel7/dataset-football.git
-
前提条件:
需要
GNU Make
来:- 设置环境
- 安装依赖
- 执行项目中的代码
如果您使用
Linux
,可以使用以下命令检查安装是否为最新版本:bash make --version
如果您使用
Windows
,可以参考以下安装指南:make for Windows⚠️ 注意:请检查您的
Python
安装和包管理器pip
。 -
设置环境和安装依赖:
bash make setup
您可以使用以下命令查看所有可用命令:
bash make
-
创建一个名为 "football" 的 SQL 数据库,并导入项目中的数据库。
-
Telegram 讨论组:https://t.me/+i1lvynnUuexkZjBk
-
进行改进并提出新解决方案。
注意:如果浏览器在运行脚本时要求选择搜索引擎,请选择 Google。

CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
jpft/danbooru2023
Danbooru2023是一个大规模的动漫图像数据集,包含超过500万张由爱好者社区贡献并详细标注的图像。图像标签涵盖角色、场景、版权、艺术家等方面,平均每张图像有30个标签。该数据集可用于训练图像分类、多标签标注、角色检测、生成模型等多种计算机视觉任务。数据集基于danbooru2021构建,扩展至包含ID #6,857,737的图像,增加了超过180万张新图像,总大小约为8TB。图像以原始格式提供,分为1000个子目录,使用图像ID的模1000进行分桶,以避免文件系统性能问题。
hugging_face 收录
GME Data
关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。
github 收录
网易云音乐数据集
该数据集包含了网易云音乐平台上的歌手信息、歌曲信息和歌单信息,数据通过爬虫技术获取并整理成CSV格式,用于音乐数据挖掘和推荐系统构建。
github 收录