五大欧洲足球联赛数据集|足球联赛数据集|数据更新数据集
收藏足球数据集概述
数据集内容
本数据集包含以下五个欧洲主要联赛的最新十个赛季数据:
- 英格兰超级联赛
- 西班牙甲级联赛
- 意大利甲级联赛
- 德国足球甲级联赛
- 法国足球甲级联赛
数据更新频率
数据每周通过Travis-CI进行更新。
数据处理
环境要求
- Python版本需大于等于3.5。
安装与运行
- 使用命令
pip install -r requirements.txt
安装所需依赖。 - 运行脚本
python process.py
进行数据处理。
数据集打包
打包方法
每个位于 datasets/
目录下的子目录为一个数据包,包含统一的 schema.json
文件。需运行 python package.py
从根目录生成每个数据包的 datapackage.json
。
使用数据流
可选择使用数据流工具,该工具将同时处理数据并准备 datapackage.json
文件。
安装与运行
- 安装数据流工具:
pip install dataflows
- 运行数据流:
python football_data_flow.py

中国空气质量数据集(2014-2020年)
数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。
国家地球系统科学数据中心 收录
FER2013
FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。
github 收录
TaRF
TaRF 是由密歇根大学、耶鲁大学和加州大学伯克利分校联合创建的视触融合场景数据集,旨在将视觉与触觉信号对齐至共享的三维空间。该数据集包含 19.3k 对齐的视觉与触觉样本,覆盖 13 个普通场景,如办公室、走廊和户外环境。数据采集通过结合神经辐射场(NeRF)和触觉传感器完成,利用多视图几何方法校准视觉与触觉信号,实现空间对齐。TaRF 的创建过程包括场景的多视角视觉重建和同步采集触觉信号,最终通过扩散模型生成未直接采样的触觉信号。该数据集可用于触觉信号估计、触觉定位和材料属性理解等任务,为机器人交互和虚拟世界构建提供重要支持。
github 收录
COVID-19 Data Hub
COVID-19 Data Hub是一个全球性的COVID-19数据集,包含了来自多个国家和地区的疫情数据,涵盖了病例数、死亡数、康复数、测试数等信息。此外,数据集还包括了与疫情相关的经济、社会和政策数据。
covid19datahub.io 收录
AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录