Bristol, UK Air Quality Continuous Data|空气质量监测数据集|环境数据数据集
收藏ICLR Peer Review and Rebuttal Process Dataset
该数据集包含从ICLR 2024和2025年收集的同行评审和反驳过程数据,数据来自OpenReview平台,包括评审者ID、初始评分和反驳后评分。评审者评分变化被追踪,使用追踪分数指标来评估评审者连续性,分数≤1表示有效使用,≥2需双重检查。数据许可证为CC BY 4.0。
github 收录
Club Football Match Data (2000 - 2025)
该数据集提供了一个简单的入口,用于分析全球27个国家和42个联赛的足球比赛数据,包括英超、德甲和西甲等顶级联赛。数据涵盖了从2000/01赛季到2024/25赛季的最新比赛结果。数据集还包括Elo评分,每月的1号和15号对欧洲约500支最佳球队进行快照。
github 收录
UAVDT Dataset
The authors constructed a new UAVDT Dataset focused on complex scenarios with new level challenges. Selected from 10 hours raw videos, about 80, 000 representative frames are fully annotated with bounding boxes as well as up to 14 kinds of attributes (e.g., weather condition, flying altitude, camera view, vehicle category, and occlusion) for three fundamental computer vision tasks: object detection, single object tracking, and multiple object tracking.
datasetninja.com 收录
OpenML-CC18
我们提倡使用经过整理的、全面的机器学习数据集基准测试套件,以标准化的基于 OpenML 的接口和用 Python、Java 和 R 编写的互补软件工具包为后盾。我们展示了如何使用标准化的基于 OpenML 的基准测试套件轻松执行全面的基准测试研究以及用 Python、Java 和 R 编写的互补软件工具包。 OpenML 基准测试套件的主要显着特点是 (i) 通过标准化数据格式、API 和现有客户端库易于使用; (ii) 关于套件内容的机器可读元信息; (iii) 在线共享结果,实现大规模比较。作为第一个这样的套件,我们提出了 OpenML-CC18,这是一个机器学习基准套件,包含 72 个分类数据集,从 OpenML 上的数千个数据集中精心策划。纳入标准是: * 密集数据集独立观察的分类任务 * 类数 >= 2,每个类至少有 20 个观察和少数类与多数类的比例必须超过 5% * 500 <= 观察数 <= 100000 * one-hot-encoding 后的特征数量 < 5000 * 没有人工数据集 * 没有更大数据集的子集,也没有其他数据集的二值化 * 没有可以通过使用单个特征或使用简单的决策树来完全预测的数据集* 来源或参考可用 如果您使用此基准测试套件,请引用:Bernd Bischl、Giuseppe Casalicchio、Matthias Feurer、Frank Hutter、Michel Lang、Rafael G. Mantovani、Jan N. van Rijn 和 Joaquin Vanschoren。 “OpenML 基准测试套件”arXiv:1708.03731v2 [stats.ML] (2019)。 @article{oml-benchmarking-suites, title={OpenML Benchmarking Suites}, author={Bernd Bischl and Giuseppe Casalicchio and Matthias Feurer and Frank Hutter and Michel Lang and Rafael G. Mantovani and Jan N. van Rijn and Joaquin Vanschoren},年={2019},日记={arXiv:1708.03731v2 [stat.ML]} }
OpenDataLab 收录
MeSH
MeSH(医学主题词表)是一个用于索引和检索生物医学文献的标准化词汇表。它包含了大量的医学术语和概念,用于描述医学文献中的主题和内容。MeSH数据集包括主题词、副主题词、树状结构、历史记录等信息,广泛应用于医学文献的分类和检索。
www.nlm.nih.gov 收录
