2004砒砂岩区生长季(4月-10月)累积生物量空间分布图|生态治理数据集|生物量分布数据集
收藏Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
基于OFES数据计算台湾以东逐月位涡(1993-2017)
基于1993-2017年间OFES高分辨率模式数据集中的温度和盐度数据计算的台湾以东位势涡度逐月三维分布。所使用OFES数据为开源数据。
国家海洋科学数据中心 收录
Electrical-Lines-Defect-Detection
该数据集是针对电力线路缺陷检测的,包含了由APEPDCL线路工人使用移动相机捕获的图片,并由Sampath Balaji团队整理。数据集以CC BY 4.0许可证发布,旨在促进开源合作、可重现性和人工智能的实践学习。数据集分为两个模块:目标检测和分类。目标检测模块遵循YOLOv12格式,分类模块由文件夹和CSV文件组成,都提供了训练、验证和测试数据集。
huggingface 收录
MNIST数据集
数据规模 训练集:60,000 张手写数字图像(28×28 像素灰度图)及对应标签 34。 测试集:10,000 张图像与标签,用于模型评估 68。 数据来源 由美国国家标准与技术研究院(NIST)收集,50% 样本来自高中生手写,50% 来自人口普查局工作人员 48。 经 Yann LeCun 团队标准化处理,成为机器学习基准数据集 1011。
阿里云天池 收录
OpenML-CC18
我们提倡使用经过整理的、全面的机器学习数据集基准测试套件,以标准化的基于 OpenML 的接口和用 Python、Java 和 R 编写的互补软件工具包为后盾。我们展示了如何使用标准化的基于 OpenML 的基准测试套件轻松执行全面的基准测试研究以及用 Python、Java 和 R 编写的互补软件工具包。 OpenML 基准测试套件的主要显着特点是 (i) 通过标准化数据格式、API 和现有客户端库易于使用; (ii) 关于套件内容的机器可读元信息; (iii) 在线共享结果,实现大规模比较。作为第一个这样的套件,我们提出了 OpenML-CC18,这是一个机器学习基准套件,包含 72 个分类数据集,从 OpenML 上的数千个数据集中精心策划。纳入标准是: * 密集数据集独立观察的分类任务 * 类数 >= 2,每个类至少有 20 个观察和少数类与多数类的比例必须超过 5% * 500 <= 观察数 <= 100000 * one-hot-encoding 后的特征数量 < 5000 * 没有人工数据集 * 没有更大数据集的子集,也没有其他数据集的二值化 * 没有可以通过使用单个特征或使用简单的决策树来完全预测的数据集* 来源或参考可用 如果您使用此基准测试套件,请引用:Bernd Bischl、Giuseppe Casalicchio、Matthias Feurer、Frank Hutter、Michel Lang、Rafael G. Mantovani、Jan N. van Rijn 和 Joaquin Vanschoren。 “OpenML 基准测试套件”arXiv:1708.03731v2 [stats.ML] (2019)。 @article{oml-benchmarking-suites, title={OpenML Benchmarking Suites}, author={Bernd Bischl and Giuseppe Casalicchio and Matthias Feurer and Frank Hutter and Michel Lang and Rafael G. Mantovani and Jan N. van Rijn and Joaquin Vanschoren},年={2019},日记={arXiv:1708.03731v2 [stat.ML]} }
OpenDataLab 收录
