UCI (real-world) datasets, Synthetic (artificial) datasets|聚类分析数据集|数据集数据集
收藏数据集概述
数据集名称
- Clustering-Datasets
数据集内容
- UCI (real-world) datasets
- Synthetic (artificial) datasets with cluster labels
子数据集详情
UCI (real-world) datasets
- 路径: 01. UCI
Synthetic (artificial) datasets
- 路径: 02. Synthetic
示例数据集
2D数据集
- 2d-10c: 包含10个聚类的二维数据集。
- 2d-20c: 包含20个聚类的二维数据集。
- 2d-3c: 包含3个聚类的二维数据集。
- 2d-4c-1, 2d-4c-2, 2d-4c-3: 分别包含4个聚类的二维数据集。
其他合成数据集
- 3-spiral, aggregation, atom, banana 等多个合成数据集,每个数据集都有其特定的聚类结构和特征。
数据集用途
- 用于聚类分析和算法测试,适用于机器学习和数据挖掘领域的研究和开发。

中国行政区划数据
本项目为中国行政区划数据,包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局,存储格式为sqlite3 db文件,支持直接使用数据库连接工具打开。
github 收录
中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录
CIFAR-10
CIFAR-10 数据集由 10 个类别的 60000 个 32x32 彩色图像组成,每个类别包含 6000 个图像。有 50000 个训练图像和 10000 个测试图像。 数据集分为五个训练批次和一个测试批次,每个批次有 10000 张图像。测试批次恰好包含来自每个类别的 1000 个随机选择的图像。训练批次包含随机顺序的剩余图像,但一些训练批次可能包含来自一个类的图像多于另一个。在它们之间,训练批次恰好包含来自每个类别的 5000 张图像。
OpenDataLab 收录
NREL Wind Integration National Dataset (WIND) Toolkit
NREL Wind Integration National Dataset (WIND) Toolkit 是一个包含美国大陆风能资源和电力系统集成数据的综合数据集。该数据集提供了高分辨率的风速、风向、风能密度、电力输出等数据,覆盖了美国大陆的多个地理区域。这些数据有助于研究人员和工程师进行风能资源评估、电力系统规划和集成研究。
www.nrel.gov 收录
ISIC 2018
ISIC 2018数据集包含2594张皮肤病变图像,用于皮肤癌检测任务。数据集分为训练集、验证集和测试集,每张图像都附有详细的元数据,包括病变类型、患者年龄、性别和解剖部位等信息。
challenge2018.isic-archive.com 收录