钻石数据集|钻石数据集|数据分析数据集
收藏数据集概述
数据集名称
ML-with-Visualization-on-Dimond-Dataset---Kaggle
数据集描述
该数据集包含近54,000颗钻石的价格及其他属性信息,适合初学者进行数据分析和可视化学习。
数据集内容
1. 数据导入
- 设置数据导入路径
- 使用Python Jupyter Notebook导入数据
2. 数据处理
- 数据处理
- 探索性数据分析(EDA)
- 5号摘要统计
- 处理缺失值
- 数据分布与传播分析
- 基本可视化
- 目标变量介绍
- 变量分析与解释
3. 数据预处理
4. 模型构建
5. 特征工程
- 特征重要性/选择
6. 机器学习算法分析
- 随机森林回归器
- 极端随机树回归器

中国区域教育数据库
该数据集包含了中国各区域的教育统计数据,涵盖了学校数量、学生人数、教师资源、教育经费等多个方面的信息。
www.moe.gov.cn 收录
猫狗图像数据集
该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。
github 收录
中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
中国农村金融统计数据
该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。
www.pbc.gov.cn 收录