UCI Machine Learning Repository: Diabetes Data Set|糖尿病数据集|机器学习数据集
收藏
- UCI Machine Learning Repository首次发布Diabetes Data Set,该数据集包含768个样本,用于预测糖尿病的发病情况。
- Diabetes Data Set首次应用于机器学习研究,特别是在分类算法中,展示了其在医疗数据分析中的潜力。
- 随着数据挖掘技术的发展,Diabetes Data Set被广泛用于各种机器学习算法的性能评估和比较研究。
- Diabetes Data Set成为医疗数据分析和预测模型构建的标准基准数据集之一,推动了相关领域的研究进展。
- 尽管已有多年历史,Diabetes Data Set仍被频繁引用和使用,特别是在深度学习和人工智能领域,展示了其持久的影响力。
- 1Performance of Machine Learning Algorithms on the UCI Diabetes DatasetUniversity of California, Irvine · 2020年
- 2A Comparative Study of Machine Learning Algorithms for Diabetes Prediction Using UCI DatasetIEEE · 2019年
- 3Diabetes Prediction Using Machine Learning Techniques: A Comparative StudySpringer · 2021年
- 4Predicting Diabetes Mellitus with Machine Learning TechniquesElsevier · 2018年
- 5Machine Learning Approaches for Diabetes Prediction: A ReviewMDPI · 2022年
EcoInvent
EcoInvent是一个生命周期评估(LCA)数据库,包含了大量产品的环境影响数据。它提供了详细的产品生命周期数据,包括原材料提取、生产、使用和废弃处理等各个阶段的环境影响信息。
www.ecoinvent.org 收录
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
flames-and-smoke-datasets
该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。
github 收录
NIST Thermochemical Database
NIST Thermochemical Database(NIST热化学数据库)是一个包含大量热化学数据的数据集,涵盖了各种化学物质的热力学性质,如焓、熵、自由能等。该数据库由美国国家标准与技术研究院(NIST)维护,旨在为科学研究和工业应用提供准确的热化学数据。
webbook.nist.gov 收录
RadDet
RadDet是一个包含11种雷达类别的数据集,包括6种新的低概率干扰(LPI)多相码(P1, P2, P3, P4, Px, Zadoff-Chu)和一种新的宽带调频连续波(FMCW)。数据集覆盖500 MHz频段,包含40,000个雷达帧,分为训练集、验证集和测试集。数据集在两种不同的雷达环境中提供:稀疏数据集(RadDet-1T)和密集数据集(RadDet-9T)。
github 收录
