UCI Adult|收入预测数据集|社会经济分析数据集
收藏
- UCI Adult数据集首次发表,作为UCI机器学习库的一部分,用于预测个人年收入是否超过50,000美元。
- UCI Adult数据集首次应用于机器学习研究,特别是在分类算法和数据预处理技术方面。
- UCI Adult数据集被广泛用于教育和研究领域,成为机器学习课程中的经典案例。
- 随着数据科学和人工智能的兴起,UCI Adult数据集被重新审视,用于研究新的机器学习模型和算法。
- UCI Adult数据集被用于探索数据隐私和公平性问题,特别是在算法决策中的偏见检测。
- UCI Adult数据集继续被用作基准数据集,用于评估和比较不同机器学习模型的性能。
- 1UCI Machine Learning Repository: Adult Data SetUniversity of California, Irvine · 1996年
- 2Fairness-aware Learning through Algorithmic AwarenessCarnegie Mellon University · 2011年
- 3A Survey on Bias and Fairness in Machine LearningUniversity of California, Berkeley · 2019年
- 4Fairness in Machine Learning: Lessons from Political PhilosophyMassachusetts Institute of Technology · 2018年
- 5A Unified Approach to Interpreting Model PredictionsCarnegie Mellon University · 2017年
中国空气质量数据集(2014-2020年)
数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。
国家地球系统科学数据中心 收录
GAOKAO-Bench
GAOKAO-Bench是由复旦大学计算机科学与技术学院创建的数据集,涵盖了2010至2022年间中国高考的所有科目题目,共计2811题。该数据集包含1781道客观题和1030道主观题,题型多样,包括单选、填空、改错、开放性问题等。数据集通过自动化脚本和人工标注将PDF格式的题目转换为JSON文件,数学公式则转换为LATEX格式。GAOKAO-Bench旨在为大型语言模型提供一个全面且贴近实际应用的评估基准,特别是在解决中国高考相关问题上的表现。
arXiv 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
PDT Dataset
PDT数据集是由山东计算机科学中心(国家超级计算济南中心)和齐鲁工业大学(山东省科学院)联合开发的无人机目标检测数据集,专门用于检测树木病虫害。该数据集包含高分辨率和低分辨率两种版本,共计5775张图像,涵盖了健康和受病虫害影响的松树图像。数据集的创建过程包括实地采集、数据预处理和人工标注,旨在为无人机在农业中的精准喷洒提供高精度的目标检测支持。PDT数据集的应用领域主要集中在农业无人机技术,旨在提高无人机在植物保护中的目标识别精度,解决传统检测模型在实际应用中的不足。
arXiv 收录
中国气象数据
本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。
github 收录