UCI Machine Learning Repository: Student Performance|教育评估数据集|学生表现数据集
收藏
- 数据集首次发表,由Paulo Cortez和Alice Silva在Aveiro大学创建,旨在研究教育数据挖掘和学生成绩预测。
- 数据集首次应用于机器学习竞赛,促进了教育数据挖掘领域的研究和发展。
- 数据集被广泛引用,成为教育数据挖掘和机器学习领域的重要基准数据集之一。
- 数据集的扩展版本发布,增加了更多的学生信息和成绩数据,进一步丰富了研究内容。
- 数据集在多个国际会议上被专题讨论,推动了教育数据挖掘和个性化学习系统的研究进展。
- 1From Data Mining to Knowledge Discovery in DatabasesSpringer · 1996年
- 2Predicting Student Performance: A Comparison of Machine Learning ModelsIEEE · 2020年
- 3A Deep Learning Approach to Predicting Student PerformanceElsevier · 2019年
- 4Using Data Mining Techniques to Predict Student PerformanceTaylor & Francis · 2018年
- 5Predicting Student Performance Using Ensemble Learning TechniquesMDPI · 2021年
LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
btc
该数据集可能包含金融市场交易数据,具体包括时间戳、开盘价、最高价、最低价、收盘价和交易量等信息。数据集分为训练集,包含2465个样本,总大小为175324字节。
huggingface 收录
中国空气质量数据集(2014-2020年)
数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。
国家地球系统科学数据中心 收录
Cainiao-AI/LaDe-P
LaDe是一个公开的最后一公里配送数据集,包含来自工业界的数百万个包裹。它具有三个独特特征:(1) 大规模:涉及6个月内21,000名配送员的10,677,000个包裹;(2) 信息全面:提供原始包裹信息(如位置和时间要求)以及任务事件信息(如任务接受和任务完成事件发生的时间和地点);(3) 多样性:数据集包括多种场景(如包裹取件和配送)和多个城市的数据,每个城市都有其独特的时空模式。
hugging_face 收录
Obstacle-dataset OD
该数据集用于十五种障碍物检测,包含VOC格式和YOLO训练的.txt文件,数据集中的图像来自VOC数据集、COCO数据集、TT100K数据集以及作者团队实地收集的图片。
github 收录