UCI Machine Learning Repository: Student Performance|教育评估数据集|学生表现数据集
收藏
- 数据集首次发表,由Paulo Cortez和Alice Silva在Aveiro大学创建,旨在研究教育数据挖掘和学生成绩预测。
- 数据集首次应用于机器学习竞赛,促进了教育数据挖掘领域的研究和发展。
- 数据集被广泛引用,成为教育数据挖掘和机器学习领域的重要基准数据集之一。
- 数据集的扩展版本发布,增加了更多的学生信息和成绩数据,进一步丰富了研究内容。
- 数据集在多个国际会议上被专题讨论,推动了教育数据挖掘和个性化学习系统的研究进展。
- 1From Data Mining to Knowledge Discovery in DatabasesSpringer · 1996年
- 2Predicting Student Performance: A Comparison of Machine Learning ModelsIEEE · 2020年
- 3A Deep Learning Approach to Predicting Student PerformanceElsevier · 2019年
- 4Using Data Mining Techniques to Predict Student PerformanceTaylor & Francis · 2018年
- 5Predicting Student Performance Using Ensemble Learning TechniquesMDPI · 2021年
CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
SECOND-CC
SECOND-CC数据集由伊斯坦布尔技术大学的研究团队创建,专为遥感图像变化描述任务设计。该数据集包含6041对高分辨率RGB图像对、语义分割图以及30205条描述图像差异的句子,涵盖了多种真实场景,如模糊、光照差异、视角变化和图像配准误差等挑战。数据集通过语义分割图和RGB图像的结合,提供了丰富的多模态信息,旨在解决遥感图像变化描述中的复杂问题。该数据集的应用领域包括灾害响应、城市规划、环境监测等,能够为这些领域提供详细的变化描述和及时的行动建议。
arXiv 收录
PDT Dataset
PDT数据集是由山东计算机科学中心(国家超级计算济南中心)和齐鲁工业大学(山东省科学院)联合开发的无人机目标检测数据集,专门用于检测树木病虫害。该数据集包含高分辨率和低分辨率两种版本,共计5775张图像,涵盖了健康和受病虫害影响的松树图像。数据集的创建过程包括实地采集、数据预处理和人工标注,旨在为无人机在农业中的精准喷洒提供高精度的目标检测支持。PDT数据集的应用领域主要集中在农业无人机技术,旨在提高无人机在植物保护中的目标识别精度,解决传统检测模型在实际应用中的不足。
arXiv 收录
舌象数据集-neo
包含舌色,舌苔,厚薄,腻否的多标签数据集
AI_Studio 收录
SECOND (SEmantic Change detectiON Dataset)
其次是注释良好的语义变化检测数据集。为了确保数据的多样性,我们首先从多个平台和传感器收集4662对航拍图像。这些图像对分布在杭州,成都和上海等城市。每个图像具有512x512的大小,并且在像素级别被注释。SECOND的注释由地球视觉应用专家小组进行,从而保证了较高的标签精度。对于第二个数据集中的变化类别,我们关注6个主要的土地覆盖类别,即非植被地表,树木,低植被,水,建筑物和游乐场,它们经常涉及自然和人为的地理变化。值得注意的是,在新的数据集中,非植被地表 (简称n.v.g.地表) 主要对应于不透水地表和裸露土地。综上所述,这6个选定的土地覆盖类别产生了30个常见的变化类别 (包括非变化类别)。通过图像对的随机选择,第二个反映了发生变化时土地覆盖类别的真实分布。
OpenDataLab 收录