jlh/uci-adult-income|收入预测数据集|社会经济分析数据集
收藏数据集概述
数据集名称
uci-adult-income
数据集特征
- age: 整数类型 (int64)
- workclass: 字符串类型 (string)
- fnlwgt: 整数类型 (int64)
- education: 字符串类型 (string)
- education-num: 整数类型 (int64)
- marital-status: 字符串类型 (string)
- occupation: 字符串类型 (string)
- relationship: 字符串类型 (string)
- race: 字符串类型 (string)
- sex: 字符串类型 (string)
- capital-gain: 整数类型 (int64)
- capital-loss: 整数类型 (int64)
- hours-per-week: 整数类型 (int64)
- native-country: 字符串类型 (string)
- income: 分类标签,包含两个类别:
- 0: <=50K
- 1: >50K
数据集分割
- train:
- 数据大小: 5552570 字节
- 示例数量: 32561
数据集大小
- 下载大小: 586658 字节
- 总数据大小: 5552570 字节
学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录
中国空气质量数据集(2014-2020年)
数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。
国家地球系统科学数据中心 收录
VisDrone2019
VisDrone2019数据集由AISKYEYE团队在天津大学机器学习和数据挖掘实验室收集,包含288个视频片段共261,908帧和10,209张静态图像。数据集覆盖了中国14个不同城市的城市和乡村环境,包括行人、车辆、自行车等多种目标,以及稀疏和拥挤场景。数据集使用不同型号的无人机在各种天气和光照条件下收集,手动标注了超过260万个目标边界框,并提供了场景可见性、对象类别和遮挡等重要属性。
github 收录
MMAUD
MMAUD数据集是由南洋理工大学电气与电子工程学院创建,专注于小型无人机的检测、分类和轨迹估计。该数据集结合了多种传感器输入,包括立体视觉、多种激光雷达、雷达和音频阵列,以高保真度模拟真实世界场景。MMAUD提供了由Leica生成的精确地面实况数据,增强了数据集的可信度,并支持算法的精确和高效开发。数据集的应用领域包括无人机威胁检测、分类和轨迹估计,旨在解决现代微型无人机威胁带来的挑战。
arXiv 收录