five

jlh/uci-adult-income|收入预测数据集|社会经济分析数据集

收藏
hugging_face2023-04-25 更新2024-03-04 收录
收入预测
社会经济分析
下载链接:
https://hf-mirror.com/datasets/jlh/uci-adult-income
下载链接
链接失效反馈
资源简介:
该数据集包含关于个人年龄、工作类别、教育、婚姻状况、职业、种族、性别、资本收益、资本损失、每周工作小时数、出生国家以及收入水平(是否超过50K)的信息。数据集被分为训练集,包含32561个样本。
提供机构:
jlh
原始信息汇总

数据集概述

数据集名称

uci-adult-income

数据集特征

  • age: 整数类型 (int64)
  • workclass: 字符串类型 (string)
  • fnlwgt: 整数类型 (int64)
  • education: 字符串类型 (string)
  • education-num: 整数类型 (int64)
  • marital-status: 字符串类型 (string)
  • occupation: 字符串类型 (string)
  • relationship: 字符串类型 (string)
  • race: 字符串类型 (string)
  • sex: 字符串类型 (string)
  • capital-gain: 整数类型 (int64)
  • capital-loss: 整数类型 (int64)
  • hours-per-week: 整数类型 (int64)
  • native-country: 字符串类型 (string)
  • income: 分类标签,包含两个类别:
    • 0: <=50K
    • 1: >50K

数据集分割

  • train:
    • 数据大小: 5552570 字节
    • 示例数量: 32561

数据集大小

  • 下载大小: 586658 字节
  • 总数据大小: 5552570 字节
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

LIDC-IDRI

LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。

OpenDataLab 收录

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录

VisDrone2019

VisDrone2019数据集由AISKYEYE团队在天津大学机器学习和数据挖掘实验室收集,包含288个视频片段共261,908帧和10,209张静态图像。数据集覆盖了中国14个不同城市的城市和乡村环境,包括行人、车辆、自行车等多种目标,以及稀疏和拥挤场景。数据集使用不同型号的无人机在各种天气和光照条件下收集,手动标注了超过260万个目标边界框,并提供了场景可见性、对象类别和遮挡等重要属性。

github 收录

MMAUD

MMAUD数据集是由南洋理工大学电气与电子工程学院创建,专注于小型无人机的检测、分类和轨迹估计。该数据集结合了多种传感器输入,包括立体视觉、多种激光雷达、雷达和音频阵列,以高保真度模拟真实世界场景。MMAUD提供了由Leica生成的精确地面实况数据,增强了数据集的可信度,并支持算法的精确和高效开发。数据集的应用领域包括无人机威胁检测、分类和轨迹估计,旨在解决现代微型无人机威胁带来的挑战。

arXiv 收录