five

人口普查收入数据集(UCI)

收藏
阿里云天池2026-06-09 更新2024-03-07 收录
下载链接:
https://tianchi.aliyun.com/dataset/111479
下载链接
链接失效反馈
官方服务:
资源简介:
文件 income_census_train.csv中包含16个字段,具体信息如下: 每一行记录了一个人的人口普查结果。该数据集类变量为年收入是否超过50k$,属性变量包含年龄,工种,学历,职业,人种等重要信息,14个属性变量中有7个类别型变量。 No 属性 数据类型 数值类型 字段描述 1 ID - String 人的ID 2 age Numeric Integer 年龄 3 workclass Categorical String 工作类型 4 fnlwgt Continuous Integer 序号 5 education Categorical String 教育程度 6 education_num Numeric Integer 受教育时间 (年) 7 marital_status Categorical String 婚姻状态 8 occupation Categorical String 职业 9 relationship Categorical String 关系 10 race Categorical String 种族 11 gender Categorical String 性别 12 capital_gain Numeric Integer 资本收益 13 capital_loss Numeric Integer 资本损失 14 hours_per_week Numeric Integer 每周工作时长 15 native_country Categorical String 原国籍 16 income_bracket Categorical Integer 收入档次: 0-'<=50K', 1-'>50K' 文件 income_census_test.csv中包含15个字段,与文件 income_census_train.csv的前15个字段一致,但不包含类别字段。

数据集income_census_train.csv共包含16个字段,具体信息如下: 每条记录对应一份单人人口普查样本,该数据集的类别变量为年收入是否超过50000美元,属性变量涵盖年龄、工作类型、学历、职业、种族等关键信息,14个属性变量中包含7个类别型变量(Categorical variable)。 | 序号 | 属性名 | 数据类型 | 数值类型 | 字段说明 | | ---- | ---- | ---- | ---- | ---- | | 1 | ID | 无 | 字符串(String) | 个人ID | | 2 | age | 数值型(Numeric) | 整型(Integer) | 年龄 | | 3 | workclass | 分类型(Categorical) | 字符串(String) | 工作类型 | | 4 | fnlwgt | 连续型(Continuous) | 整型(Integer) | 序号 | | 5 | education | 分类型(Categorical) | 字符串(String) | 教育程度 | | 6 | education_num | 数值型(Numeric) | 整型(Integer) | 受教育年限(年) | | 7 | marital_status | 分类型(Categorical) | 字符串(String) | 婚姻状况 | | 8 | occupation | 分类型(Categorical) | 字符串(String) | 职业 | | 9 | relationship | 分类型(Categorical) | 字符串(String) | 家庭关系 | | 10 | race | 分类型(Categorical) | 字符串(String) | 种族 | | 11 | gender | 分类型(Categorical) | 字符串(String) | 性别 | | 12 | capital_gain | 数值型(Numeric) | 整型(Integer) | 资本收益 | | 13 | capital_loss | 数值型(Numeric) | 整型(Integer) | 资本损失 | | 14 | hours_per_week | 数值型(Numeric) | 整型(Integer) | 每周工作时长 | | 15 | native_country | 分类型(Categorical) | 字符串(String) | 原国籍 | | 16 | income_bracket | 分类型(Categorical) | 整型(Integer) | 收入分级:0代表"<=50K",1代表">50K" | 数据集income_census_test.csv共包含15个字段,与income_census_train.csv的前15个字段完全一致,但未包含类别标签字段。
提供机构:
阿里云天池
创建时间:
2021-10-05
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是来自UCI的人口普查收入数据集,包含训练和测试两个CSV文件,用于预测个人年收入是否超过50k$。数据集共有16个字段,其中14个属性变量涵盖年龄、工种、学历等人口统计信息,包括7个类别型变量,适用于分类任务如收入预测分析。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务