jlh/home-credit-example-raw
收藏Hugging Face2023-05-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/jlh/home-credit-example-raw
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: SK_ID_CURR
dtype: int64
- name: TARGET
dtype: int64
- name: NAME_CONTRACT_TYPE
dtype: string
- name: CODE_GENDER
dtype: string
- name: FLAG_OWN_CAR
dtype: string
- name: FLAG_OWN_REALTY
dtype: string
- name: CNT_CHILDREN
dtype: int64
- name: AMT_INCOME_TOTAL
dtype: float64
- name: AMT_CREDIT
dtype: float64
- name: AMT_ANNUITY
dtype: float64
- name: AMT_GOODS_PRICE
dtype: float64
- name: NAME_TYPE_SUITE
dtype: string
- name: NAME_INCOME_TYPE
dtype: string
- name: NAME_EDUCATION_TYPE
dtype: string
- name: NAME_FAMILY_STATUS
dtype: string
- name: NAME_HOUSING_TYPE
dtype: string
- name: REGION_POPULATION_RELATIVE
dtype: float64
- name: DAYS_BIRTH
dtype: int64
- name: DAYS_EMPLOYED
dtype: int64
- name: DAYS_REGISTRATION
dtype: float64
- name: DAYS_ID_PUBLISH
dtype: int64
- name: OWN_CAR_AGE
dtype: float64
- name: FLAG_MOBIL
dtype: int64
- name: FLAG_EMP_PHONE
dtype: int64
- name: FLAG_WORK_PHONE
dtype: int64
- name: FLAG_CONT_MOBILE
dtype: int64
- name: FLAG_PHONE
dtype: int64
- name: FLAG_EMAIL
dtype: int64
- name: OCCUPATION_TYPE
dtype: string
- name: CNT_FAM_MEMBERS
dtype: float64
- name: REGION_RATING_CLIENT
dtype: int64
- name: REGION_RATING_CLIENT_W_CITY
dtype: int64
- name: WEEKDAY_APPR_PROCESS_START
dtype: string
- name: HOUR_APPR_PROCESS_START
dtype: int64
- name: REG_REGION_NOT_LIVE_REGION
dtype: int64
- name: REG_REGION_NOT_WORK_REGION
dtype: int64
- name: LIVE_REGION_NOT_WORK_REGION
dtype: int64
- name: REG_CITY_NOT_LIVE_CITY
dtype: int64
- name: REG_CITY_NOT_WORK_CITY
dtype: int64
- name: LIVE_CITY_NOT_WORK_CITY
dtype: int64
- name: ORGANIZATION_TYPE
dtype: string
- name: EXT_SOURCE_1
dtype: float64
- name: EXT_SOURCE_2
dtype: float64
- name: EXT_SOURCE_3
dtype: float64
- name: APARTMENTS_AVG
dtype: float64
- name: BASEMENTAREA_AVG
dtype: float64
- name: YEARS_BEGINEXPLUATATION_AVG
dtype: float64
- name: YEARS_BUILD_AVG
dtype: float64
- name: COMMONAREA_AVG
dtype: float64
- name: ELEVATORS_AVG
dtype: float64
- name: ENTRANCES_AVG
dtype: float64
- name: FLOORSMAX_AVG
dtype: float64
- name: FLOORSMIN_AVG
dtype: float64
- name: LANDAREA_AVG
dtype: float64
- name: LIVINGAPARTMENTS_AVG
dtype: float64
- name: LIVINGAREA_AVG
dtype: float64
- name: NONLIVINGAPARTMENTS_AVG
dtype: float64
- name: NONLIVINGAREA_AVG
dtype: float64
- name: APARTMENTS_MODE
dtype: float64
- name: BASEMENTAREA_MODE
dtype: float64
- name: YEARS_BEGINEXPLUATATION_MODE
dtype: float64
- name: YEARS_BUILD_MODE
dtype: float64
- name: COMMONAREA_MODE
dtype: float64
- name: ELEVATORS_MODE
dtype: float64
- name: ENTRANCES_MODE
dtype: float64
- name: FLOORSMAX_MODE
dtype: float64
- name: FLOORSMIN_MODE
dtype: float64
- name: LANDAREA_MODE
dtype: float64
- name: LIVINGAPARTMENTS_MODE
dtype: float64
- name: LIVINGAREA_MODE
dtype: float64
- name: NONLIVINGAPARTMENTS_MODE
dtype: float64
- name: NONLIVINGAREA_MODE
dtype: float64
- name: APARTMENTS_MEDI
dtype: float64
- name: BASEMENTAREA_MEDI
dtype: float64
- name: YEARS_BEGINEXPLUATATION_MEDI
dtype: float64
- name: YEARS_BUILD_MEDI
dtype: float64
- name: COMMONAREA_MEDI
dtype: float64
- name: ELEVATORS_MEDI
dtype: float64
- name: ENTRANCES_MEDI
dtype: float64
- name: FLOORSMAX_MEDI
dtype: float64
- name: FLOORSMIN_MEDI
dtype: float64
- name: LANDAREA_MEDI
dtype: float64
- name: LIVINGAPARTMENTS_MEDI
dtype: float64
- name: LIVINGAREA_MEDI
dtype: float64
- name: NONLIVINGAPARTMENTS_MEDI
dtype: float64
- name: NONLIVINGAREA_MEDI
dtype: float64
- name: FONDKAPREMONT_MODE
dtype: string
- name: HOUSETYPE_MODE
dtype: string
- name: TOTALAREA_MODE
dtype: float64
- name: WALLSMATERIAL_MODE
dtype: string
- name: EMERGENCYSTATE_MODE
dtype: string
- name: OBS_30_CNT_SOCIAL_CIRCLE
dtype: float64
- name: DEF_30_CNT_SOCIAL_CIRCLE
dtype: float64
- name: OBS_60_CNT_SOCIAL_CIRCLE
dtype: float64
- name: DEF_60_CNT_SOCIAL_CIRCLE
dtype: float64
- name: DAYS_LAST_PHONE_CHANGE
dtype: float64
- name: FLAG_DOCUMENT_2
dtype: int64
- name: FLAG_DOCUMENT_3
dtype: int64
- name: FLAG_DOCUMENT_4
dtype: int64
- name: FLAG_DOCUMENT_5
dtype: int64
- name: FLAG_DOCUMENT_6
dtype: int64
- name: FLAG_DOCUMENT_7
dtype: int64
- name: FLAG_DOCUMENT_8
dtype: int64
- name: FLAG_DOCUMENT_9
dtype: int64
- name: FLAG_DOCUMENT_10
dtype: int64
- name: FLAG_DOCUMENT_11
dtype: int64
- name: FLAG_DOCUMENT_12
dtype: int64
- name: FLAG_DOCUMENT_13
dtype: int64
- name: FLAG_DOCUMENT_14
dtype: int64
- name: FLAG_DOCUMENT_15
dtype: int64
- name: FLAG_DOCUMENT_16
dtype: int64
- name: FLAG_DOCUMENT_17
dtype: int64
- name: FLAG_DOCUMENT_18
dtype: int64
- name: FLAG_DOCUMENT_19
dtype: int64
- name: FLAG_DOCUMENT_20
dtype: int64
- name: FLAG_DOCUMENT_21
dtype: int64
- name: AMT_REQ_CREDIT_BUREAU_HOUR
dtype: float64
- name: AMT_REQ_CREDIT_BUREAU_DAY
dtype: float64
- name: AMT_REQ_CREDIT_BUREAU_WEEK
dtype: float64
- name: AMT_REQ_CREDIT_BUREAU_MON
dtype: float64
- name: AMT_REQ_CREDIT_BUREAU_QRT
dtype: float64
- name: AMT_REQ_CREDIT_BUREAU_YEAR
dtype: float64
splits:
- name: raw
num_bytes: 10681044
num_examples: 10000
download_size: 1985577
dataset_size: 10681044
---
# Dataset Card for "home-credit-example-raw"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
jlh
原始信息汇总
数据集概述
数据集特征
- SK_ID_CURR (int64): 当前客户ID。
- TARGET (int64): 目标变量。
- NAME_CONTRACT_TYPE (string): 合同类型名称。
- CODE_GENDER (string): 性别代码。
- FLAG_OWN_CAR (string): 是否拥有汽车标志。
- FLAG_OWN_REALTY (string): 是否拥有房产标志。
- CNT_CHILDREN (int64): 子女人数。
- AMT_INCOME_TOTAL (float64): 总收入金额。
- AMT_CREDIT (float64): 信用金额。
- AMT_ANNUITY (float64): 年金金额。
- AMT_GOODS_PRICE (float64): 商品价格。
- NAME_TYPE_SUITE (string): 套房类型名称。
- NAME_INCOME_TYPE (string): 收入类型名称。
- NAME_EDUCATION_TYPE (string): 教育类型名称。
- NAME_FAMILY_STATUS (string): 家庭状态名称。
- NAME_HOUSING_TYPE (string): 住房类型名称。
- REGION_POPULATION_RELATIVE (float64): 相对地区人口。
- DAYS_BIRTH (int64): 出生天数。
- DAYS_EMPLOYED (int64): 就业天数。
- DAYS_REGISTRATION (float64): 注册天数。
- DAYS_ID_PUBLISH (int64): ID发布天数。
- OWN_CAR_AGE (float64): 自有汽车年龄。
- FLAG_MOBIL (int64): 移动电话标志。
- FLAG_EMP_PHONE (int64): 工作电话标志。
- FLAG_WORK_PHONE (int64): 工作电话标志。
- FLAG_CONT_MOBILE (int64): 移动电话连续标志。
- FLAG_PHONE (int64): 电话标志。
- FLAG_EMAIL (int64): 电子邮件标志。
- OCCUPATION_TYPE (string): 职业类型。
- CNT_FAM_MEMBERS (float64): 家庭成员数。
- REGION_RATING_CLIENT (int64): 客户地区评级。
- REGION_RATING_CLIENT_W_CITY (int64): 带城市的客户地区评级。
- WEEKDAY_APPR_PROCESS_START (string): 申请处理开始的工作日。
- HOUR_APPR_PROCESS_START (int64): 申请处理开始的小时。
- REG_REGION_NOT_LIVE_REGION (int64): 注册地区与居住地区不一致标志。
- REG_REGION_NOT_WORK_REGION (int64): 注册地区与工作地区不一致标志。
- LIVE_REGION_NOT_WORK_REGION (int64): 居住地区与工作地区不一致标志。
- REG_CITY_NOT_LIVE_CITY (int64): 注册城市与居住城市不一致标志。
- REG_CITY_NOT_WORK_CITY (int64): 注册城市与工作城市不一致标志。
- LIVE_CITY_NOT_WORK_CITY (int64): 居住城市与工作城市不一致标志。
- ORGANIZATION_TYPE (string): 组织类型。
- EXT_SOURCE_1 (float64): 外部源1。
- EXT_SOURCE_2 (float64): 外部源2。
- EXT_SOURCE_3 (float64): 外部源3。
- APARTMENTS_AVG (float64): 公寓平均数。
- BASEMENTAREA_AVG (float64): 地下室面积平均值。
- YEARS_BEGINEXPLUATATION_AVG (float64): 开始运营年数的平均值。
- YEARS_BUILD_AVG (float64): 建筑年数的平均值。
- COMMONAREA_AVG (float64): 公共区域平均值。
- ELEVATORS_AVG (float64): 电梯平均数。
- ENTRANCES_AVG (float64): 入口平均数。
- FLOORSMAX_AVG (float64): 最大楼层平均数。
- FLOORSMIN_AVG (float64): 最小楼层平均数。
- LANDAREA_AVG (float64): 土地面积平均值。
- LIVINGAPARTMENTS_AVG (float64): 居住公寓平均数。
- LIVINGAREA_AVG (float64): 居住面积平均值。
- NONLIVINGAPARTMENTS_AVG (float64): 非居住公寓平均数。
- NONLIVINGAREA_AVG (float64): 非居住面积平均值。
- APARTMENTS_MODE (float64): 公寓众数。
- BASEMENTAREA_MODE (float64): 地下室面积众数。
- YEARS_BEGINEXPLUATATION_MODE (float64): 开始运营年数的众数。
- YEARS_BUILD_MODE (float64): 建筑年数的众数。
- COMMONAREA_MODE (float64): 公共区域众数。
- ELEVATORS_MODE (float64): 电梯众数。
- ENTRANCES_MODE (float64): 入口众数。
- FLOORSMAX_MODE (float64): 最大楼层众数。
- FLOORSMIN_MODE (float64): 最小楼层众数。
- LANDAREA_MODE (float64): 土地面积众数。
- LIVINGAPARTMENTS_MODE (float64): 居住公寓众数。
- LIVINGAREA_MODE (float64): 居住面积众数。
- NONLIVINGAPARTMENTS_MODE (float64): 非居住公寓众数。
- NONLIVINGAREA_MODE (float64): 非居住面积众数。
- APARTMENTS_MEDI (float64): 公寓中位数。
- BASEMENTAREA_MEDI (float64): 地下室面积中位数。
- YEARS_BEGINEXPLUATATION_MEDI (float64): 开始运营年数的中位数。
- YEARS_BUILD_MEDI (float64): 建筑年数的中位数。
- COMMONAREA_MEDI (float64): 公共区域中位数。
- ELEVATORS_MEDI (float64): 电梯中位数。
- ENTRANCES_MEDI (float64): 入口中位数。
- FLOORSMAX_MEDI (float64): 最大楼层中位数。
- FLOORSMIN_MEDI (float64): 最小楼层中位数。
- LANDAREA_MEDI (float64): 土地面积中位数。
- LIVINGAPARTMENTS_MEDI (float64): 居住公寓中位数。
- LIVINGAREA_MEDI (float64): 居住面积中位数。
- NONLIVINGAPARTMENTS_MEDI (float64): 非居住公寓中位数。
- NONLIVINGAREA_MEDI (float64): 非居住面积中位数。
- FONDKAPREMONT_MODE (string): 修缮基金众数。
- HOUSETYPE_MODE (string): 房屋类型众数。
- TOTALAREA_MODE (float64): 总面积众数。
- WALLSMATERIAL_MODE (string): 墙体材料众数。
- EMERGENCYSTATE_MODE (string): 紧急状态众数。
- OBS_30_CNT_SOCIAL_CIRCLE (float64): 过去30天社交圈观察数。
- DEF_30_CNT_SOCIAL_CIRCLE (float64): 过去30天社交圈违约数。
- OBS_60_CNT_SOCIAL_CIRCLE (float64): 过去60天社交圈观察数。
- DEF_60_CNT_SOCIAL_CIRCLE (float64): 过去60天社交圈违约数。
- DAYS_LAST_PHONE_CHANGE (float64): 上次电话变更天数。
- FLAG_DOCUMENT_2 (int64): 文档2标志。
- FLAG_DOCUMENT_3 (int64): 文档3标志。
- FLAG_DOCUMENT_4 (int64): 文档4标志。
- FLAG_DOCUMENT_5 (int64): 文档5标志。
- FLAG_DOCUMENT_6 (int64): 文档6标志。
- FLAG_DOCUMENT_7 (int64): 文档7标志。
- FLAG_DOCUMENT_8 (int64): 文档8标志。
- FLAG_DOCUMENT_9 (int64): 文档9标志。
- FLAG_DOCUMENT_10 (int64): 文档10标志。
- FLAG_DOCUMENT_11 (int64): 文档11标志。
- FLAG_DOCUMENT_12 (int64): 文档12标志。
- FLAG_DOCUMENT_13 (int64): 文档13标志。
- FLAG_DOCUMENT_14 (int64): 文档14标志。
- FLAG_DOCUMENT_15 (int64): 文档15标志。
- FLAG_DOCUMENT_16 (int64): 文档16标志。
- FLAG_DOCUMENT_17 (int64): 文档17标志。
- FLAG_DOCUMENT_18 (int64): 文档18标志。
- FLAG_DOCUMENT_19 (int64): 文档19标志。
- FLAG_DOCUMENT_20 (int64): 文档20标志。
- FLAG_DOCUMENT_21 (int64): 文档21标志。
- AMT_REQ_CREDIT_BUREAU_HOUR (float64): 每小时向信用局请求的金额。
- AMT_REQ_CREDIT_BUREAU_DAY (float64): 每天向信用局请求的金额。
- AMT_REQ_CREDIT_BUREAU_WEEK (float64): 每周向信用局请求的金额。
- AMT_REQ_CREDIT_BUREAU_MON (float64): 每月向信用局请求的金额。
- AMT_REQ_CREDIT_BUREAU_QRT (float64): 每季度向信用局请求的金额。
- AMT_REQ_CREDIT_BUREAU_YEAR (float64): 每年向信用局请求的金额。
数据集大小
- 下载大小: 1985577字节
- 数据集大小: 10681044字节
- 样本数量: 10000
数据集分割
- raw: 包含所有样本,共10000个。



