TaherMAfini/housing_data
收藏Hugging Face2024-01-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/TaherMAfini/housing_data
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含关于加利福尼亚州住房市场的信息。数据已分为训练集和测试集,缺失值已使用中位数填补,数值已归一化。
该数据集包含关于加利福尼亚州住房市场的信息。数据已分为训练集和测试集,缺失值已使用中位数填补,数值已归一化。
提供机构:
TaherMAfini
原始信息汇总
数据集概述
数据特征
- bedrooms__ratio: 数据类型为
float64 - rooms_per_house__ratio: 数据类型为
float64 - people_per_house__ratio: 数据类型为
float64 - log__total_bedrooms: 数据类型为
float64 - log__total_rooms: 数据类型为
float64 - log__population: 数据类型为
float64 - log__households: 数据类型为
float64 - log__median_income: 数据类型为
float64 - geo__Cluster 0 similarity: 数据类型为
float64 - geo__Cluster 1 similarity: 数据类型为
float64 - geo__Cluster 2 similarity: 数据类型为
float64 - geo__Cluster 3 similarity: 数据类型为
float64 - geo__Cluster 4 similarity: 数据类型为
float64 - geo__Cluster 5 similarity: 数据类型为
float64 - geo__Cluster 6 similarity: 数据类型为
float64 - geo__Cluster 7 similarity: 数据类型为
float64 - geo__Cluster 8 similarity: 数据类型为
float64 - geo__Cluster 9 similarity: 数据类型为
float64 - cat__ocean_proximity_<1H OCEAN: 数据类型为
float64 - cat__ocean_proximity_INLAND: 数据类型为
float64 - cat__ocean_proximity_ISLAND: 数据类型为
float64 - cat__ocean_proximity_NEAR BAY: 数据类型为
float64 - cat__ocean_proximity_NEAR OCEAN: 数据类型为
float64 - remainder__housing_median_age: 数据类型为
float64 - remainder__income_cat: 数据类型为
float64
数据分割
- train: 包含 16512 个样本,占用 3302400 字节
- test: 包含 4128 个样本,占用 825600 字节
数据集大小
- 下载大小: 3441982 字节
- 数据集大小: 4128000 字节
配置
- default:
- train: 路径为
data/train-* - test: 路径为
data/test-*
- train: 路径为
数据集名称
- pretty_name: Housing Data
数据集规模
- size_categories: 10K<n<100K



