California Housing Prices 加州房价
收藏Data Castle2022-05-07 更新2026-04-18 收录
下载链接:
https://www.datacastle.cn/dataset_description.html?type=dataset&id=1760
下载链接
链接失效反馈官方服务:
资源简介:
#### 背景描述
这是 Aurélien Géron 最近的著作“Hands-On Machine learning with Scikit-Learn and TensorFlow”的第二章中使用的数据集。它是实现机器学习算法的绝佳介绍,因为它需要基本的数据清理,具有易于理解的变量列表,并且处于玩具和过于繁琐之间的最佳大小。
数据包含来自 1990 年加州人口普查的信息。因此,尽管它可能无法像 Zillow Zestimate 数据集那样帮助您预测当前的房价,但它确实提供了一个可访问的介绍性数据集,用于向人们教授机器学习的基础知识。
#### 数据说明
这些数据与在给定的加利福尼亚地区发现的房屋有关,以及基于 1990 年人口普查数据的一些汇总统计数据。请注意,数据未清理,因此需要一些预处理步骤!列如下,它们的名称很容易解释:
- 1. 经度:衡量房屋向西的距离; 更高的值是更远的西部
- 2. 纬度:衡量房屋向北的距离; 更高的值是更北
- 3. 房屋中位年龄:街区内房屋的中位年龄; 较低的数字是较新的建筑物
- 4. 房间总数:一个街区内的房间总数
- 5. 卧室总数:一个街区内的卧室总数
- 6. 人口:居住在一个街区内的总人数
- 7. 住户:一个街区的住户总数,居住在一个家庭单元内的一群人
- 8. 收入中位数:一栋房子内的家庭收入中位数(以万美元计)
- 9. 房屋价值中位数:街区内家庭的房屋价值中位数(以美元计)
- 10. 靠近海洋:房子的位置距离海边多远
#### 数据来源
该数据最初出现在以下论文中:
佩斯、R. Kelley 和 Ronald Barry。 “稀疏空间自回归。”统计与概率快报 33.3 (1997):291-297。
#### 问题描述
机器学习
提供机构:
cascomix



