five

California Housing Prices 加州房价

收藏
Data Castle2022-05-07 更新2026-04-18 收录
下载链接:
https://www.datacastle.cn/dataset_description.html?type=dataset&id=1760
下载链接
链接失效反馈
官方服务:
资源简介:
#### 背景描述 这是 Aurélien Géron 最近的著作“Hands-On Machine learning with Scikit-Learn and TensorFlow”的第二章中使用的数据集。它是实现机器学习算法的绝佳介绍,因为它需要基本的数据清理,具有易于理解的变量列表,并且处于玩具和过于繁琐之间的最佳大小。 数据包含来自 1990 年加州人口普查的信息。因此,尽管它可能无法像 Zillow Zestimate 数据集那样帮助您预测当前的房价,但它确实提供了一个可访问的介绍性数据集,用于向人们教授机器学习的基础知识。 #### 数据说明 这些数据与在给定的加利福尼亚地区发现的房屋有关,以及基于 1990 年人口普查数据的一些汇总统计数据。请注意,数据未清理,因此需要一些预处理步骤!列如下,它们的名称很容易解释: - 1. 经度:衡量房屋向西的距离; 更高的值是更远的西部 - 2. 纬度:衡量房屋向北的距离; 更高的值是更北 - 3. 房屋中位年龄:街区内房屋的中位年龄; 较低的数字是较新的建筑物 - 4. 房间总数:一个街区内的房间总数 - 5. 卧室总数:一个街区内的卧室总数 - 6. 人口:居住在一个街区内的总人数 - 7. 住户:一个街区的住户总数,居住在一个家庭单元内的一群人 - 8. 收入中位数:一栋房子内的家庭收入中位数(以万美元计) - 9. 房屋价值中位数:街区内家庭的房屋价值中位数(以美元计) - 10. 靠近海洋:房子的位置距离海边多远 #### 数据来源 该数据最初出现在以下论文中: 佩斯、R. Kelley 和 Ronald Barry。 “稀疏空间自回归。”统计与概率快报 33.3 (1997):291-297。 #### 问题描述 机器学习
提供机构:
cascomix
二维码
社区交流群
二维码
科研交流群
商业服务