five

Boston House Prices

收藏
github2024-04-12 更新2024-05-31 收录
下载链接:
https://github.com/stdlib-js/datasets-pace-boston-house-prices
下载链接
链接失效反馈
官方服务:
资源简介:
一个(修正后的)数据集,源自美国人口普查局关于马萨诸塞州波士顿住房的信息(1978年)。

A (revised) dataset derived from the U.S. Census Bureau's information on housing in Boston, Massachusetts (1978).
创建时间:
2021-06-16
原始信息汇总

数据集概述

数据集名称

Boston House Prices

数据集描述

这是一个经过修正的数据集,源自美国人口普查局收集的关于1978年马萨诸塞州波士顿住房的信息。

数据集内容

数据集包含21个属性,主要属性包括:

  • obs: 观察编号
  • town: 城镇名称
  • town_id: 城镇标识符
  • tract: 区域标识符
  • lon: 经度
  • lat: 纬度
  • medv: 自住房屋的中位价值(以千美元计)
  • cmedv: 修正后的自住房屋中位价值(以千美元计)
  • crim: 城镇人均犯罪率
  • zn: 超过25,000平方英尺的住宅用地比例
  • indus: 非零售业务用地比例
  • chas: Charles River虚拟变量(边界河流为1,否则为0)
  • nox: 氮氧化物浓度(每亿份之一)
  • rm: 每栋住宅的平均房间数
  • age: 1940年之前建造的自住单位比例
  • dis: 到五个波士顿就业中心的加权距离
  • rad: 径向高速公路的可达性指数
  • tax: 每10,000美元的全值财产税率
  • ptratio: 城镇的学生与教师比例
  • b: 1000(Bk-0.63)^2,其中Bk是城镇黑人比例
  • lstat: 人口的较低社会经济状态百分比

数据集用途

该数据集可用于预测两个因变量:1) 氮氧化物水平和2) 中位房屋价值。

数据集安装与使用

安装

bash npm install @stdlib/datasets-pace-boston-house-prices

使用

javascript var dataset = require( @stdlib/datasets-pace-boston-house-prices );

调用 dataset() 函数返回数据集。

数据集示例

javascript var data = dataset(); /* returns [ { obs: 1, town: Nahant, town_id: 0, tract: 2011, lon: -70.955000, lat: 42.255000, medv: 24.00, cmedv: 24.00, crim: 0.00632, zn: 18.00, indus: 2.310, chas: 0, nox: 0.5380, rm: 6.5750, age: 65.20, dis: 4.0900, rad: 1, tax: 296.0, ptratio: 15.30, b: 396.90, lstat: 4.98 }, ... ] */

数据集参考文献

  • Harrison, David, and Daniel L Rubinfeld. 1978. "Hedonic housing prices and the demand for clean air." Journal of Environmental Economics and Management 5 (1): 81–102.
  • Gilley, Otis W., and R.Kelley Pace. 1996. "On the Harrison and Rubinfeld Data." Journal of Environmental Economics and Management 31 (3): 403–5.
  • Pace, R. Kelley, and Otis W. Gilley. 1997. "Using the Spatial Configuration of the Data to Improve Estimation." The Journal of Real Estate Finance and Economics 14 (3): 333–40.
搜集汇总
数据集介绍
main_image_url
构建方式
Boston House Prices数据集源自1978年美国人口普查局关于波士顿住房情况的信息收集。该数据集经过修正,包含了8处对错误编码的中位数房价的更正,并增加了地理参考和空间估计,以增强数据的准确性和实用性。数据集的构建基于Harrison和Rubinfeld(1978)的研究,并由Gilley和Pace(1996)进行了进一步的校正和扩展。
使用方法
使用Boston House Prices数据集时,用户可以通过npm安装相应的包,并在JavaScript环境中调用dataset()函数获取数据。数据集支持多种输出格式,包括CSV和NDJSON,便于在不同环境中进行数据分析和可视化。用户可以利用该数据集进行房价预测、环境影响评估等多种研究。
背景与挑战
背景概述
波士顿房价数据集(Boston House Prices)源自1978年美国人口普查局对马萨诸塞州波士顿地区住房信息的收集。该数据集由Harrison和Rubinfeld于1978年首次发布,旨在研究住房价格与环境因素之间的关系,特别是清洁空气的需求。数据集包含21个属性,涵盖了房屋的多个方面,如犯罪率、房间数量、教育资源等。该数据集在房地产经济学和环境经济学领域具有重要影响力,成为研究房价预测和环境影响评估的经典数据集之一。
当前挑战
波士顿房价数据集在构建过程中面临多项挑战。首先,数据集的原始版本存在编码错误,经过Gilley和Pace于1996年的修正后,才得以完善。其次,数据集中的中位数房价字段存在上限截断问题,最高值被限制在50,000美元,这可能导致模型在处理高价值房屋时的预测偏差。此外,数据集的地理信息和空间估计的引入增加了数据处理的复杂性,尤其是在进行空间分析时,如何准确处理地理数据成为一大挑战。
常用场景
经典使用场景
波士顿房价数据集(Boston House Prices)的经典使用场景主要集中在房地产市场的价格预测和影响因素分析。通过该数据集,研究者可以探索房屋价格与多个变量之间的关系,如犯罪率、住宅用地比例、非零售业务用地比例、查尔斯河指标、氮氧化物浓度、平均房间数、房屋年龄、到就业中心的距离、高速公路可达性、房产税率、师生比例、黑人比例以及人口的低收入比例等。这些变量共同构成了预测房屋中位数价格的基础,使得该数据集成为回归分析和机器学习模型的经典案例。
解决学术问题
波士顿房价数据集解决了多个学术研究问题,特别是在城市经济学和环境经济学领域。首先,它为研究者提供了一个实证分析的框架,用于探讨环境因素(如空气质量)对房地产价格的影响,这是Harrison和Rubinfeld(1978)研究的核心问题。其次,该数据集通过包含地理信息和空间估计,为空间计量经济学提供了丰富的数据支持,帮助研究者理解地理因素如何影响房价。此外,数据集中的修正值还解决了原始数据中的编码错误问题,提升了研究的准确性和可靠性。
实际应用
在实际应用中,波士顿房价数据集被广泛用于房地产市场的预测和政策制定。例如,房地产开发商和投资者可以利用该数据集来评估不同区域的房产价值,从而做出更明智的投资决策。地方政府和城市规划者也可以通过分析数据集中的变量,制定更有效的土地使用政策和税收政策,以促进区域经济发展和改善居民生活质量。此外,金融机构在评估抵押贷款风险时,也可以参考该数据集中的房价预测模型,以提高贷款审批的准确性。
数据集最近研究
最新研究方向
近年来,波士顿房价数据集在房地产经济学和环境经济学领域引起了广泛关注。研究者们利用该数据集探索房价与环境因素(如空气质量、交通便利性等)之间的复杂关系,尤其是在城市规划和政策制定中的应用。此外,随着机器学习和空间统计技术的发展,该数据集也被用于开发更精确的房价预测模型,尤其是在考虑地理空间因素的情况下。这些研究不仅为房地产市场提供了更深入的洞察,还为城市可持续发展提供了科学依据。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作