five

Boston House Prices

收藏
github2024-04-12 更新2024-05-31 收录
下载链接:
https://github.com/stdlib-js/datasets-harrison-boston-house-prices-corrected
下载链接
链接失效反馈
官方服务:
资源简介:
一个(修正后的)数据集,源自美国人口普查局收集的关于马萨诸塞州波士顿住房的信息(1978年)。

A (revised) dataset derived from information collected by the U.S. Census Bureau regarding housing in Boston, Massachusetts (1978).
创建时间:
2021-06-16
原始信息汇总

Boston House Prices

数据集描述

  • 来源: 该数据集是从美国人口普查局收集的关于马萨诸塞州波士顿住房的信息中派生出来的,特别关注1978年的数据。
  • 内容: 数据集包含15个属性,用于描述波士顿地区的住房情况,包括犯罪率、土地使用情况、非零售业务用地比例、与查尔斯河的接近程度、氮氧化物浓度、每栋住宅的平均房间数、建筑年龄、到就业中心的加权距离、高速公路可达性指数、房产税率、学生与教师比例、黑人比例、低社会经济地位人口比例、房屋的中间价值以及修正后的房屋中间价值。
  • 用途: 该数据集可用于预测两个依赖变量:1) 氮氧化物水平和2) 房屋中间价值。
  • 特点: 数据集包含对中间价值字段的8个修正,这些修正由Gilley和Pace在1996年提出。

安装与使用

安装

bash npm install @stdlib/datasets-harrison-boston-house-prices-corrected

使用

javascript var dataset = require( @stdlib/datasets-harrison-boston-house-prices-corrected );

dataset()

返回一个修正后的数据集,包含1978年波士顿地区住房的相关信息。

javascript var data = dataset(); /* returns [ { crim: 0.00632, zn: 18.00, indus: 2.310, chas: 0, nox: 0.5380, rm: 6.5750, age: 65.20, dis: 4.0900, rad: 1, tax: 296.0, ptratio: 15.30, b: 396.90, lstat: 4.98, medv: 24.00, cmedv: 24.00 }, ... ] */

示例

javascript var Plot = require( @stdlib/plot ); var dataset = require( @stdlib/datasets-harrison-boston-house-prices-corrected );

var data; var plot; var opts; var x; var y; var i;

data = dataset();

// Extract housing data... x = []; y = []; for ( i = 0; i < data.length; i++ ) { x.push( data[ i ].rm ); y.push( data[ i ].cmedv ); }

// Create a plot instance: opts = { lineStyle: none, symbols: closed-circle, xLabel: Average Number of Rooms, yLabel: Corrected Median Value, title: Number of Rooms vs Median Value }; plot = new Plot( [ x ], [ y ], opts );

// Render the plot: console.log( plot.render( html ) );

搜集汇总
数据集介绍
main_image_url
构建方式
Boston House Prices数据集源自美国人口普查局关于1978年波士顿马萨诸塞州住房信息的收集。该数据集经过修正,包含15个属性,涵盖了犯罪率、住宅用地比例、非零售商业用地比例、查尔斯河虚拟变量、一氧化氮浓度、每户平均房间数、1940年前建造的自住单位比例、到五个波士顿就业中心的加权距离、高速公路可达性指数、房产税率、学生与教师的比例、黑人比例、人口的低阶层比例、房屋中位数价值及其修正值。数据集的构建基于Harrison和Rubinfeld的研究,并根据Gilley和Pace的文献进行了八处中位数价值的修正。
特点
Boston House Prices数据集具有多维度的特征,涵盖了影响房屋价值的多个社会经济和环境因素。其独特之处在于包含了修正后的中位数房屋价值,这使得数据集在研究房屋价格预测和环境影响分析时具有更高的准确性。此外,数据集的属性设计全面,能够支持多种回归和分类模型的训练与验证,尤其适用于研究房屋价格与环境因素之间的关系。
使用方法
使用Boston House Prices数据集时,用户可以通过npm安装相应的包,或在网页中通过script标签加载ES模块,亦可在Deno环境中使用。数据集支持多种输出格式,包括CSV和NDJSON,便于不同环境下的数据处理。用户可以通过JavaScript代码直接调用数据集,提取所需的属性进行分析或可视化。此外,数据集还提供了CLI工具,方便命令行环境下的快速访问和数据导出。
背景与挑战
背景概述
Boston House Prices数据集源自1978年美国人口普查局关于波士顿地区住房信息的调查数据,由David Harrison和Daniel L. Rubinfeld创建。该数据集主要用于研究住房价格与环境因素之间的关系,特别是空气清洁度的需求。其核心研究问题在于通过分析住房特征与环境变量,预测房屋的中位价值及氮氧化物浓度。该数据集在环境经济学和房地产评估领域具有重要影响力,为后续研究提供了基础数据支持。
当前挑战
Boston House Prices数据集在构建过程中面临多项挑战。首先,数据集包含的变量如种族比例和犯罪率等,可能引发伦理和隐私问题。其次,数据集中的中位房屋价值字段存在上限截断现象,导致数据分析时需特别处理。此外,数据集的原始编码错误经过Gilley和Pace的修正,但仍需谨慎处理以确保分析结果的准确性。这些挑战使得数据集的使用需结合领域知识和专业技术,以克服潜在的偏差和局限性。
常用场景
经典使用场景
Boston House Prices数据集的经典使用场景主要集中在房地产市场的价格预测与分析。通过分析数据集中的多个特征,如犯罪率、住宅用地比例、非零售商业用地比例、查尔斯河指标、氮氧化物浓度、平均房间数、房屋年龄、到就业中心的距离、高速公路可达性、房产税率、师生比例、黑人比例、低收入人群比例等,研究者可以构建回归模型,预测波士顿地区房屋的中位数价格。这一应用不仅为房地产市场提供了量化分析工具,也为城市规划和政策制定提供了重要参考。
实际应用
Boston House Prices数据集在实际应用中具有广泛的适用性。首先,房地产行业可以利用该数据集进行市场分析和价格预测,帮助开发商和投资者做出更明智的决策。其次,城市规划部门可以利用数据集中的信息,评估不同区域的发展潜力,优化土地利用和基础设施布局。此外,政府和非营利组织也可以利用该数据集进行社会经济研究,制定更有效的住房政策和社区发展计划。通过这些实际应用,数据集为多个领域的决策提供了科学依据。
衍生相关工作
Boston House Prices数据集的广泛应用催生了许多相关的经典工作。例如,Harrison和Rubinfeld(1978)基于该数据集的研究,探讨了环境质量与房地产价格之间的关系,成为环境经济学领域的经典文献。Gilley和Pace(1996)则进一步对数据集中的错误进行了修正,并提出了新的分析方法。此外,许多机器学习和统计学领域的研究也基于该数据集,开发了各种预测模型和算法。这些衍生工作不仅丰富了数据集的应用场景,也推动了相关领域的技术进步。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作