five

UK house prices|房价数据集|时间序列分析数据集

收藏
github2024-04-22 更新2024-05-31 收录
房价
时间序列分析
下载链接:
https://github.com/datasets/house-prices-uk
下载链接
链接失效反馈
资源简介:
自1953年以来的英国房价月度时间序列数据,数据来源于Nationwide。数据可在`data/data.csv`文件中找到,详细信息见datapackage.json。

Monthly time series data of UK house prices since 1953, sourced from Nationwide. The data can be found in the `data/data.csv` file, with detailed information available in datapackage.json.
创建时间:
2012-12-13
原始信息汇总

数据集概述

数据说明

  • 数据处理历史:
    • 1952 - 1959 Q4: 简单平均购买价格
    • 1960 Q1 - 1973 Q4: 加权平均使用楼面面积
    • 1974 Q1 - 1982 Q4: 加权平均使用楼面面积、地区和物业类型
    • 1983 Q1 - 1989: 引入新的房价方法论,采用统计回归技术
    • 1993: 根据1991年人口普查结果更新邻里分类信息

数据处理

  • 处理脚本: scripts/process.py
  • 依赖安装: pip install datautil xlrd

许可证

AI搜集汇总
数据集介绍
main_image_url
构建方式
UK house prices数据集自1953年起,以月度时间序列的形式记录了英国的房价数据,其来源为Nationwide。数据集的构建过程经历了多次方法论的演变,从1952年至1959年第四季度,采用简单的购买价格平均值;1960年第一季度至1973年第四季度,引入了基于楼层面积的加权平均;1974年第一季度至1982年第四季度,进一步加入了地区和房产类型的加权平均;1983年第一季度起,采用了新的房价方法论,引入了统计回归技术,并在1993年根据1991年人口普查结果对邻里分类信息进行了重大更新。这一系列方法的演变确保了数据集的准确性和代表性。
特点
该数据集的主要特点在于其时间跨度长,涵盖了自1953年以来的月度房价数据,提供了对英国房地产市场长期趋势的深入洞察。此外,数据集的构建方法随着时间的推移不断优化,从简单的平均值到复杂的加权平均和统计回归技术,确保了数据的质量和可靠性。最后,数据集包含了详细的邻里分类信息,这为研究房价与社区特征之间的关系提供了可能。
使用方法
使用UK house prices数据集时,用户可以通过访问`data/data.csv`文件获取数据,并参考`datapackage.json`文件了解数据来源。为了确保数据的准确处理,用户可以运行提供的Python脚本,首先安装所需的依赖包,然后依次执行下载和处理数据的命令。该数据集适用于房地产市场分析、经济趋势研究以及政策制定等多个领域,用户可以根据具体需求进行数据筛选和分析。
背景与挑战
背景概述
英国房价数据集(UK house prices)自1953年起记录了英国房价的月度时间序列数据,由Nationwide提供。该数据集的核心研究问题在于揭示英国房地产市场长期的价格波动趋势及其背后的驱动因素。Nationwide作为英国主要的住房金融机构,其数据具有较高的权威性和代表性。该数据集的创建不仅为房地产市场的研究提供了宝贵的历史数据,还为政策制定者、经济学家和投资者提供了重要的参考依据。此外,数据集的构建过程中,Nationwide不断更新其房价计算方法,从简单的购买价格平均到引入回归技术,逐步提升了数据的精确性和可靠性。
当前挑战
英国房价数据集在构建和应用过程中面临多项挑战。首先,数据的时间跨度长达数十年,期间房价计算方法经历了多次重大调整,如1983年引入的回归技术,这使得数据的一致性和可比性成为一大难题。其次,随着时间的推移,房价的影响因素不断变化,如地区分类、房屋类型等,这些因素的复杂性增加了数据分析的难度。此外,数据集的维护和更新也面临挑战,特别是随着新数据的不断加入,如何确保历史数据的准确性和一致性是一个持续的挑战。
常用场景
经典使用场景
UK house prices数据集因其涵盖了自1953年以来的英国房价月度时间序列数据,成为研究房地产市场动态的经典资源。该数据集常用于分析房价的长期趋势、季节性波动以及不同时间段的市场表现,尤其在经济学和金融学领域,为研究者提供了丰富的历史数据支持,有助于构建和验证各类经济模型。
解决学术问题
该数据集解决了房地产市场研究中的多个关键学术问题,如房价波动的驱动因素、市场周期性分析以及政策干预对房价的影响评估。通过提供长期且连续的房价数据,研究者能够深入探讨房价与宏观经济变量之间的关系,为政策制定者提供科学依据,进而推动房地产市场理论的发展。
衍生相关工作
基于UK house prices数据集,衍生出了一系列经典研究工作,涵盖了房价预测模型、市场周期识别以及区域房价差异分析等领域。这些研究不仅丰富了房地产市场的理论框架,还为后续的实证研究提供了重要的数据基础和方法论参考,推动了相关领域的持续发展。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国交通事故深度调查(CIDAS)数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心 收录

RAVDESS

情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。

OpenDataLab 收录

LIDC-IDRI

LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。

OpenDataLab 收录

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录

糖尿病预测数据集

糖尿病相关的医学研究或者健康数据

AI_Studio 收录