expe_logement_dataset
收藏github2019-09-23 更新2024-05-31 收录
下载链接:
https://github.com/naonedia/expe_logement_dataset
下载链接
链接失效反馈官方服务:
资源简介:
包含多个与住房相关的数据集,如DVF地理位置数据、经济数据等,用于模型训练和数据分析。
This dataset encompasses a variety of housing-related data, including DVF geographic location data, economic data, and more, utilized for model training and data analysis.
创建时间:
2019-08-23
原始信息汇总
数据集概述
数据集来源
- DVF geolocated
- Evolution of gross disposable income and purchasing power
- OpenStreetMap Data
可用数据集
Neural networks
current_model: 包含当前生产中使用的模型。COLUMNS_ORDER.csv: 包含用于数据标准化的参数mu和std。
Datasets
dvf_nantes_cleaned.csv: 原始DVF数据。origin_enriched_v2.csv: DVF + POI。origin_enriched_v3.csv: DVF + POI + Economy。origin_enriched_v4_lonlat.csv: DVF + POI + Economy,包含邮政编码和Nantes区域详细信息,以及经纬度。dataset_ready_v1.csv: DVF + POI + Economy,数据已进行one-hot编码,准备使用。dataset_ready_v1_lonlat.csv: 包含经纬度,用于调试。dataset_ready_v2.csv: DVF + POI + Economy,数据已进行one-hot编码,准备使用。移除了小于25平方米的面积、价格不在50k€至1M€之间的住房、每平方米价格低于1600€的住房,以及具有相同大小、销售日期、经纬度的住房。dataset_ready_v2_lonlat.csv: 包含经纬度,用于调试。
Finance
finance.csv: 原始数据。finance_modified.csv: 经济演变数据,起始自2000年第一季度,其他季度基于此。
Others
code_postaux.csv: 邮政编码与城镇关联数据,存在同一邮政编码对应多个城镇的情况。
搜集汇总
数据集介绍

构建方式
expe_logement_dataset数据集的构建汇集了多个来源的数据,包括法国地理编码的不动产价值请求数据(DVF),可支配收入及购买力的演变数据,以及OpenStreetMap数据。该数据集通过整合和清洗这些数据源,形成了多个版本的数据文件,如dvf_nantes_cleaned.csv,origin_enriched_v系列和dataset_ready_v系列,每个文件都针对不同的处理阶段和模型需求进行了优化。
使用方法
用户可以根据自己的研究需求选择不同处理阶段的文件。数据集提供了已进行独热编码的版本,可直接用于模型训练。此外,数据集还提供了带有经纬度信息的文件,以便于调试和可视化。在使用前,用户应确保理解数据集中的各项指标和预处理步骤,以便正确地应用于模型训练或数据分析。
背景与挑战
背景概述
expe_logement_dataset是一个专注于法国住房市场数据集,汇集了地理定位的房地产价值申请数据、可支配收入与购买力演变数据以及OpenStreetMap数据等。该数据集的创建旨在为住房市场分析提供详实的数据支持,由多个机构和研究人员合作开发而成,自2019年4月25日更新以来,对房地产经济领域的研究产生了显著影响,为市场趋势预测和政策制定提供了重要依据。
当前挑战
该数据集在构建过程中面临的挑战主要包括数据的清洗与整合,例如处理邮政编码的歧义问题、对异常数据值的筛选和处理,以及数据的一维编码等。研究领域的挑战则体现在如何利用这些数据有效预测住房市场变化,解决诸如价格波动、供需平衡等复杂问题。此外,数据集在应用深度学习模型时,还需克服模型选择、超参数调整以及模型泛化能力等实际问题。
常用场景
经典使用场景
在住房市场分析领域,expe_logement_dataset数据集因其整合了地理编码的住房交易数据、经济指标以及兴趣点(POI)信息,被广泛用于构建神经网络模型以预测住房价格。该数据集提供了数据归一化参数,便于研究人员直接应用于机器学习算法中,其经典使用场景在于通过模型训练,预测住房市场的价格趋势。
解决学术问题
该数据集解决了住房价格预测中的多个学术研究问题,如数据不平衡、特征缺失和过度拟合等。通过整合多个来源的数据,它为研究者提供了全面的分析视角,增强了模型的泛化能力,对于理解住房市场的复杂性和动态性具有重要的意义和影响。
实际应用
在实际应用中,expe_logement_dataset数据集可用于房地产市场的风险评估、投资决策支持以及城市发展规划。政府和金融机构利用该数据集分析住房市场的变化趋势,以制定相应的政策,促进市场的健康发展。
数据集最近研究
最新研究方向
expe_logement_dataset数据集整合了地理信息系统、经济数据与房地产交易信息,为住房市场分析提供了丰富的多维度视角。近期研究聚焦于利用该数据集进行城市住房价格预测模型的开发与优化,探索了深度学习神经网络在其中的应用潜力。学者们通过结合DVF地理位置数据、经济指标和城市详细区域信息,以期构建更为精确的价格评估模型,进而辅助政策制定者进行更为有效的房地产市场调控。此类研究对于促进住房市场的透明度与公平性,以及提升居民生活质量具有深远影响。
以上内容由遇见数据集搜集并总结生成



