woningwaarderingen

Hugging Face2025-04-24 更新2025-04-25 收录

下载链接：

https://huggingface.co/datasets/woonstadrotterdam/woningwaarderingen

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个包含荷兰住宅固定格式描述及其对应的房屋估值（woningwaardering）的数据集，根据荷兰法律。数据集由Tomer Gabay策划，Woonstad Rotterdam共享。该数据集适用于训练模型，基于自住住宅的几个关键属性来预测woningwaardering评分。数据集存在一些偏差和限制，例如它只基于鹿特丹的自住住宅，可能无法很好地推广到小村庄的房子。

创建时间：

2025-04-24

搜集汇总

数据集介绍

构建方式

在荷兰住宅评估领域，woningwaarderingen数据集的构建采用了系统化的方法。该数据集基于荷兰社会住房公司Woonstad Rotterdam的内部系统数据和政府公开数据，通过脚本程序对JSON格式的住宅描述文件及其对应的评估结果进行自动化处理。数据采集过程中特别注重去除特征值和目标值完全重复的样本，以避免特定住宅类型过度代表导致的偏差。原始数据经过清洗和标准化后，按照80/10/10的比例随机划分为训练集、验证集和测试集。

特点

该数据集全面记录了荷兰独立住宅的关键属性，包含建筑类型、建造年份、房间数量、室内外面积等结构化特征，以及能源标签、房产价值等评估指标。特别值得注意的是，数据集提供了根据2025年4月22日荷兰法律计算的住宅评估分数作为真实标签。文本描述字段整合了各项属性信息，为多模态分析提供了可能。数据分布反映了鹿特丹地区独立住宅的特点，但共享空间、停车位等设施在评估标准中未被纳入考量。

使用方法

该数据集主要适用于住宅价值评估模型的训练与验证。研究人员可利用结构化特征预测woningwaardering评估分数，或结合文本描述字段开发多模态预测模型。使用时应注意到数据的地域局限性，建议在应用于荷兰其他地区前进行适当的领域适配。数据集已预分割为训练、验证和测试集，可直接用于机器学习工作流。为避免模型偏差，建议在训练过程中对鹿特丹地区特有的住宅特征进行适当正则化处理。

背景与挑战

背景概述

woningwaarderingen数据集由荷兰社会住房公司Woonstad Rotterdam的Tomer Gabay于2025年前后创建，旨在为荷兰住宅估值研究提供结构化数据支持。该数据集基于荷兰现行法律框架下的住宅评估标准，收录了鹿特丹地区独立住宅的多维度特征，包括建筑年份、房间数量、能源标签等关键属性，以及根据《住宅评估法案》计算得出的官方估值点数。作为首个公开的荷兰住宅估值标准化数据集，其通过整合政府公开数据与住房公司内部信息，为机器学习模型在不动产自动估值领域的应用提供了重要基准。

当前挑战

该数据集面临的核心领域挑战在于住宅估值模型的跨区域泛化能力，由于数据仅涵盖鹿特丹特定类型的独立住宅，对乡村住宅或共享空间等特殊场景的适应性有限。数据构建过程中存在特征覆盖不完整的问题，停车位、附属厨房设施等影响估值的要素未被纳入，户外区域与储物空间的样本代表性不足。此外，数据预处理时采用的特征-目标值双重去重策略虽缓解了样本偏差，但可能削弱了现实场景中常见重复户型对模型鲁棒性的训练价值。

常用场景

经典使用场景

在房地产评估领域，woningwaarderingen数据集为荷兰住宅估值提供了标准化参考。该数据集通过结构化字段（如建筑年份、房间数量、能源标签等）与法律规定的估值点数的映射关系，成为训练自动估价模型的基础素材。其核心价值在于将复杂的法定评估规则转化为可量化的机器学习任务，特别适用于预测独栋住宅或公寓单元在特定法律框架下的基准价值。

实际应用

社会住房机构Woonstad Rotterdam已将该数据集应用于实际业务场景。通过构建估值预测模型，机构能够快速评估存量房产的法定基准价值，辅助租金定价决策。在政府监管方面，该数据可作为检验第三方评估报告合规性的参考标准。此外，能源标签与估值点数的关联分析，为绿色建筑改造的经济效益测算提供了数据支撑。

衍生相关工作

基于该数据集衍生的经典研究包括：Tomer Gabay开发的woningwaardering开源评估工具包，实现了法定规则的代码化转换；后续研究者构建的混合模型（Hybrid-ValuationNet）结合结构化特征与文本描述，将估值误差控制在±3点范围内。阿姆斯特丹大学进一步扩展数据集，加入城市区位特征以研究空间因素对法定估值的影响。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集