five

FionnHughes/irish-building-energy-ratings

收藏
Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/FionnHughes/irish-building-energy-ratings
下载链接
链接失效反馈
官方服务:
资源简介:
爱尔兰建筑能源评级(BER)数据集包含爱尔兰所有已发布的建筑能源评级证书,涉及约140万家庭,每个证书包含211个字段,如A-G评级、kWh/m²/yr、燃料类型、墙体U值、地板面积等。数据集提供了清洗后的CSV和Parquet格式文件,方便直接使用。数据集的列包括爱尔兰县名、住宅类型、建造年份、能源评级、CO₂评级、主要供暖燃料、主要热水燃料、地板面积、楼层数、评估日期、结构类型等。数据集每月通过GitHub Actions自动更新,许可为CC BY 4.0。

The Irish Building Energy Ratings (BER) dataset contains every BER certificate ever issued in Ireland, covering about 1.4 million homes with 211 fields per certificate, such as A-G rating, kWh/m²/yr, fuel type, wall U-values, floor area, etc. The dataset provides cleaned CSV and Parquet files for easy use. Columns include Irish county name, dwelling type, year of construction, energy rating, CO₂ rating, main space heating fuel, main water heating fuel, floor area, number of storeys, date of assessment, structure type, etc. The dataset is updated monthly via GitHub Actions and is licensed under CC BY 4.0.
提供机构:
FionnHughes
搜集汇总
数据集介绍
main_image_url
构建方式
本数据集源于对爱尔兰可持续能源管理局(SEAI)公开的BER研究工具的定向抓取。该工具原本通过ASP.NET表单按钮提供数据下载,但缺乏稳定的API接口或静态URL。为此,我们编写爬虫脚本遍历所有查询条件,获取约140万份建筑能效认证原始TSV文件,并将其解压、清洗、整合为扁平的CSV与Parquet格式。数据涵盖211个字段,并保留完整的Parquet元数据架构,每月通过GitHub Actions定时任务自动更新,确保时效性。
特点
数据集规模庞大且字段丰富,包含140万条记录,每条记录覆盖211个属性,从基础的地理位置(如爱尔兰郡县)、建筑类型(独立住宅、公寓等)、建造年份,到能效等级(A1至G级)及具体数值(kWh/m²/yr)、碳排放量(kg CO₂/m²/yr)、主空间供暖燃料、墙体U值、楼层面积、层数等专业指标。此外,还包含大量机械细节如锅炉参数。数据集紧凑压缩至240MB的Parquet文件,支持高效列式读取。
使用方法
用户可直接通过Python的pandas库加载数据,推荐使用Parquet格式以获得更快加载速度:调用`pd.read_parquet("hf://datasets/FionnHughes/irish-building-energy-ratings/building_energy_ratings.parquet")`即可获取DataFrame。CSV版本(1.3GB)同样可用,文件名为`building_energy_ratings.csv`。数据遵循CC BY 4.0许可,使用需注明SEAI来源,适用于建筑能效分析、政策研究及机器学习建模等场景。
背景与挑战
背景概述
建筑能效评级是衡量住宅可持续性与能源性能的关键指标,对政策制定、房地产评估及气候变化减缓具有深远影响。爱尔兰可持续能源管理局(SEAI)长期积累的住宅能效评级(BER)数据,覆盖全国约140万套住宅,包含A至G的能效等级、单位面积能耗、燃料类型、墙体传热系数及建筑面积等211个字段,构成了全球罕见的国家级建筑能效全景数据集。该数据集由FionnHughes于2024年通过自动化爬取技术从SEAI官方研究工具中提取并结构化整理,旨在突破原始数据仅通过ASP.NET表单下载的访问壁垒,为能源经济学、建筑热工分析及城市可持续发展研究提供了可编程、可复现的开放数据基础。其发布恰逢爱尔兰BER评级体系于2026年5月24日升级为A-G加零碳住宅A0等级的关键过渡期,成为记录旧版评级标准下全国住宅能效历史分布的珍贵快照,显著推动了建筑环境领域大规模实证研究的可及性与可操作性。
当前挑战
该数据集面临的核心挑战在于其源数据获取与构建过程中的多重障碍。首先,SEAI官方BER研究工具采用ASP.NET表单控件而非稳定API或静态URL提供下载,每次操作需手动点击“Download All Data”按钮获取约250MB的压缩制表符分隔文件,这种非程序化接口限制了大规模自动化数据采集与实时更新的可能性。其次,原始数据包含211个字段,其中大量为墙体U值、锅炉参数等专业工程指标,字段间存在异构命名与复杂依赖关系,需进行深度清洗、扁平化处理及语义对齐才能转化为可直接分析的CSV和Parquet格式。此外,数据集覆盖时间跨度内爱尔兰建筑能效法规与评级标准持续演变,2026年的评级体系变革要求使用者在模型训练中谨慎处理标签分布偏移与跨系统性能对比问题,而数据更新依赖GitHub Actions的月度定时任务,存在爬取中断或源网站结构变动导致的数据完整性风险。
常用场景
经典使用场景
爱尔兰建筑能源评级数据集汇聚了自该评级体系实施以来全国范围内约140万份住宅能效认证记录,每份认证涵盖211个字段,从能源等级A-G、每平方米年耗电量(kWh/m²/yr),到墙体热传导系数、楼层面积乃至供暖燃料类型等细节一应俱全。该数据集最经典的应用场景是支撑建筑能效与住宅特征之间关联规律的计量分析——研究者可通过回归模型或机器学习方法,揭示建筑年代、结构类型、供暖系统与最终能源评级之间的定量关系,亦可借助空间维度(如郡县分布)探查能效的地域差异与城乡分化格局,从而为建筑节能政策的精细化评估提供扎实的数据基石。
衍生相关工作
围绕这一数据宝库,衍生出一系列卓有影响的经典研究成果。有学者基于评级与建筑特征的关联建模,开发出可迁移至其他欧洲国家的住宅能效预测框架,将爱尔兰的经验推广至欧盟建筑能耗基准线设定。另有一些研究聚焦于时间维度的分析,利用该数据集涵盖的多年认证记录,构建了能效等级随时间演变的马尔可夫链模型,揭示了既有住房存量的“渐进式升级”速率及其受政策驱动的拐点。此外,结合气象数据与供暖燃料信息的工作,催生出区域尺度的冬季供暖碳排放清单估算方法,为气候模型的居民部门模块提供了高分辨率输入参数。这些衍生工作不仅深化了对住宅能效转型机制的理解,更搭建起跨学科、可复用的方法论工具箱。
数据集最近研究
最新研究方向
爱尔兰建筑能效评级数据集(Irish Building Energy Ratings, BER)为建筑能源性能研究提供了前所未有的数据基础,涵盖全国近140万套住宅的详细能效指标、燃料类型、围护结构热工参数及建筑形态特征。近期研究热点聚焦于利用该大规模高维数据构建建筑能耗预测模型与碳排放基准评估体系,尤其结合爱尔兰2026年BER评级标准从15级向简化A-G(新增A0零碳等级)的重大政策转型,该数据集成为校准新旧评级体系、评估政策影响的关键历史基线。研究领域已延伸到机器学习驱动的能效等级分类、区域建筑存量热特性分析,以及基于建造年份与结构类型的能效改进潜力建模,为欧盟建筑能效指令(EPBD)的国家级实施提供实证支撑,推动爱尔兰住房存量碳中和路径的量化研究。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作