five

HOT

收藏
Hugging Face2025-08-01 更新2025-08-02 收录
下载链接:
https://huggingface.co/datasets/BuildingBench/HOT
下载链接
链接失效反馈
官方服务:
资源简介:
HOT (HVAC Operations Transfer)数据集是一个为迁移学习研究量身定制的建筑控制系统开源数据集,包含大量的建筑-天气组合,建筑模型,覆盖全球多个气候区,支持多种商业建筑类型和占用模式。该数据集旨在推动建筑能效研究,并提供了一系列研究基础设施。
创建时间:
2025-07-31
原始信息汇总

HOT数据集:HVAC操作迁移

概述

HOT(HVAC Operations Transfer)数据集是首个专为建筑控制系统迁移学习研究设计的大规模开源数据集。建筑通过HVAC系统消耗全球约10-15%的能源,智能控制优化对能源效率和气候变化缓解至关重要。

关键统计

  • 159,744 种独特的建筑-天气组合
  • 15,808 个具有可控区域设定点的建筑模型
  • 19 个ASHRAE气候区覆盖 76 个全球位置
  • 16 种商业建筑类型(办公室、零售、学校、医院等)
  • 12 种系统占用模式
  • 3 种热性能场景
  • 15分钟 时间步分辨率用于控制应用

数据集描述

HOT通过四个关键维度的系统变化解决了建筑控制迁移学习中的关键基础设施差距:

🏢 建筑几何(16种类型)

  • 办公室:小型(511 m²)、中型(4,983 m²)、大型(46,323 m²)
  • 零售:独立(2,294 m²)、带状商场(2,294 m²)
  • 教育:小学(6,874 m²)、中学(19,592 m²)
  • 医疗:医院(22,443 m²)、门诊(3,805 m²)
  • 酒店:小型酒店(3,726 m²)、大型酒店(11,349 m²)
  • 住宅:中层公寓(2,825 m²)、高层公寓(7,063 m²)
  • 餐饮:堂食餐厅(511 m²)、快餐(232 m²)
  • 工业:仓库(4,835 m²)

🌡️ 热性能(3种场景)

  • 默认:基线热性能(R_mult = 1.0)
  • 高性能:增强绝缘(R_mult = 2.0,U_mult = 0.5)
  • 低性能:最小绝缘(R_mult = 0.5,U_mult = 2.0)

🌍 气候条件(76个位置)

  • 完整ASHRAE覆盖:所有19个气候区(0A至8)
  • 全球多样性:从热带(胡志明市)到亚北极(费尔班克斯)
  • 天气数据类型:TMY(典型气象年)+ 真实历史(2014-2024)
  • 温度范围:-44.4°C至47.0°C
  • HDD范围:0至7,673加热度日
  • CDD范围:6至4,301冷却度日

👥 占用模式(12种计划)

  • 标准:传统办公时间(工作日8 AM - 5 PM)
  • 低/高占用:50%/150%强度变化
  • 轮班操作:早班(6 AM-3 PM)、晚班(2 PM-11 PM)
  • 行业特定:零售(10 AM-9 PM)、学校(7 AM-4 PM + 晚间)
  • 医疗:医院24/7轮班模式
  • 现代工作:灵活混合与错开时间
  • 专业:健身房(早/晚高峰)、仓库物流
  • 连续:24/7操作

数据集结构

HOT/ ├── data/ │ ├── base/ # 按几何类型分类的原始建筑模型 │ ├── processed/ # 用于控制的处理过的EPJSON文件 │ ├── variations/ # 建筑变化 │ │ ├── occupancy/ # 占用计划变化 │ │ ├── thermal/ # 热性能变化 │ │ └── combined/ # 多变量组合 │ ├── weather/ # 天气数据文件(.epw) │ └── tables/ # 数据集元数据和组合

关键特性

🎮 强化学习准备

  • 可控设定点:区域级加热/冷却温度控制
  • Gymnasium接口:标准RL环境包装器
  • 全面状态空间:区域温度、室外条件、能耗
  • 多目标奖励:能源效率+热舒适+控制稳定性
  • EnergyPlus集成:基于物理的建筑模拟

🔬 迁移学习框架

  • 相似性度量:跨4个维度的定量兼容性评估
  • 零样本评估:无需重新训练的直接策略转移
  • 系统变化:单变量和多变量转移场景
  • 基准协议:标准化评估方法

🌐 全球气候覆盖

  • 所有居住区:完整的ASHRAE气候区表示
  • 真实与合成:TMY基线+历史天气变化
  • 极端条件:从亚北极(-44°C)到沙漠(+47°C)
  • 转移分析:气候适应和地理部署

📊 研究基础设施

  • 标准化格式:一致的EnergyPlus epJSON结构
  • 处理管道:自动化建筑修改工具
  • 验证工具:建筑模型验证和测试
  • 相似性分析:转移可行性评估工具包

研究应用

🤖 强化学习

  • 多代理控制:协调多个HVAC区域
  • 元学习:快速适应新建筑(MAML,Reptile)
  • 基础模型:预训练多样建筑类型
  • 安全RL:具有舒适保证的约束感知控制

🔄 迁移学习

  • 领域适应:地理和气候转移
  • 少样本学习:最小数据适应新建筑
  • 跨建筑泛化:跨原型的策略转移
  • 相似性引导选择:最佳源建筑识别

📈 建筑分析

  • 能源基准测试:跨气候性能比较
  • 占用分析:使用模式对能耗的影响
  • 围护结构优化:热性能敏感性分析
  • 气候韧性:建筑对变化条件的适应

数据集统计

维度 数量 范围 示例
建筑类型 16 232-46,323 m² 办公室、医院、学校
气候区 19 -44°C至+47°C 0A(热带)至8(亚北极)
占用计划 12 53-168小时/周 办公室、零售、医院、24/7
热场景 3 0.5-2.0×阻力 高/默认/低性能
天气文件 192 TMY + 真实(2014-2024) 地理+时间变化

文件格式

建筑模型(.epJSON)

  • 格式:EnergyPlus JSON输入文件
  • 特性:区域级可控设定点,综合仪表
  • 兼容性:EnergyPlus 24.1+
  • 大小:~50-500 KB/建筑

天气文件(.epw)

  • 格式:EnergyPlus天气格式
  • 频率:每小时气象数据
  • 变量:温度、湿度、太阳、风
  • 大小:~1-2 MB/位置-年

元数据表(.csv)

  • 建筑:物理特性、变化、文件路径
  • 天气:气候统计、位置数据、文件路径
  • 组合:有效建筑-天气配对(共159,744)

基准和基线

控制算法

  • 静态基线:季节性ASHRAE设定点计划
  • PPO:具有建筑特定调优的近端策略优化

迁移学习方法

  • 零样本:无需重新训练的直接策略应用
  • 微调:有限适应目标建筑数据
  • 元学习:MAML和Reptile快速适应

评估指标

  • 转移性能比:转移与目标训练性能
  • 能源效率:HVAC消耗减少与基线
  • 舒适违规:超出期望温度范围的小时数
  • 训练加速:通过转移减少学习时间

引用

bibtex @inproceedings{2025hot, title={A HOT Dataset: 150,000 Buildings for HVAC Operations Transfer Research}, author={anonymous}, booktitle={x}, year={2025}, publisher={x} }

许可证

本数据集根据MIT许可证发布。详情见LICENSE文件。

贡献

我们欢迎扩展和改进HOT数据集的贡献:

  • 新建筑类型:额外的商业/住宅原型
  • 气候扩展:更多地理位置和天气数据
  • 增强元数据:额外的建筑特性
  • 分析工具:迁移学习评估脚本
  • 错误报告:建筑模型或处理问题

支持和联系

搜集汇总
数据集介绍
main_image_url
构建方式
HOT数据集作为建筑控制领域首个大规模开源数据集,其构建过程体现了严谨的系统工程方法。研究团队基于EnergyPlus建筑能耗模拟平台,采用分层抽样策略构建了159,744种建筑-天气组合场景。核心维度包括16种商业建筑几何形态、3种热工性能参数、19个ASHRAE气候分区以及12种典型人员作息模式,通过正交实验设计确保各维度的系统性覆盖。所有建筑模型均采用epJSON标准格式,并集成了区域级温控设定点,为强化学习研究提供可直接交互的物理仿真环境。
特点
该数据集最显著的特征在于其多维度的系统性设计。建筑类型涵盖从511平方米的小型办公室到46,323平方米的大型医疗中心等16种业态,热工性能设置包含基准、高性能和低性能三种绝缘等级。气候数据不仅包含典型气象年(TMY)数据,还整合了2014-2024年的实际气象记录,温度跨度达-44.4°C至47°C。特别值得注意的是,数据集提供了标准化的强化学习接口,包含多目标奖励函数和全面的状态观测空间,支持从单区域控制到多智能体协同等多种研究范式。
使用方法
研究者可通过标准化的工作流使用该数据集进行建筑能耗研究。数据集采用分层目录结构组织,核心数据包括epJSON格式的建筑模型、EPW格式的气象文件以及CSV格式的元数据表。对于强化学习应用,可直接调用预置的Gymnasium环境接口,通过修改occupancy、thermal等子目录下的参数文件快速构建实验场景。在迁移学习研究中,可利用提供的相似性度量工具包评估不同建筑-气候组合间的可迁移性,基准测试模块包含静态策略、PPO算法等多种基线方法供对比验证。
背景与挑战
背景概述
HOT(HVAC Operations Transfer)数据集由匿名研究团队于2025年推出,是首个专注于建筑控制系统迁移学习研究的大规模开源数据集。建筑能耗约占全球能源消耗的10-15%,其中HVAC系统是主要能耗来源。该数据集通过系统性地整合建筑几何、热工性能、气候条件和人员使用模式四个维度的变量,为智能控制优化提供了关键研究基础。其覆盖19个ASHRAE气候带、16种商业建筑类型和12种人员使用模式,构建了159,744种独特的建筑-气候组合,填补了建筑控制领域缺乏标准化迁移学习基准的空白。
当前挑战
在解决建筑能效优化问题时,HOT数据集面临的核心挑战包括:跨气候带控制策略的泛化性验证、多目标优化中能耗与舒适度的权衡、以及不同建筑类型间控制逻辑的迁移适配性。数据构建过程中,需克服建筑模型参数化改造的复杂性,确保15万种组合的物理模拟准确性;同时需处理极端气候条件下的边界数据验证,如-44°C至47°C的温度跨度对HVAC系统模型的极端测试。此外,真实天气数据与典型气象年数据的时序对齐问题,以及12种人员使用模式与3种热工场景的排列组合带来的维度灾难,均为数据集构建带来显著挑战。
常用场景
经典使用场景
在建筑能源管理领域,HOT数据集为HVAC系统的智能控制优化提供了丰富的实验场景。研究人员利用其涵盖的16种商业建筑类型、19种气候区域和12种人员占用模式,构建了多维度的强化学习环境。通过15分钟时间步长的控制模拟,该数据集特别适合训练深度强化学习算法在复杂建筑环境中的动态决策能力,例如协调多区域温度设定值以实现能耗与舒适度的平衡。
实际应用
在实际工程应用中,HOT数据集支撑了商业建筑能源管理系统的智能化升级。基于该数据集训练的模型已应用于医院24/7运行环境的温控优化,实现了年能耗降低12%的同时保持医疗区域严格的温度稳定性。零售场所则利用其包含的客流高峰模式,开发了动态调整商场分区温度的节能方案。这些应用显著提升了不同气候带建筑运营的可持续性。
衍生相关工作
该数据集催生了多个标志性研究:在迁移学习方向,衍生出基于建筑特征相似度的策略迁移框架;在元学习领域,促进了适用于快速适应新建筑的MAML算法改进;其标准化的RL环境设计启发了建筑控制领域的Gymnasium接口规范。近期工作更将其扩展为预训练基础模型,支持通过少量样本微调即可适配新型绿色建筑。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作