HOT
收藏HOT数据集:HVAC操作迁移
概述
HOT(HVAC Operations Transfer)数据集是首个专为建筑控制系统迁移学习研究设计的大规模开源数据集。建筑通过HVAC系统消耗全球约10-15%的能源,智能控制优化对能源效率和气候变化缓解至关重要。
关键统计
- 159,744 种独特的建筑-天气组合
- 15,808 个具有可控区域设定点的建筑模型
- 19 个ASHRAE气候区覆盖 76 个全球位置
- 16 种商业建筑类型(办公室、零售、学校、医院等)
- 12 种系统占用模式
- 3 种热性能场景
- 15分钟 时间步分辨率用于控制应用
数据集描述
HOT通过四个关键维度的系统变化解决了建筑控制迁移学习中的关键基础设施差距:
🏢 建筑几何(16种类型)
- 办公室:小型(511 m²)、中型(4,983 m²)、大型(46,323 m²)
- 零售:独立(2,294 m²)、带状商场(2,294 m²)
- 教育:小学(6,874 m²)、中学(19,592 m²)
- 医疗:医院(22,443 m²)、门诊(3,805 m²)
- 酒店:小型酒店(3,726 m²)、大型酒店(11,349 m²)
- 住宅:中层公寓(2,825 m²)、高层公寓(7,063 m²)
- 餐饮:堂食餐厅(511 m²)、快餐(232 m²)
- 工业:仓库(4,835 m²)
🌡️ 热性能(3种场景)
- 默认:基线热性能(R_mult = 1.0)
- 高性能:增强绝缘(R_mult = 2.0,U_mult = 0.5)
- 低性能:最小绝缘(R_mult = 0.5,U_mult = 2.0)
🌍 气候条件(76个位置)
- 完整ASHRAE覆盖:所有19个气候区(0A至8)
- 全球多样性:从热带(胡志明市)到亚北极(费尔班克斯)
- 天气数据类型:TMY(典型气象年)+ 真实历史(2014-2024)
- 温度范围:-44.4°C至47.0°C
- HDD范围:0至7,673加热度日
- CDD范围:6至4,301冷却度日
👥 占用模式(12种计划)
- 标准:传统办公时间(工作日8 AM - 5 PM)
- 低/高占用:50%/150%强度变化
- 轮班操作:早班(6 AM-3 PM)、晚班(2 PM-11 PM)
- 行业特定:零售(10 AM-9 PM)、学校(7 AM-4 PM + 晚间)
- 医疗:医院24/7轮班模式
- 现代工作:灵活混合与错开时间
- 专业:健身房(早/晚高峰)、仓库物流
- 连续:24/7操作
数据集结构
HOT/ ├── data/ │ ├── base/ # 按几何类型分类的原始建筑模型 │ ├── processed/ # 用于控制的处理过的EPJSON文件 │ ├── variations/ # 建筑变化 │ │ ├── occupancy/ # 占用计划变化 │ │ ├── thermal/ # 热性能变化 │ │ └── combined/ # 多变量组合 │ ├── weather/ # 天气数据文件(.epw) │ └── tables/ # 数据集元数据和组合
关键特性
🎮 强化学习准备
- 可控设定点:区域级加热/冷却温度控制
- Gymnasium接口:标准RL环境包装器
- 全面状态空间:区域温度、室外条件、能耗
- 多目标奖励:能源效率+热舒适+控制稳定性
- EnergyPlus集成:基于物理的建筑模拟
🔬 迁移学习框架
- 相似性度量:跨4个维度的定量兼容性评估
- 零样本评估:无需重新训练的直接策略转移
- 系统变化:单变量和多变量转移场景
- 基准协议:标准化评估方法
🌐 全球气候覆盖
- 所有居住区:完整的ASHRAE气候区表示
- 真实与合成:TMY基线+历史天气变化
- 极端条件:从亚北极(-44°C)到沙漠(+47°C)
- 转移分析:气候适应和地理部署
📊 研究基础设施
- 标准化格式:一致的EnergyPlus epJSON结构
- 处理管道:自动化建筑修改工具
- 验证工具:建筑模型验证和测试
- 相似性分析:转移可行性评估工具包
研究应用
🤖 强化学习
- 多代理控制:协调多个HVAC区域
- 元学习:快速适应新建筑(MAML,Reptile)
- 基础模型:预训练多样建筑类型
- 安全RL:具有舒适保证的约束感知控制
🔄 迁移学习
- 领域适应:地理和气候转移
- 少样本学习:最小数据适应新建筑
- 跨建筑泛化:跨原型的策略转移
- 相似性引导选择:最佳源建筑识别
📈 建筑分析
- 能源基准测试:跨气候性能比较
- 占用分析:使用模式对能耗的影响
- 围护结构优化:热性能敏感性分析
- 气候韧性:建筑对变化条件的适应
数据集统计
| 维度 | 数量 | 范围 | 示例 |
|---|---|---|---|
| 建筑类型 | 16 | 232-46,323 m² | 办公室、医院、学校 |
| 气候区 | 19 | -44°C至+47°C | 0A(热带)至8(亚北极) |
| 占用计划 | 12 | 53-168小时/周 | 办公室、零售、医院、24/7 |
| 热场景 | 3 | 0.5-2.0×阻力 | 高/默认/低性能 |
| 天气文件 | 192 | TMY + 真实(2014-2024) | 地理+时间变化 |
文件格式
建筑模型(.epJSON)
- 格式:EnergyPlus JSON输入文件
- 特性:区域级可控设定点,综合仪表
- 兼容性:EnergyPlus 24.1+
- 大小:~50-500 KB/建筑
天气文件(.epw)
- 格式:EnergyPlus天气格式
- 频率:每小时气象数据
- 变量:温度、湿度、太阳、风
- 大小:~1-2 MB/位置-年
元数据表(.csv)
- 建筑:物理特性、变化、文件路径
- 天气:气候统计、位置数据、文件路径
- 组合:有效建筑-天气配对(共159,744)
基准和基线
控制算法
- 静态基线:季节性ASHRAE设定点计划
- PPO:具有建筑特定调优的近端策略优化
迁移学习方法
- 零样本:无需重新训练的直接策略应用
- 微调:有限适应目标建筑数据
- 元学习:MAML和Reptile快速适应
评估指标
- 转移性能比:转移与目标训练性能
- 能源效率:HVAC消耗减少与基线
- 舒适违规:超出期望温度范围的小时数
- 训练加速:通过转移减少学习时间
引用
bibtex @inproceedings{2025hot, title={A HOT Dataset: 150,000 Buildings for HVAC Operations Transfer Research}, author={anonymous}, booktitle={x}, year={2025}, publisher={x} }
许可证
本数据集根据MIT许可证发布。详情见LICENSE文件。
贡献
我们欢迎扩展和改进HOT数据集的贡献:
- 新建筑类型:额外的商业/住宅原型
- 气候扩展:更多地理位置和天气数据
- 增强元数据:额外的建筑特性
- 分析工具:迁移学习评估脚本
- 错误报告:建筑模型或处理问题
支持和联系
- 讨论:Hugging Face Discussions
- 电子邮件:目前匿名




