five

Building Data Genome Directory|建筑能源数据集|数据共享数据集

收藏
github2024-05-17 更新2024-05-31 收录
建筑能源
数据共享
下载链接:
https://github.com/buds-lab/building-data-directory
下载链接
链接失效反馈
资源简介:
Building Data Genome Directory是一个开放的数据共享平台,提供建筑能源研究所需的关键数据。它提供多种空间和时间尺度的有价值数据集,包括仪表、建筑级和社区级数据。这些数据集来自政府、研究机构和在线能源仪表板,用户还可以通过众包机制建议添加数据集。该目录支持建筑能源效率的研究和应用,对于解决全球能源和环境挑战至关重要。

The Building Data Genome Directory is an open data-sharing platform that provides essential data for building energy research. It offers valuable datasets across various spatial and temporal scales, including meter-level, building-level, and community-level data. These datasets are sourced from government entities, research institutions, and online energy dashboards. Users can also suggest the addition of datasets through a crowdsourcing mechanism. The directory supports research and applications in building energy efficiency, playing a crucial role in addressing global energy and environmental challenges.
创建时间:
2022-12-22
原始信息汇总

数据集概述

数据集名称

Building Data Genome Directory

数据集描述

Building Data Genome Directory 是一个开放的数据共享平台,专注于建筑能源研究的数据集。该平台提供多种空间和时间尺度的数据集,包括仪表级、建筑级和社区级数据。数据集总数为60个,来源包括政府、研究机构和在线能源仪表板。

数据集内容

  • 数据类别:包括多种数据类别,具体类型可在META DIRECTORY页面查看。
  • 数据筛选与可视化:在Building Energy and Water Data子页面中,用户可以通过左侧边栏进行数据筛选,并使用下方的可视化功能。

数据集用途

该数据集支持建筑能源效率的研究和应用,对于解决全球能源和环境挑战至关重要。

数据集贡献方式

用户可以通过众包机制建议新的数据集。

引用信息

  • 论文:Xiaoyu Jin et al. The Building Data Genome Directory – An open, comprehensive data sharing platform for building performance research. 2023 J. Phys.: Conf. Ser. 2600 032003. https://iopscience.iop.org/article/10.1088/1742-6596/2600/3/032003
  • 相关出版物:A review and reflection on open datasets of city-level building energy use and their applications. https://10.1016/j.enbuild.2023.112911
AI搜集汇总
数据集介绍
main_image_url
构建方式
Building Data Genome Directory 数据集的构建依托于一个开放的数据共享平台,该平台汇集了来自政府、研究机构及在线能源仪表盘的60个数据集。这些数据集涵盖了从仪表级到建筑级再到社区级的多尺度时空数据,为建筑能源研究提供了丰富的资源。通过众包机制,用户还可以推荐新的数据集,进一步丰富了数据集的内容和多样性。
特点
该数据集的显著特点在于其全面性和开放性。它不仅包含了多层次的建筑能源数据,还提供了可视化和过滤功能,便于用户快速定位所需信息。此外,数据集的开放共享模式鼓励了全球研究者的参与,推动了建筑能源效率研究的发展,为解决全球能源和环境问题提供了重要支持。
使用方法
用户可以通过访问buildingdatadirectory.org平台,利用左侧边栏选择所需的数据类别,或上传自己希望共享的数据集。平台提供了详细的过滤和可视化工具,帮助用户高效地浏览和分析数据。对于开发者,可以通过GitHub仓库中的Python文件进行二次开发,利用streamlit网页框架构建自定义的数据展示界面。
背景与挑战
背景概述
建筑能源研究领域长期以来面临着数据获取与共享的难题,而Building Data Genome Directory的诞生正是为了应对这一挑战。该数据集由Xiaoyu Jin等研究人员于2023年创建,旨在通过构建一个开放、全面的数据共享平台,为建筑能源研究提供丰富的数据资源。该平台汇集了来自政府、研究机构及在线能源仪表盘的60个数据集,涵盖了从仪表级到社区级的多尺度数据。其核心研究问题在于如何通过数据共享与整合,推动建筑能源效率的研究与应用,进而为全球能源与环境问题的解决提供支持。该数据集的发布不仅填补了建筑能源数据共享的空白,还为相关领域的研究者提供了宝贵的资源,极大地促进了建筑能源研究的进展。
当前挑战
尽管Building Data Genome Directory为建筑能源研究提供了丰富的数据资源,但其构建与应用过程中仍面临诸多挑战。首先,数据的多样性与复杂性使得数据的标准化与整合成为一大难题,尤其是在不同来源的数据格式与质量参差不齐的情况下。其次,数据的安全性与隐私保护问题也不容忽视,如何在开放共享的同时确保敏感信息的安全,是该平台必须解决的关键问题。此外,数据的实时更新与维护也是一个持续的挑战,尤其是在涉及多个数据源的情况下,如何确保数据的时效性与准确性至关重要。最后,如何通过可视化与分析工具,帮助研究者更高效地利用这些数据,也是该平台未来需要进一步优化的方向。
常用场景
经典使用场景
Building Data Genome Directory 数据集在建筑能源研究领域中被广泛应用于分析和优化建筑能效。该数据集涵盖了从仪表级到社区级的多尺度数据,为研究人员提供了丰富的数据资源。经典的使用场景包括建筑能耗模型的构建、能源使用模式的识别以及节能策略的评估。通过这些数据,研究者能够深入理解建筑能源系统的运行机制,从而提出有效的节能措施。
衍生相关工作
基于 Building Data Genome Directory 数据集,许多相关研究工作得以展开。例如,有研究者利用该数据集进行城市级建筑能耗的预测模型研究,进一步推动了智能城市的发展。此外,还有研究聚焦于数据集的开放性和可访问性,探讨了如何通过数据共享平台促进全球范围内的建筑能源研究合作。这些衍生工作不仅丰富了建筑能源研究的理论体系,也为实际应用提供了有力支持。
数据集最近研究
最新研究方向
在建筑能源研究领域,Building Data Genome Directory数据集的最新研究方向主要集中在通过大数据分析和机器学习技术,优化建筑能源使用效率。该数据集提供了多尺度、多层次的建筑能源数据,涵盖了从单个仪表到社区级别的详细信息,为研究者提供了丰富的数据资源。当前,研究者们正利用这些数据进行建筑能源模型的优化、能源消耗预测以及智能建筑系统的开发,以应对全球能源和环境挑战。此外,数据集的开放性和众包机制也促进了跨学科合作,推动了建筑能源研究的创新与发展。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

中国行政区划数据

本项目为中国行政区划数据,包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局,存储格式为sqlite3 db文件,支持直接使用数据库连接工具打开。

github 收录

LibriSpeech

LibriSpeech 是一个大约 1000 小时的 16kHz 英语朗读语音语料库,由 Vassil Panayotov 在 Daniel Povey 的协助下编写。数据来自 LibriVox 项目的已读有声读物,并经过仔细分割和对齐。

OpenDataLab 收录

NOAA ISD

NOAA ISD(Integrated Surface Database)是由美国国家海洋和大气管理局(NOAA)维护的一个全球气象数据集。该数据集包含了从全球各地气象站收集的气象观测数据,包括温度、湿度、风速、气压等气象参数。数据涵盖了从1929年至今的长时间跨度,是气象研究和气候分析的重要数据来源。

www.ncei.noaa.gov 收录

HyperGlobal-450K - 全球最大规模高光谱图像数据集

HyperGlobal-450K数据集由武汉大学联合国内外多所知名高校及研究机构共同构建,是迄今为止全球规模最大的高光谱图像数据集。该数据集包含约45万张高光谱图像,规模等价于超过2000万张不重叠的三波段图像,远超现有的同类数据集。数据集涵盖了全球范围内的高光谱遥感图像,包括来自地球观测一号(EO-1)Hyperion和高分五号(GF-5B)两种传感器的图像,光谱范围从可见光到短波及中波红外,具有从紫外到长波红外的330个光谱波段,空间分辨率为30米。每幅图像经过精心处理,去除了无效波段和水汽吸收波段,保留了具有实际应用价值的光谱信息。HyperGlobal-450K数据集不仅支持高光谱图像的基础研究,还能够用于开发和测试各种高光谱图像处理方法,比如图像分类、目标检测、异常检测、变化检测、光谱解混、图像去噪和超分辨率等任务。

github 收录