Unified Brazilian Rainfall Dataset (UNIPLU-BR)
收藏github2026-03-14 更新2026-03-17 收录
下载链接:
https://github.com/LARHENA/UNIPLU-BR
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是巴西第一个统一和标准化的全国点降水(非插值)数据库,整合了来自五个主要监测网络的原始数据:CEMADEN、INMET、ANA (Hidroweb)、Telemetria和ICEA。数据集覆盖了从1885年到2025年的数据,包含约22亿条降水记录,来自超过21,000个站点。数据集的主要贡献是通过严格的整理过程克服了巴西降雨数据的高度分散性问题,包括结构和名义标准化、时区调整以及时间分辨率统一。
This dataset is Brazil's first unified and standardized national in-situ (non-interpolated) precipitation database, integrating raw data from five major monitoring networks: CEMADEN, INMET, ANA (Hidroweb), Telemetria, and ICEA. Spanning data from 1885 to 2025, the dataset contains approximately 2.2 billion precipitation records sourced from over 21,000 monitoring stations. Its core contribution lies in resolving the severe fragmentation of Brazil's rainfall data via a rigorous curation workflow, which encompasses structural and nominal standardization, timezone alignment, and temporal resolution unification.
创建时间:
2026-03-12
原始信息汇总
UNIPLU-BR 数据集概述
数据集基本信息
- 数据集名称:Unified Brazilian Rainfall Dataset (UNIPLU-BR)
- 核心描述:巴西首个统一且标准化的国家级点降水(非插值)数据库,整合了来自五个主要监测网络的原始数据。
- 数据覆盖期:1885年至2025年。
- 数据总量:约22亿条降水记录。
- 监测站数量:超过21,000个站点。
- 时间分辨率:从10分钟间隔到1日分辨率不等。
数据来源
数据集整合了以下五个巴西主要监测网络的原始数据:
- CEMADEN(国家自然灾害监测与预警中心)
- INMET(国家气象研究所)
- ANA (Hidroweb)(国家水务局)
- Telemetria(水文监测遥测系统)
- ICEA(航空航天控制研究所)
数据源详情
各数据源的具体统计信息如下:
| 数据源 | 平均潜在年份数 | 站点数量 | 起始与结束年份 |
|---|---|---|---|
| CEMADEN | 7.99 | 5,061 | 2014 - 2025 |
| Hidroweb | 32.38 | 12,076 | 1885 - 2025 |
| ICEA | 33.19 | 183 | 1951 - 2025 |
| INMET daily | 45.03 | 627 | 1889 - 2025 |
| INMET sub-daily | 15.87 | 629 | 2000 - 2025 |
| Telemetria | 6.63 | 2,819 | 2014 - 2025 |
| 总计 | — | 21,386 | — |
主要贡献与处理
数据集通过严格的整理流程克服了巴西降水数据高度分散的问题:
- 结构与名称标准化:统一了列名、属性和存储格式,解决了同一机构内数据协议和格式的历史变更问题。
- 时区调整:根据站点地理位置(UTC偏移量)标准化时间戳。
- 数据质量声明:处理严格集中于结构标准化,未进行质量评估、物理一致性检查或异常值过滤。降水值保持各机构原始报告状态,仅组织为统一、可直接分析的结构。
数据访问与结构
- 存储格式:数据存储在ZIP压缩文件中,每个ZIP文件内部包含两个Parquet格式文件。
- 文件内容:
table_info.parquet:站点元数据。table_data.parquet:降水时间序列数据。
- 访问优势:可使用Python或R直接从内存读取数据,无需手动解压到磁盘,节省存储空间并加速自动化工作流处理。
- 关联键:
gauge_code(站点代码)是连接元数据与测量数据的主键。
数据表结构
1. 雨量站信息表 (table_info)
此数据框包含每个监测点的静态特征,作为站点的“身份证明”。
| 列名 | 描述 |
|---|---|
| gauge_code | 唯一站点标识符(ID),用于链接到table_data |
| city / state | 站点的行政位置(例如:João Pessoa, PB) |
| lat / long | 十进制度的地理坐标 |
| elevation | 站点海拔高度(米) |
| time_step | 数据的估计时间分辨率(1440分钟 = 24小时/日) |
| network | 数据网络来源(例如:Hidroweb) |
| responsible | 负责运营的机构(ANA 或 SGB-CPRM) |
| utc | 相对于格林威治子午线的本地时区(巴西利亚时间为-3) |
2. 时间序列表 (table_data)
此表记录降水测量值。
| 列名 | 描述 |
|---|---|
| gauge_code | 唯一站点标识符(ID),用于链接到table_info |
| datetime | 读数的日期和时间 |
| rain_mm | 该时间间隔内记录的降水量,单位为毫米(mm) |
辅助资源
- 脚本示例:访问和过滤数据以及生成图表的脚本示例可在以下链接找到:https://github.com/LARHENA/UNIPLU-BR/blob/main/Scripts%20UNIPLU-BR.ipynb
- 可视化图表:
- 巴西不同数据源的雨量站空间分布图:https://github.com/LARHENA/UNIPLU-BR/blob/main/img/Imagem1.jpeg?raw=true
- 1855年至2025年巴西可用雨量站数量的时间演变图:(顶部)日分辨率站点;(底部)次日分辨率站点:https://github.com/LARHENA/UNIPLU-BR/blob/main/img/Imagem2.jpeg?raw=true
引用方式
- Das Neves Almeida, C., Francis Bertrand, G., Carvalho Lemos, F., da Silva Freitas, E., Lins Silva, A., Vidal Barbosa, J. L., ... & Coelho, V. H. R. (2025). The design of the Brazilian Sub-Daily Rainfall dataset (BR-SDR): two decades of high-time-resolution data in Brazil. Hydrological Sciences Journal, 70(11), 1850-1862. https://doi.org/10.1080/02626667.2025.2506193
- Lemos, F. C., Freitas, E. S., Coelho, V. H. R., Reis Júnior, D. S., Patriota, E. G., Meira, M. A., Vidal-Barbosa, J. L., Claudino, C. M. A., Silva, G. S., Nascimento, D. C., Ramos Filho, G. M., Cunha, A. P. M. A., Alves, L. G. S., Zeri, L. M. M., Ribeiro Neto, G. G., Bertrand, G. F., Tomasella, J., Souza, S. A., Araújo, A. A., Rampinelli, C. G., & Almeida, C. N. (2026). Unified Brazilian Rainfall Dataset (UNIPLU-BR): A Standardized National Database of Point Precipitation from Major Brazilian Monitoring Networks [Data set]. Zenodo. https://doi.org/10.5281/zenodo.18883358
搜集汇总
数据集介绍

构建方式
在巴西降水监测领域,数据长期分散于多个机构,格式各异,为系统性研究带来挑战。UNIPLU-BR数据集通过整合五个主要监测网络(CEMADEN、INMET、ANA、Telemetria、ICEA)的原始降水记录,构建了首个全国统一的点降水数据库。构建过程侧重于结构标准化,包括统一列名、属性与存储格式,并依据测站地理位置调整时区,将时间戳标准化为UTC偏移。数据时间跨度自1885年至2025年,涵盖从10分钟间隔到日分辨率的多尺度记录,所有降水值均保留机构原始报告,未进行质量评估或异常值过滤,从而在保持数据原始性的前提下,提供了可直接用于分析的结构化框架。
特点
该数据集以其时间跨度之长、空间覆盖之广、记录规模之大而著称,收录了来自超过2.1万个测站的约22亿条降水记录。其中部分测站拥有超过一个世纪的连续历史序列,为长期气候趋势分析提供了珍贵基础。数据具有多样化的时间分辨率,从10分钟高频率观测到24小时累计值,能够支持从短时强降水事件分析到长期水文循环研究的多种科学需求。数据集通过测站代码(gauge_code)作为主键,将测站元数据与时间序列数据紧密关联,确保了数据的一致性与可追溯性,其全国范围的空间分布也为区域气候差异性研究奠定了数据基石。
使用方法
数据集以压缩ZIP文件形式提供,内含Parquet格式的元数据表(table_info)与时间序列表(table_data)。用户可通过Python或R等工具直接从内存读取数据,无需解压至本地磁盘,这显著优化了存储效率与自动化流程的处理速度。元数据表包含测站代码、地理位置、海拔、时间分辨率、数据来源等静态信息,而时间序列表则记录了具体的降水测量值与对应时间戳。研究人员可依据测站代码关联两表,进行时空筛选、统计分析或可视化制图。项目提供的示例脚本详细展示了数据访问、过滤及绘图的具体操作,为高效利用这一标准化数据库提供了实用指南。
背景与挑战
背景概述
降水数据是水文气象研究的基础,对于理解区域气候模式、水资源管理及自然灾害预警至关重要。巴西作为地域辽阔的热带国家,其降水监测长期面临数据来源分散、标准不一的困境。Unified Brazilian Rainfall Dataset (UNIPLU-BR) 由巴西国家自然灾害监测预警中心(CEMADEN)、国家气象研究所(INMET)等多家机构的研究团队于2026年联合构建,旨在整合1885年至2025年间五大监测网络的原始降水记录,形成首个全国统一且标准化的点降水数据库。该数据集涵盖超过2.2亿条记录、2.1万个站点,时间分辨率从10分钟至日尺度不等,为巴西降水时空特征分析、极端事件研究及水文模型校准提供了前所未有的数据支撑,显著提升了该国降水数据的可用性与可比性。
当前挑战
在降水数据领域,构建高质量、长时序的统一数据集面临多重挑战。UNIPLU-BR 致力于解决巴西降水数据高度碎片化的问题,其核心挑战在于整合不同机构在百余年间采用各异的数据协议、存储格式与时间标准,例如各网络列名、属性及时间戳的异构性。在构建过程中,研究团队需克服历史数据格式变迁、时间带不一致以及记录缺失等困难,通过结构标准化与名义统一化实现数据融合。然而,该数据集目前仅完成结构整合,未进行物理一致性检验或异常值过滤,原始数据中的质量不确定性依然存在,这为后续研究中的数据质量控制提出了持续挑战。
常用场景
经典使用场景
在气候与水文学研究中,巴西降雨数据集(UNIPLU-BR)为分析长期降水模式提供了关键支撑。该数据集整合了跨越一个多世纪的站点记录,时间分辨率涵盖十分钟至日尺度,使得研究者能够深入探究降雨的时空变异特征。经典应用场景包括评估极端降水事件的频率与强度,识别区域气候趋势,以及验证水文模型的输入数据,为理解巴西复杂的气候系统奠定了数据基础。
衍生相关工作
基于该数据集,研究团队衍生出一系列经典工作,例如开发了巴西日降雨网格化数据产品(BRain-D)与卫星-机器学习融合的月降雨产品(IMERG BraMaL)。这些工作进一步拓展了数据在空间插值、质量控制和多源数据融合方面的应用。相关研究还深入分析了热带大气系统下的降水特征,并评估了多种卫星降水产品在极端事件刻画中的性能,推动了区域水文气象学的方法创新。
数据集最近研究
最新研究方向
在气候水文科学领域,巴西降雨数据的长期整合与分析对于理解区域水循环及极端天气事件至关重要。UNIPLU-BR数据集作为首个全国性标准化点降水数据库,其覆盖从1885年至2025年的超长时序记录,为前沿研究提供了前所未有的数据基础。当前研究聚焦于利用该数据集的高时空分辨率特性,深入探究热带大气系统下降雨事件的精细化时空分布规律,并评估卫星降水产品在巴西极端降雨表征中的性能。结合机器学习技术,学者们正致力于开发改进的网格化降雨产品,以提升降雨监测与洪水灾害阈值划定的准确性。这些工作不仅推动了巴西本土水文气象研究的深化,也为全球热带地区的降雨数据标准化与灾害预警体系建设提供了重要参考。
以上内容由遇见数据集搜集并总结生成



