AguaTrack-ARCO-SA

Hugging Face2026-04-29 更新2026-04-30 收录

下载链接：

https://huggingface.co/datasets/AguaTrackSA/AguaTrack-ARCO-SA

下载链接

链接失效反馈

官方服务：

资源简介：

WAM2Layers Zarr Store 是一个采用二进制 Zarr v3 格式存储的数据集，可通过 `xarray` 和 `HfFileSystem` 工具进行访问，并托管在 HuggingFace Hub 上。数据集包含2019年的数据文件，但具体内容（如变量、空间覆盖范围、时间分辨率）、规模（如数据量大小）、采集背景、研究目的以及适用任务（如气候分析或机器学习应用）等信息在README中未明确说明。

WAM2Layers Zarr Store is a dataset stored in binary Zarr v3 format, accessible via `xarray` and `HfFileSystem`, and hosted on HuggingFace Hub. It includes data files for the year 2019, but details such as specific content (e.g., variables, spatial coverage, temporal resolution), scale (e.g., data volume), background, purpose, and applicable tasks (e.g., climate analysis or machine learning applications) are not specified in the README.

创建时间：

2026-04-28

原始信息汇总

根据您提供的数据集详情页面信息，以下是对数据集的总结：

数据集概述

数据集名称：WAM2Layers Zarr Store（AguaTrack-ARCO-SA）

数据集地址：https://huggingface.co/datasets/AguaTrackSA/AguaTrack-ARCO-SA

数据格式

采用 Zarr v3 二进制格式存储。

访问方式

数据集通过 Hugging Face 的 HfFileSystem 结合 xarray 进行访问，无需下载整个数据集即可读取数据。

使用示例

以下为推荐的 Python 代码示例，用于加载 2019 年的每日数据：

python from huggingface_hub import HfFileSystem import xarray as xr

fs = HfFileSystem() store = fs.get_mapper("datasets/AguaTrack/AguaTrack-ARCO-SA/AguaTrack_ARCO_SA_daily/2019.zarr") ds = xr.open_zarr(store, consolidated=False)

AguaTrack-ARCO-SA数据集基于WAM2Layers模型框架构建，采用二进制的Zarr v3格式存储，以优化大规模时空数据的读写效率。该数据集聚焦于南美洲区域，以日尺度为时间分辨率，将气象与水文学变量组织为层次化的Zarr存储库。为便于分布式访问，数据集利用Hugging Face的HfFileSystem实现云端映射，用户无需下载完整数据即可按需加载特定时间切片或空间子集，显著降低了本地存储与计算负担。

特点

该数据集的核心特色在于其高效的云端分析就绪（ARCO）架构，通过Zarr v3格式与分块存储策略，支持对长时间序列变量进行快速子集化与并行计算。数据覆盖南美洲关键水文气象要素，如降水、蒸散发及水汽通量等，可无缝对接WAM2Layers水汽追踪模型。其设计兼顾了科学研究的可重复性与数据共享的便捷性，尤其适合需要频繁迭代或跨区域对比的水循环研究场景。

使用方法

用户可通过Python生态中的xarray库直接访问该数据集，核心步骤为：首先利用HfFileSystem建立与Hugging Face数据仓库的安全连接，随后通过get_mapper方法指向指定年份（如2019年）的Zarr存储路径。最后调用xarray的open_zarr函数并禁用consolidated参数以兼容v3格式，即可将数据加载为xarray Dataset对象，支持后续的统计计算、可视化或模型输入等操作。

背景与挑战

背景概述

在全球水资源日益紧张的背景下，精准的水文数据对于理解水循环、气候变化及农业灌溉调度具有关键作用。AguaTrack-ARCO-SA 数据集由 AguaTrack 研究团队创建，旨在提供高时间分辨率的南美洲区域水汽追踪分析数据。该数据集基于 WAM2Layers 模型生成，以 Zarr v3 格式存储，支持通过 xarray 和 HfFileSystem 高效访问。自发布以来，它已成为气候和水文学领域研究大气水汽输送、降水来源及干旱评估的重要资源，推动了区域水文气候学的定量化进程。

当前挑战

该数据集面临的首要挑战在于所解决的领域问题——如何精确量化大气水汽的源汇关系，以支撑旱涝事件的成因解析与水资源管理决策。传统气象观测难以直接追踪水汽路径，而 AguaTrack-ARCO-SA 通过数值模拟弥补了这一空白，但模型依赖大气再分析资料，其不确定性对结果精度构成制约。构建过程中，团队需处理海量气象场数据的存储与分发，选择 Zarr v3 格式虽利于云端读取，但跨区域大范围数据的读写性能优化与版本控制仍是持续挑战，尤其在高频次数据更新时需确保数据一致性与访问效率。

常用场景

经典使用场景

AguaTrack-ARCO-SA数据集专为水文与气候研究领域设计，其核心应用在于追踪大气中的水汽来源与路径。通过分析该数据集提供的逐日大气再分析数据，研究者能够揭示区域尺度水循环的动态机制，例如结合水汽轨迹追踪模型WAM2Layers，量化蒸散发对降水贡献的时空格局。该数据集以Zarr格式存储高效的时间序列，支持长周期水循环要素的批量计算与可视化，是理解南美洲水文气候系统不可或缺的基石。

衍生相关工作

该数据集衍生了一系列关键的学术成果，包括基于WAM2Layers框架改进的水汽源汇诊断方法，以及结合机器学习的降水可预测性研究。经典工作如使用AguaTrack数据验证了拉普拉塔河流域的降水再循环率，并建立了水汽贡献度与厄尔尼诺事件的相关模型。后续研究进一步扩展至不同时间尺度（如季节内振荡）的水汽路径聚类分析，推动了大尺度环流与局地水文过程耦合的定量化研究，成为南美水文气候学领域的标杆性工作。

数据集最近研究

AguaTrack-ARCO-SA

数据集概述

数据格式

访问方式

使用示例

标签