TIERRAS数据集

Name: TIERRAS数据集
Creator: 伊利诺伊大学香槟分校土木与环境工程系
Published: 2025-10-22 23:10:13
License: 暂无描述

arXiv2025-10-22 更新2025-10-24 收录

下载链接：

http://www.arXiv.org/abs/2510.19664v1

下载链接

链接失效反馈

官方服务：

资源简介：

TIERRAS数据集是一个包含295条河流示踪剂测试突破曲线的数据集，这些数据来自25个不同地点的54次示踪剂实验。数据集涵盖了从小溪到大型河流的各种水体，流量范围为每秒0.002到7000立方米。数据集用于研究河流中营养物、污染物和其他物质的运输特性，通过示踪剂测试来分析物质的流速、在水中的扩散程度以及在河流停滞区域停留的持续时间。该数据集可用于建模和机器学习，帮助科学家深入了解物质在河流中的运输过程。

The TIERRAS Dataset is a collection of 295 river tracer test breakthrough curves, derived from 54 tracer experiments carried out at 25 distinct locations. This dataset encompasses a wide spectrum of water bodies, from small streams to large rivers, with discharge rates spanning from 0.002 to 7000 cubic meters per second. It is employed to research the transport properties of nutrients, pollutants and other substances in rivers, utilizing tracer tests to analyze the flow velocity of these materials, their diffusion within water, and their residence time in stagnant river regions. This dataset can be utilized for modeling and machine learning applications, aiding scientists in gaining in-depth insights into the transport processes of substances in rivers.

提供机构：

伊利诺伊大学香槟分校土木与环境工程系

创建时间：

2025-10-22

搜集汇总

数据集介绍

构建方式

在河流溶质输运研究领域，TIERRAS数据集的构建采用了基于拉普拉斯域解析解与数值反演相结合的前向求解方法。通过将控制方程转化为无量纲形式，利用拉普拉斯变换将偏微分方程转化为常微分方程，再通过de Hoog数值反演算法生成合成突破曲线。该方法通过参数先验分布采样（基于拉普拉斯域拟合和矩匹配的粗估计），构建了包含1000组参数组合的合成数据集，有效规避了高Peclet数下传统数值方法计算代价高昂的问题。

使用方法

数据集的应用基于DSTE-KL-PBI框架实现参数估计流程。首先将实测突破曲线通过最大后验估计嵌入K-L空间，随后在降维空间中通过投影重心插值法寻找最优参数：通过构建局部单纯形投影测量点，以投影距离最小化为目标函数优化对流速度，最终通过重心坐标插值获得无量纲参数估计。该框架支持合成数据集的重复利用，单次构建可适用于多条突破曲线的参数估计，显著降低了传统优化方法所需的前向求解次数。

背景与挑战

背景概述

TIERRAS数据集作为河流示踪剂实验的重要集合，由伊利诺伊大学厄巴纳-香槟分校与太平洋西北国家实验室的研究团队于2025年联合构建，聚焦于河流溶质运移过程的参数估计问题。该数据集整合了来自25条河流的54次示踪实验数据，涵盖295条突破曲线，通过耦合对流-弥散方程与固定相交换模型，深化了对河流中污染物迁移机理的理解。其创新性在于引入无量纲合成运输估计框架，显著提升了参数估计效率，为水文建模与机器学习应用提供了标准化基准，推动了环境流体力学领域的定量研究进展。

当前挑战

该数据集致力于解决河流溶质运移模型参数估计的复杂性挑战，包括突破曲线长尾效应的量化、固定相交换过程的数学表征，以及多尺度传输行为的统一描述。在构建过程中，面临实测数据稀疏性与噪声干扰的难题，需通过拉普拉斯域数值反演与无量纲化处理来平衡计算效率与精度。同时，异构河流环境下的参数空间高维特性，要求开发降阶建模与流形投影算法，以克服传统优化方法对初始值的敏感性问题，确保模型在非均匀流场中的物理一致性。

常用场景

经典使用场景

在河流溶质输运研究中，TIERRAS数据集通过整合54组示踪剂实验的295条穿透曲线，为验证一维对流-弥散方程及其扩展模型提供了标准化基准。该数据集通过拉普拉斯域解析解与数值反演技术生成高精度合成数据，支撑了包括瞬态存储模型、幂律记忆函数模型在内的多种输运机制研究。其经典应用体现在通过无量纲化处理实现参数解耦，显著降低了传统方法中速度与弥散系数估计的耦合误差，为河流中污染物迁移、养分循环等过程提供了可靠的数学表征基础。

解决学术问题

TIERRAS数据集有效解决了河流输运模型中参数估计的三大核心难题：首先通过无量纲合成数据框架消除了传统方法对初始猜测的敏感性，降低了模型误设带来的系统性偏差；其次利用卡亨-洛维展开技术将高维穿透曲线映射至低维空间，克服了时空数据稀疏性导致的过拟合问题；最后通过投影重心插值法实现了非均匀采样数据的鲁棒性参数反演，为量化河流中不动相交换速率、弥散强度等关键参数提供了理论工具，推动了水文地球化学过程机制的定量解析。

实际应用

该数据集在环境工程领域具有重要实践价值，其参数化成果可直接应用于河流污染应急响应系统。通过耦合水文监测数据与机器学习算法，能够实时预测突发污染事件中重金属、有机物的迁移轨迹与滞留时间。在生态修复方面，数据集揭示的不动相交换规律为人工湿地设计、河岸带生态缓冲区的空间配置提供了理论依据，同时支撑了流域尺度下氮磷营养盐输运通量的精准核算，助力于农业面源污染治理与水资源可持续管理策略的制定。

数据集最近研究