five

Arctic Permafrost Fraction Dataset

收藏
arXiv2025-10-03 更新2025-11-20 收录
下载链接:
https://github.com/sparcus-technologies/Arctic25
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集名为“北极多年冻土分数数据集”,由香港科技大学计算机科学与工程系Boris Kriuk教授团队创建。数据集包含了自2005年至2021年,来自171605个北极地区不同地点的2917285条观测数据。该数据集整合了多年冻土分数估计值与气候再分析数据,实现了对环境与多年冻土之间关系的详细描述。数据集的创建旨在为北极基础设施风险评估提供支持,并为未来的研究提供数据基础。

This dataset is named the Arctic Permafrost Fraction Dataset, developed by the team led by Professor Boris Kriuk from the Department of Computer Science and Engineering at the Hong Kong University of Science and Technology. It contains 2,917,285 observational records collected from 171,605 distinct locations across the Arctic region between 2005 and 2021. This dataset integrates permafrost fraction estimates and climate reanalysis data, enabling detailed characterization of the relationship between the environment and permafrost. It was developed to support risk assessment for Arctic infrastructure and provide a foundational data resource for future research.
提供机构:
香港科技大学计算机科学与工程系
创建时间:
2025-10-03
搜集汇总
数据集介绍
main_image_url
构建方式
北极多年冻土覆盖率数据集的构建采用了融合物理机制与机器学习的创新方法,通过整合2005至2021年间来自171,605个空间位置的291万条观测记录,实现了对北极俄罗斯全域的时空连续覆盖。该数据集以多年冻土比例为核心指标,结合气候再分析数据,采用空间分组交叉验证与时间序列严格分割的双重验证机制,有效防止了数据泄漏问题。在特征工程层面,构建了包含温度阈值指标、能量平衡代理变量及滞后气候因子在内的38个物理启发式特征,为模型提供了超越传统统计关系的冻土演化动力学表征。
特点
本数据集最显著的特征在于其前所未有的时空尺度与数据质量,覆盖北极地区60°N至82°N的完整冻土梯度带,每个空间位置均包含连续17年的年度观测序列。数据呈现典型的双峰分布特征,既包含接近0%的南部过渡带冻土边缘区,也涵盖接近100%的连续冻土区,准确反映了冻土分布的空间异质性。数据集通过严格的物理合理性检验,所有冻土比例值均处于0-100%的合理区间,气候变量范围符合北极环境特征,缺失值比例低于1%,确保了数据的科学可靠性。
使用方法
该数据集可通过堆叠集成模型框架进行多场景应用,用户首先需加载包含空间坐标、时间戳及气候变量的标准化数据表。在预测阶段,模型支持三种典型浓度路径情景的冻土演化模拟,通过温度扰动与物理调整因子的耦合运算,生成未来十年尺度的冻土比例变化投影。对于基础设施风险评估,系统内置基于分位数的三级分类机制,结合当前冻土状态、预测退化幅度及空间不确定性图谱,自动生成风险等级分布图。所有分析工具均通过开源平台发布,支持工程规范制定与气候适应策略的定量评估。
背景与挑战
背景概述
北极多年冻土组分数据集由香港科技大学计算机科学与工程系的Boris Kriuk团队于2022年主导创建,聚焦于北极地区基础设施风险评估这一关键科学问题。该数据集整合了2005至2021年间171,605个地理位置的291万条观测记录,融合了多年冻土覆盖率与气候再分析数据,标志着全球验证规模最大的多年冻土机器学习数据集诞生。其核心研究目标在于突破传统评估方法在时空验证、不确定性量化及决策支持方面的局限,为北极地区价值超千亿美元的基础设施提供科学依据,推动气候变化适应策略的制定。
当前挑战
在解决北极基础设施风险评估领域问题时,该数据集面临两大核心挑战:其一,传统机器学习方法在气候情景外推中存在物理约束缺失的局限性,可能导致超越历史训练条件的预测失真;其二,构建过程中需克服时空数据泄露风险,通过空间分组交叉验证与时间序列严格分离的机制确保模型泛化能力。此外,海量异构数据的整合与质量控制、多模型堆叠架构的优化,以及物理机制与数据驱动方法的有效融合,共同构成了数据集构建的技术壁垒。
常用场景
经典使用场景
在北极多年冻土研究领域,该数据集通过整合290万条观测记录与气候再分析数据,构建了混合物理-机器学习框架,为冻土退化预测提供了前所未有的空间覆盖。其经典应用体现在利用堆叠集成模型对171,605个地理点位进行时空交叉验证,精准量化了多年冻土分数随温度变化的非线性响应,成为评估北极基础设施稳定性的核心工具。
实际应用
基于数据集的预测成果已直接应用于北极地区重大基础设施的适应性规划,包括油气管道、铁路网络与社区建筑的冻土灾害评估。通过生成空间显式风险等级图谱,该框架为工程设计规范提供了量化依据,帮助决策者在RCP8.5情景下识别出占北极俄罗斯51.5%的高风险区域,支撑了百亿美元级资产的气候韧性战略制定。
衍生相关工作
该数据集催生了多学科交叉研究,包括融合CMIP气候模型集合的动态预测系统、结合热传导物理的混合建模框架,以及基于贝叶斯深度学习的不确定性分解方法。其开源架构促进了冻土碳循环模拟、活动层厚度反演等衍生研究,为极地地球系统科学建立了可扩展的数据-模型耦合范式。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作