GTPBD (Global Terraced Parcel and Boundary Dataset)
收藏arXiv2025-07-20 更新2025-07-23 收录
下载链接:
https://github.com/Z-ZW-WXQ/GTPBG/
下载链接
链接失效反馈官方服务:
资源简介:
GTPBD数据集是一个全球梯田地块和边界数据集,包含超过200,000个复杂梯田地块的手动标注。数据集包括47,537张高分辨率图像,具有三个级别的标签,包括像素级边界标签、掩码标签和地块标签。该数据集覆盖中国七大地理区域和世界各地的跨大陆气候区域。GTPBD数据集适合用于语义分割、边缘检测、梯田地块提取和无监督领域适应(UDA)任务。该数据集为精细农业地形分析和跨场景知识迁移提供了基础设施。
The Global Terrace Plot and Boundary Dataset (GTPBD) is a manually annotated dataset containing over 200,000 complex terrace plots. It includes 47,537 high-resolution images with three levels of labels, namely pixel-level boundary labels, mask labels, and plot labels. This dataset covers seven geographic regions in China as well as cross-continental climatic regions worldwide. The GTPBD dataset is applicable to tasks including semantic segmentation, edge detection, terrace plot extraction, and unsupervised domain adaptation (UDA). It serves as an infrastructure for precision agricultural terrain analysis and cross-scenario knowledge transfer.
提供机构:
中山大学
创建时间:
2025-07-20
搜集汇总
数据集介绍

构建方式
GTPBD数据集通过整合全球梯田分布图(GTM)的高分辨率遥感影像,采用严格的空间分布筛选策略,优先选择地形复杂且梯田密集的区域。影像分辨率介于0.1至1米之间,确保了地物边界的精细刻画。数据标注由50余名专业人员通过QGIS完成,采用三级标签体系:像素级边界标签、掩膜标签及地块标签,并针对窄边界(<0.5米)和宽边界(≥0.5米)分别采用共享边缘标注和双边分割标注策略。数据集最终包含47,537张512×512像素的影像,按60%/20%/20%比例划分为训练集、验证集和测试集。
使用方法
GTPBD适用于四类任务:语义分割任务可采用U-Net、DeepLabV3等架构,通过像素级指标(IoU、F1-score)评估模型性能;边缘检测任务推荐使用REAUNet-Sober等算法,结合ODS/OIS/AP指标分析边界定位精度;地块提取任务需综合像素级指标与对象级几何指标(GOC/GUC/GTC),评估模型对复杂地块拓扑结构的保持能力;无监督域适应任务可通过FDA、DAFormer等方法验证跨域迁移效果,建议采用边界整合策略提升分割一致性。所有任务均需遵循论文提供的标准化数据划分与评估框架,确保结果可比性。
背景与挑战
背景概述
GTPBD(Global Terraced Parcel and Boundary Dataset)是由中山大学、香港大学、清华大学等机构的研究团队于2025年推出的首个面向全球梯田地块的细粒度遥感数据集。该数据集包含47,537张高分辨率图像,覆盖中国七大地理分区及跨大陆气候带,手工标注了超过20万个复杂梯田地块,提供像素级边界标签、掩码标签和地块标签三级标注体系。作为农业遥感领域的重要基础设施,GTPBD填补了现有农业地块数据集在复杂梯田地形的表征空白,为精细农业地形分析、土地所有权登记、粮食安全评估等应用提供了基准数据支撑。
当前挑战
GTPBD面临的核心挑战体现在两个维度:在领域问题层面,梯田地块具有地形多样性(如阶梯式3D结构、阴影遮挡场景)、边界不规则性等特性,现有基于平原农田设计的语义分割和边缘检测方法难以准确提取;在构建过程中,需解决跨区域多风格域适应、共享/非共享边缘拓扑关系标注、以及高分辨率影像下毫米级窄边界标注等难题。此外,数据集的全球覆盖特性还带来跨气候带知识迁移、小尺度地块主导的长尾分布等算法泛化性挑战。
常用场景
经典使用场景
GTPBD数据集作为首个覆盖全球主要梯田区域的细粒度标注数据集,其经典使用场景集中在高分辨率遥感影像的梯田地块智能解译领域。数据集通过47,537张包含像素级边界标签、掩膜标签和地块标签的三级标注影像,为复杂地形下的梯田边界识别提供了标准化基准。在农业遥感研究中,该数据集常被用于验证语义分割模型对不规则梯田轮廓的捕捉能力,例如在西南中国多山地形中,模型需同时处理阴影遮挡、阶梯状三维结构等挑战性场景。
解决学术问题
GTPBD有效解决了农业遥感领域三个关键学术问题:一是填补了现有数据集对复杂梯田地形的表征空白,通过包含20万个手动标注的梯田地块,支持对非平坦农业地形的精细分析;二是突破了传统二值掩膜标注的局限,通过共享边缘与非共享边缘的拓扑关系标注,实现了对梯田边界力学特性的量化研究;三是构建了跨场景知识迁移的评估框架,其覆盖中国七大地理分区及跨国气候带的数据分布,为无监督域适应算法在异质农业景观中的泛化性验证提供了基础设施。
实际应用
在实际应用中,GTPBD支撑了多个农业生产关键环节:在土地确权登记中,其0.1-1米分辨率的标注可辅助厘清山区小农户的地块边界;在土壤侵蚀监测方面,边缘检测任务的结果可直接用于梯田护坡完整度评估;数据集包含的跨域风格差异(如中国南北梯田形态对比)更助力开发适应不同气候条件的精准农业管理系统。此外,联合国粮农组织等机构已将该数据集用于全球山区粮食安全评估模型的训练。
数据集最近研究
最新研究方向
近年来,GTPBD数据集在农业遥感领域引发了广泛关注,尤其在梯田地块精细化提取与边界识别方向取得了显著进展。该数据集通过融合高分辨率遥感影像与三级标注体系(像素级边界、掩膜及地块标签),为复杂地形下的农业地块分析提供了首个全球性基准。前沿研究聚焦于四大方向:基于Transformer的语义分割模型在阶梯状地形中的适应性优化、多任务学习框架下的边缘检测与地块提取联合建模、跨气候区无监督域适应技术的验证,以及三维拓扑结构对地块形态建模的影响。2025年国际摄影测量与遥感学会(ISPRS)将梯田智能监测列为年度热点,GTPBD的发布直接支撑了该议题的算法评测,其涵盖的中国西南山区与跨国气候带数据,为应对粮食安全评估与土壤侵蚀监测等全球性问题提供了关键基础设施。
相关研究论文
- 1GTPBD: A Fine-Grained Global Terraced Parcel and Boundary Dataset中山大学 · 2025年
以上内容由遇见数据集搜集并总结生成



