FarmSeg-VL

Name: FarmSeg-VL
Creator: 中南大学地球科学与信息物理学院
Published: 2025-03-29 22:55:46
License: 暂无描述

arXiv2025-03-29 更新2025-04-03 收录

下载链接：

https://doi.org/10.5281/zenodo.15099885

下载链接

链接失效反馈

官方服务：

资源简介：

FarmSeg-VL数据集是首个针对时空农田分割的细粒度图像-文本数据集，由中南大学地球科学与信息物理学院创建。该数据集覆盖了中国八个典型农业区域，包含四季的数据样本，具有明显的时空特性。数据集不仅涵盖了农田的固有属性、物候特征、空间分布、地形地貌以及周边环境的分布等丰富的时空特性，还为视觉语言模型在农田分割领域的应用研究提供了高质量的数据基础。

The FarmSeg-VL dataset is the first fine-grained image-text dataset dedicated to spatiotemporal farmland segmentation, developed by the School of Geosciences and Info-Physics at Central South University. This dataset spans eight typical agricultural regions across China, includes data samples collected across all four seasons, and exhibits distinct spatiotemporal characteristics. It not only encompasses a rich range of spatiotemporal attributes such as the inherent properties of farmland, phenological features, spatial distribution patterns, topography and geomorphology, as well as the distribution of surrounding environments, but also provides a high-quality data foundation for applied research on vision-language models in the field of farmland segmentation.

提供机构：

中南大学地球科学与信息物理学院

创建时间：

2025-03-29

搜集汇总

数据集介绍

构建方式

FarmSeg-VL数据集的构建采用了半自动标注方法，结合高分辨率遥感影像与精细化的文本描述。首先，通过Google卫星影像获取覆盖中国八大典型农业区域的0.5-2米分辨率影像，涵盖四季变化，总面积约4300平方公里。其次，基于对农田时空特性的分析，总结出形状、边界、物候特征等11类关键描述维度，并设计标准化文本模板。最后，通过集成Segment Anything Model（SAM）与标注工具LabelMe，实现掩膜与文本的半自动生成，显著提升标注效率与数据质量。

使用方法

该数据集支持视觉语言模型在农田分割任务中的训练与评估。用户可通过加载图像-掩膜-文本三元组数据，实现多模态联合学习。针对跨区域泛化研究，建议按农业分区划分训练集与测试集；对于时序分析，可利用季节标签构建动态预测任务。实验表明，基于FarmSeg-VL微调的模型在mIoU指标上较通用图文模型提升30%-40%，其开源地址为Zenodo平台（DOI:10.5281/zenodo.15099885）。

背景与挑战

背景概述

FarmSeg-VL是由中南大学地球科学与信息物理学院的陶超、钟丹丹、牟伟亮、杜卓菲和吴海阳团队于2025年推出的首个面向农田时空分割的大规模图文基准数据集。该数据集旨在突破传统标签驱动范式在表征农田元素空间关系及时空动态演化方面的局限性，通过引入结构化语言描述来显式表达农田的形状、分布及环境特征。数据集覆盖中国八大典型农业区的4300平方公里区域，包含四季变化的高分辨率影像（0.5-2米）及11类细粒度语义标注，填补了遥感领域缺乏农田专用图文数据集的空白。其半自动标注方法结合了SAM模型与人工验证，显著提升了标注效率与质量，为视觉语言模型在精准农业监测中的应用提供了重要基础。

当前挑战

在领域问题层面，传统农田分割面临三大核心挑战：1) 单一标签难以捕捉作物生长周期导致的季节性覆盖差异（完全覆盖/部分覆盖/无覆盖）；2) 复杂地形引起的农田空间异质性（规则连片分布vs零散破碎分布）；3) 农田与水体、建筑等周边要素的关联性建模不足。在构建过程中，团队需攻克：1) 跨区域农田形态多样性（东北平原规整田块vs云贵高原破碎梯田）的标准化表征；2) 多时相影像中物候特征（播种期/生长期/收获期）的语义对齐；3) 自动化标注工具对边界模糊农田（如与植被光谱相似）的识别精度问题。这些挑战通过半自动标注框架与多维度描述模板的创新设计得到有效缓解。

常用场景

经典使用场景

FarmSeg-VL数据集在农田分割领域具有广泛的应用价值，尤其在遥感图像分析和农业监测方面表现突出。该数据集通过结合图像和文本描述，为模型提供了丰富的语义信息，使其能够更准确地识别和分割农田区域。其高分辨率的图像和精细的标注使其成为农田分割任务的理想选择。

解决学术问题

FarmSeg-VL数据集解决了传统农田分割方法在时空异质性方面的局限性。传统方法仅依赖标签驱动的深度学习范式，难以捕捉农田的动态变化和复杂空间分布。FarmSeg-VL通过引入语言描述，帮助模型理解农田的形状、分布及其与周围环境的关系，从而显著提升了分割精度和模型的泛化能力。

实际应用

在实际应用中，FarmSeg-VL数据集可用于农业资源管理、精准农业和土地利用规划等领域。例如，政府部门可以利用该数据集监测农田变化，制定更科学的农业政策；农业企业可以通过分析农田数据优化作物种植和资源分配，提高农业生产效率。

数据集最近研究