five

FarmSeg-VL

收藏
arXiv2025-03-29 更新2025-04-03 收录
下载链接:
https://doi.org/10.5281/zenodo.15099885
下载链接
链接失效反馈
资源简介:
FarmSeg-VL数据集是首个针对时空农田分割的细粒度图像-文本数据集,由中南大学地球科学与信息物理学院创建。该数据集覆盖了中国八个典型农业区域,包含四季的数据样本,具有明显的时空特性。数据集不仅涵盖了农田的固有属性、物候特征、空间分布、地形地貌以及周边环境的分布等丰富的时空特性,还为视觉语言模型在农田分割领域的应用研究提供了高质量的数据基础。

FarmSeg-VL is the first fine-grained image-text dataset for spatiotemporal farmland segmentation, created by the School of Geosciences and Info-Physics, Central South University. This dataset covers eight typical agricultural regions across China, includes four-season data samples, and exhibits distinct spatiotemporal characteristics. It not only encompasses rich spatiotemporal characteristics such as the inherent attributes, phenological features, spatial distribution, topography and surrounding environment distribution of farmlands, but also provides a high-quality data foundation for the application research of vision-language models in the field of farmland segmentation.
提供机构:
中南大学地球科学与信息物理学院
创建时间:
2025-03-29
AI搜集汇总
数据集介绍
main_image_url
构建方式
FarmSeg-VL数据集的构建采用了半自动标注方法,结合高分辨率遥感影像与精细化的文本描述。首先,通过Google卫星影像获取覆盖中国八大典型农业区域的0.5-2米分辨率影像,涵盖四季变化,总面积约4300平方公里。其次,基于对农田时空特性的分析,总结出形状、边界、物候特征等11类关键描述维度,并设计标准化文本模板。最后,通过集成Segment Anything Model(SAM)与标注工具LabelMe,实现掩膜与文本的半自动生成,显著提升标注效率与数据质量。
使用方法
该数据集支持视觉语言模型在农田分割任务中的训练与评估。用户可通过加载图像-掩膜-文本三元组数据,实现多模态联合学习。针对跨区域泛化研究,建议按农业分区划分训练集与测试集;对于时序分析,可利用季节标签构建动态预测任务。实验表明,基于FarmSeg-VL微调的模型在mIoU指标上较通用图文模型提升30%-40%,其开源地址为Zenodo平台(DOI:10.5281/zenodo.15099885)。
背景与挑战
背景概述
FarmSeg-VL是由中南大学地球科学与信息物理学院的陶超、钟丹丹、牟伟亮、杜卓菲和吴海阳团队于2025年推出的首个面向农田时空分割的大规模图文基准数据集。该数据集旨在突破传统标签驱动范式在表征农田元素空间关系及时空动态演化方面的局限性,通过引入结构化语言描述来显式表达农田的形状、分布及环境特征。数据集覆盖中国八大典型农业区的4300平方公里区域,包含四季变化的高分辨率影像(0.5-2米)及11类细粒度语义标注,填补了遥感领域缺乏农田专用图文数据集的空白。其半自动标注方法结合了SAM模型与人工验证,显著提升了标注效率与质量,为视觉语言模型在精准农业监测中的应用提供了重要基础。
当前挑战
在领域问题层面,传统农田分割面临三大核心挑战:1) 单一标签难以捕捉作物生长周期导致的季节性覆盖差异(完全覆盖/部分覆盖/无覆盖);2) 复杂地形引起的农田空间异质性(规则连片分布vs零散破碎分布);3) 农田与水体、建筑等周边要素的关联性建模不足。在构建过程中,团队需攻克:1) 跨区域农田形态多样性(东北平原规整田块vs云贵高原破碎梯田)的标准化表征;2) 多时相影像中物候特征(播种期/生长期/收获期)的语义对齐;3) 自动化标注工具对边界模糊农田(如与植被光谱相似)的识别精度问题。这些挑战通过半自动标注框架与多维度描述模板的创新设计得到有效缓解。
常用场景
经典使用场景
FarmSeg-VL数据集在农田分割领域具有广泛的应用价值,尤其在遥感图像分析和农业监测方面表现突出。该数据集通过结合图像和文本描述,为模型提供了丰富的语义信息,使其能够更准确地识别和分割农田区域。其高分辨率的图像和精细的标注使其成为农田分割任务的理想选择。
解决学术问题
FarmSeg-VL数据集解决了传统农田分割方法在时空异质性方面的局限性。传统方法仅依赖标签驱动的深度学习范式,难以捕捉农田的动态变化和复杂空间分布。FarmSeg-VL通过引入语言描述,帮助模型理解农田的形状、分布及其与周围环境的关系,从而显著提升了分割精度和模型的泛化能力。
实际应用
在实际应用中,FarmSeg-VL数据集可用于农业资源管理、精准农业和土地利用规划等领域。例如,政府部门可以利用该数据集监测农田变化,制定更科学的农业政策;农业企业可以通过分析农田数据优化作物种植和资源分配,提高农业生产效率。
数据集最近研究
最新研究方向
FarmSeg-VL数据集的推出标志着农田遥感领域向多模态融合分析的重要转型。该数据集通过整合高分辨率影像与结构化文本描述,突破了传统单标签驱动范式在时空异质性建模上的局限,其创新性体现在三个方面:首先,半自动标注框架实现了农田形状、物候特征与周边环境关系的细粒度语义关联,为视觉-语言模型提供了精准的跨模态对齐样本;其次,覆盖中国八大农业区四季数据的时空完备性,使模型能够捕捉作物轮作规律与地理分异特征,在东北平原集约型农田与云贵高原碎片化地块的跨区域迁移任务中表现出显著优势;最后,11类描述性关键词体系构建了农田语义知识图谱,推动研究焦点从单纯像元分类转向可解释的农业场景理解,近期已有学者基于该数据集开发出FSVLM等新型架构,在耕地非粮化监测和撂荒地识别等国家粮食安全应用中展现出重要价值。
相关研究论文
  • 1
    A large-scale image-text dataset benchmark for farmland segmentation中南大学地球科学与信息物理学院 · 2025年
以上内容由AI搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作