five

Fields of The World (FTW) |农业监测数据集|地理空间分析数据集

收藏
arXiv2024-09-24 更新2024-09-25 收录
农业监测
地理空间分析
下载链接:
https://github.com/fieldsoftheworld/ftw-baselines
下载链接
链接失效反馈
资源简介:
Fields of The World (FTW)数据集由亚利桑那州立大学、微软AI for Good研究实验室、泰勒地理空间研究所和华盛顿大学联合创建,旨在推动全球农业田块边界的自动提取技术。该数据集覆盖了24个国家,横跨欧洲、非洲、亚洲和南美洲四大洲,是一个前所未有的大规模、多样化农业领域实例分割的基准数据集。FTW数据集包含70,462个样本,每个样本均包含有实例和语义分割掩码,与多时相、多光谱的Sentinel-2卫星图像相匹配。数据集的规模是以往任何类似数据集的十倍,覆盖了166,293平方千米的地理区域。创建过程中,研究团队从政府数据库、已发表文献和网站等来源进行了全面的搜索,以确保数据集具有全球多样性和高质量。此数据集不仅为农业监测和评估提供了基础数据支持,还对可持续发展、土地管理、气候变化政策和项目具有重要意义。它能够促进不同建模方法的一致性评估,并为下游用户提供了现实场景相关的真实世界基准任务。
提供机构:
亚利桑那州立大学等
创建时间:
2024-09-24
AI搜集汇总
数据集介绍
main_image_url
构建方式
Fields of The World (FTW) 数据集的构建基于全球24个国家的农业田地边界数据,涵盖欧洲、非洲、亚洲和南美洲四个大洲。数据集的构建过程包括从政府数据库、已发表文献和其他网站中广泛搜集田地多边形数据,确保数据的地理多样性、高质量和可重复使用性。此外,数据集还采用了多光谱Sentinel-2卫星图像,每条记录包含实例和语义分割掩码,并与多日期、多光谱图像配对。数据集的标注采用fiboa规范,确保了数据的标准化和互操作性。
特点
FTW数据集的一个显著特点是其广泛的地理覆盖和多样性,涵盖了24个国家的农业田地边界,远超以往的数据集。此外,FTW数据集的规模也大幅超越了现有的同类数据集,包含70,462个样本,覆盖总面积达166,293平方公里。数据集不仅在地理多样性上有所突破,还在田地形态、农业实践和气候模式上展现了极大的多样性,为机器学习模型提供了丰富的训练数据。
使用方法
FTW数据集适用于农业田地实例分割的机器学习任务,用户可以通过提供的多光谱Sentinel-2卫星图像和相应的分割掩码进行模型训练和评估。数据集提供了训练、验证和测试集,支持用户在不同国家尺度上进行评估。此外,数据集还提供了详细的元数据,用户可以根据需要轻松地对数据进行子集划分。FTW数据集的代码和预训练模型可通过GitHub和TorchGeo获取,方便用户进行进一步的研究和应用开发。
背景与挑战
背景概述
Fields of The World (FTW) 数据集由亚利桑那州立大学、微软AI for Good研究实验室等多个机构的研究人员共同创建,旨在解决全球农业领域中农田边界自动分割的挑战。该数据集涵盖了24个国家的农田数据,跨越欧洲、非洲、亚洲和南美洲四个大陆,包含70,462个样本,每个样本均包含实例分割和语义分割掩码,并配有多日期、多光谱的Sentinel-2卫星图像。FTW数据集的创建旨在推动机器学习方法在全球农业监测和评估中的应用,特别是在自动提取农田边界方面。通过提供大规模、多样化的农田数据,FTW数据集有望显著提升农田实例分割模型的地理覆盖范围、准确性和泛化能力,从而对农业监测、可持续农业和气候变化政策等领域产生深远影响。
当前挑战
FTW数据集在构建过程中面临多项挑战。首先,全球农田的多样性,包括不同地区的农田形态、农业实践和气候模式,增加了数据集的复杂性。其次,现有机器学习方法在农田实例分割上的地理覆盖范围有限,且缺乏足够的准确性和泛化能力。此外,数据集的构建需要整合来自不同国家和地区的农田边界数据,这些数据的获取和标准化处理均具有较高的难度。最后,如何确保模型在不同地理区域的零样本和微调性能,也是FTW数据集需要解决的重要问题。这些挑战不仅涉及技术层面的算法优化,还包括数据获取、处理和标准化等多个方面。
常用场景
经典使用场景
Fields of The World (FTW) 数据集的经典使用场景主要集中在农业监测和评估领域。该数据集通过提供全球24个国家的农业田地边界实例分割标注,结合多日期、多光谱的Sentinel-2卫星图像,为机器学习模型提供了丰富的训练数据。这些数据不仅支持田地边界的自动提取,还能用于作物类型分类、农业资源利用监测等应用。通过FTW数据集,研究人员能够开发和验证在全球范围内具有广泛适用性的田地边界分割模型。
衍生相关工作
FTW数据集的发布催生了一系列相关研究工作,特别是在田地边界分割和农业监测领域。例如,基于FTW数据集,研究人员开发了多种先进的机器学习模型,如U-Net和DeepLabv3+,用于提高田地边界分割的准确性和效率。此外,FTW数据集还促进了跨领域的研究,如结合遥感技术和地理信息系统(GIS),进行更精细化的农业资源管理和环境影响评估。未来,随着更多国家和地区的田地边界数据被纳入FTW,预计将会有更多创新性的研究成果涌现。
数据集最近研究
最新研究方向
近年来,Fields of The World (FTW) 数据集在农业领域的前沿研究中占据了重要地位。该数据集通过提供跨越24个国家、覆盖四大洲的农业田地实例分割数据,极大地推动了全球农业监测和评估的自动化进程。FTW数据集不仅在地理覆盖范围和样本数量上超越了以往的数据集,还通过多日期、多光谱的Sentinel-2卫星图像,显著提升了模型的零样本和微调性能。此外,FTW数据集的发布促进了农业田地边界分割研究的标准化和精细化评估,为全球农业监测、可持续农业发展以及气候变化政策制定提供了强有力的数据支持。
相关研究论文
  • 1
    亚利桑那州立大学等 · 2024年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

MeSH

MeSH(医学主题词表)是一个用于索引和检索生物医学文献的标准化词汇表。它包含了大量的医学术语和概念,用于描述医学文献中的主题和内容。MeSH数据集包括主题词、副主题词、树状结构、历史记录等信息,广泛应用于医学文献的分类和检索。

www.nlm.nih.gov 收录

O*NET

O*NET(Occupational Information Network)是一个综合性的职业信息数据库,提供了关于各种职业的详细描述,包括技能要求、工作活动、知识领域、工作环境等。该数据集被广泛用于职业分析、教育和劳动力市场研究。

www.onetonline.org 收录

The MaizeGDB

The MaizeGDB(Maize Genetics and Genomics Database)是一个专门为玉米(Zea mays)基因组学研究提供数据和工具的在线资源。该数据库包含了玉米的基因组序列、基因注释、遗传图谱、突变体信息、表达数据、以及与玉米相关的文献和研究工具。MaizeGDB旨在支持玉米遗传学和基因组学的研究,为科学家提供了一个集成的平台来访问和分析玉米的遗传和基因组数据。

www.maizegdb.org 收录

MedTrinity-25M

MedTrinity-25M是由华中科技大学、加州大学圣克鲁兹分校、哈佛大学和斯坦福大学联合创建的一个大规模多模态医学数据集,包含超过2500万张图像,涉及10种模态和65种疾病。数据集通过自动化的数据构建流程生成,不依赖于配对的文本描述,而是通过专家模型和知识库增强的多模态大型语言模型生成多粒度视觉和文本注释。数据集的创建过程包括从90多个在线资源收集数据,应用专家模型识别感兴趣区域(ROIs),并构建知识库以生成详细的文本描述。MedTrinity-25M旨在支持广泛的医学多模态任务,如图像标注和报告生成,以及视觉中心的任务如分类和分割,推动医学领域基础模型的发展。

arXiv 收录

CMU-MOSI

CMU-MOSI数据集包括了从93个YouTube的视频中获取的2199个独白类型的短视频片段。每个片段都是一个独立的多模态示例,其中图像、文本和音频占比是均匀的,情感分数取值为[-3,+3],表示从强负向到强正向情感。

DataCite Commons 收录