five

Fields of The World (FTW)|农业数据集|机器学习数据集

收藏
arXiv2024-09-25 更新2024-09-26 收录
农业
机器学习
下载链接:
https://beta.source.coop/repositories/kernerlab/fields-of-the-world/
下载链接
链接失效反馈
资源简介:
Fields of The World (FTW) 是一个用于全球农业田地边界分割的机器学习基准数据集,涵盖了24个国家的农业田地数据。该数据集包含70,462个样本,每个样本都包含实例和语义分割掩码,并与多日期、多光谱的Sentinel-2卫星图像配对。FTW的创建旨在解决当前机器学习方法在田地实例分割中地理覆盖不足、准确性低和泛化能力差的问题。数据集的应用领域包括农业监测、可持续农业和气候变化政策等,旨在通过自动化的田地边界提取来支持全球农业数据的获取和分析。
提供机构:
亚利桑那州立大学
创建时间:
2024-09-25
AI搜集汇总
数据集介绍
main_image_url
构建方式
Fields of The World (FTW) 数据集的构建基于全球24个国家的农业田地边界,覆盖欧洲、非洲、亚洲和南美洲四个大洲。该数据集通过整合多源数据,包括政府数据库、已发表文献和其他网站中的田地多边形数据,确保了地理多样性和高质量的标注。数据集中的每个样本包含实例和语义分割掩码,并与多日期、多光谱的Sentinel-2卫星图像配对。为了标准化数据格式,FTW采用了fiboa规范,使得不同来源的数据能够互操作,并支持用户根据需求获取自定义的卫星数据或其他输入。
特点
FTW数据集的一个显著特点是其广泛的地理覆盖和多样性,相较于以往的数据集,FTW在样本数量、覆盖面积和标注量上均达到了一个数量级的提升。此外,FTW还捕捉了农业田地实例的形态多样性,包括不同大小、形状和方向的田地,反映了各地独特的地形、环境和历史因素。数据集还提供了多日期、多光谱的Sentinel-2卫星图像,以及实例和语义分割掩码,为机器学习模型的训练和评估提供了丰富的数据支持。
使用方法
FTW数据集适用于农业田地实例分割的机器学习任务,用户可以通过提供的训练、验证和测试集进行模型训练和评估。数据集支持多种使用场景,包括区域特定的评估、迁移学习和零样本泛化。为了方便用户使用,FTW提供了详细的元数据,包括样本网格、样本芯片和田地边界多边形的标准化格式,以及预训练模型和数据加载器。用户可以通过GitHub和Source Cooperative获取相关代码和数据,进一步推动农业监测和可持续发展领域的研究。
背景与挑战
背景概述
Fields of The World (FTW)数据集由亚利桑那州立大学、微软AI for Good研究实验室等多个机构的研究人员共同创建,旨在解决全球农业领域中农田边界自动分割的挑战。该数据集涵盖了24个国家,跨越欧洲、非洲、亚洲和南美洲四个大陆,包含了70,462个样本,每个样本都包含实例和语义分割掩码,并与多日期、多光谱的Sentinel-2卫星图像配对。FTW数据集的创建旨在推动机器学习方法在全球农业监测和评估中的应用,特别是通过自动提取农田边界来满足这些数据集在全球范围内的需求。
当前挑战
FTW数据集面临的挑战主要包括两个方面:一是解决领域问题的挑战,即如何在全球多样化的农业景观中实现高精度的农田边界分割;二是数据集构建过程中的挑战,如如何确保地理覆盖的广泛性、标注的高质量和数据集的多样性。此外,FTW数据集还需要应对不同气候、地形和农业实践带来的复杂性,以及在构建过程中如何处理和整合来自不同来源的数据。
常用场景
经典使用场景
Fields of The World (FTW) 数据集的经典使用场景主要集中在农业监测和可持续农业领域。该数据集通过提供全球24个国家的农业田地边界实例分割标注,结合多日期、多光谱的Sentinel-2卫星图像,为机器学习模型提供了丰富的训练数据。这些数据不仅支持田地边界的自动提取,还促进了模型在不同地理区域和气候条件下的泛化能力,从而在农业监测、作物产量预测、病虫害监测等方面发挥重要作用。
衍生相关工作
FTW 数据集的发布催生了一系列相关研究工作。例如,基于FTW数据集,研究者们开发了多种用于田地边界分割的机器学习模型,并进行了跨区域的性能评估。此外,FTW 数据集还促进了多光谱图像分析、时间序列数据处理等技术的发展。未来,随着更多国家和地区的数据加入,FTW 数据集有望进一步推动全球农业监测和可持续农业研究的发展。
数据集最近研究
最新研究方向
在农业监测和可持续农业领域,Fields of The World (FTW) 数据集的最新研究方向主要集中在利用机器学习方法自动提取全球农业田地的边界。FTW 数据集通过覆盖四大洲的24个国家,提供了比以往更广泛的地理多样性和农业景观复杂性,从而推动了田地实例分割技术的进步。研究者们正在探索如何利用FTW数据集提升模型的零样本学习和微调性能,特别是在不同国家和气候条件下的泛化能力。此外,FTW数据集的发布也促进了跨学科的合作,包括农业科学、遥感技术和机器学习,以应对全球农业监测中的挑战。
相关研究论文
  • 1
    Fields of The World: A Machine Learning Benchmark Dataset For Global Agricultural Field Boundary Segmentation亚利桑那州立大学 · 2024年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Figshare

Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。

figshare.com 收录

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

Photovoltaic power plant data

包括经纬度、电源板模型、NWP等信息。

github 收录

SMSSpamCollection

该数据集包含数千条标记为spam或ham(非垃圾邮件)的短信。它反映了日常通信的典型情况,并包含常见的垃圾邮件词汇,为评估文本分类模型提供了现实基础。

github 收录

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录