five

GWFSS-competition|小麦图像分割数据集|植物结构分析数据集

收藏
huggingface2025-03-12 更新2025-03-13 收录
小麦图像分割
植物结构分析
下载链接:
https://huggingface.co/datasets/XIANG-Shuai/GWFSS-competition
下载链接
链接失效反馈
资源简介:
全球小麦全语义分割数据集(GWFSS)旨在对小麦植物的叶片、茎和麦头进行像素级分割,以全面描述植物的结构、健康和发展。该数据集包含预训练数据、训练数据和验证数据,适用于无监督学习和监督微调模型训练。数据集标签包括背景、麦头、茎和叶片四个类别。
创建时间:
2025-03-12
AI搜集汇总
数据集介绍
main_image_url
构建方式
GWFSS-competition数据集的构建旨在应对全球小麦作物的详尽分析需求,以助力科学家与农民培养出更健康、更具弹性和生产力的作物。该数据集通过精心挑选的预训练数据、训练数据和验证数据,涵盖了从不同领域中采集的小麦植株图像。预训练数据包含超过64,000张未标记图像,而训练和验证数据则分别由99张来自9个领域的标记图像组成,图像分辨率为512×512像素,这些图像为像素级的植株组件分割提供了基础。
特点
该数据集的特点在于其结合了大量的未标记图像与少量的标记数据,旨在解决语义分割中像素级注释劳动力巨大且成本高昂的问题。通过这种设计,GWFSS-competition数据集不仅促进了模型的可扩展性和可访问性,还包含了多种小麦植株的类别,如背景、麦穗、茎和叶,为植物表型分析提供了全面的数据支持。
使用方法
使用GWFSS-competition数据集,研究者可以直接利用训练数据进行模型训练。然而,为了提高模型性能,建议首先利用预训练数据进行无监督学习,然后使用训练数据进行监督微调。完成模型训练后,用户可以在Codabench平台上提交预测结果,以获取mIoU分数,从而评估模型性能。
背景与挑战
背景概述
全球小麦全语义分割(GWFSS)数据集的构建,旨在推动小麦这一全球粮食安全基石的研究。该数据集由XIANG Shuai等研究人员于2025年3月13日发布,版本1.0,针对小麦植株的详细分析,通过像素级别的植株组件分割,如叶片、茎和麦头,来全面描述植物结构、健康与发育。这一研究对于科学家和农民培育更健康、更具弹性和生产力的作物具有重要意义。GWFSS数据集的创建,不仅推动了植物表型组学研究的发展,也为相关领域提供了宝贵的资源。
当前挑战
GWFSS数据集在构建和应用过程中面临的主要挑战包括:如何利用大量未标记图像和少量标记数据训练有效的分割模型,以及如何提高模型的扩展性和可访问性。在解决领域问题方面,像素级别的语义分割需要耗费大量人力和成本进行标注,这限制了模型的扩展。此外,构建过程中的挑战还包括数据集的多样性和平衡性,以及如何确保模型在不同领域间的迁移性。
常用场景
经典使用场景
在现代农业研究领域,GWFSS-competition数据集的像素级小麦植株组分分割能力,使其成为分析植株结构、健康与发育的关键工具。该数据集通过少量标注数据结合大量未标注数据,训练高效的分割模型,为研究人员提供了一种在资源有限条件下实现精确植物表型分析的方法。
衍生相关工作
基于GWFSS-competition数据集的研究,已衍生出一系列相关工作,涉及无监督学习、小麦语义分割以及植物表型学等多个领域。这些研究不仅推动了相关技术的进步,也为农业信息化和智能化提供了重要的技术支撑。
数据集最近研究
最新研究方向
在粮食安全领域,小麦的详细分析对于培养更健康、更具弹性和更高产的作物至关重要。Global Wheat Full Semantic Segmentation (GWFSS) 数据集的最新研究方向聚焦于如何利用大量未标记图像与少量标记数据相结合,训练有效的分割模型。这一研究不仅减轻了像素级注释的劳动强度和成本,还提高了模型的可扩展性和可访问性,对于植物表型研究和精准农业具有重要意义。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Nexdata/chinese_dialect

该数据集包含25,000小时的中文方言语音数据,收集自多个方言区域的本地方言使用者,涵盖闽南语、粤语、四川话、河南话、东北话、上海话、维吾尔语和藏语等。数据格式为16kHz、16bit、未压缩的wav文件,单声道。句子准确率超过95%。数据集支持的任务包括自动语音识别(ASR)和音频说话人识别。

hugging_face 收录

flames-and-smoke-datasets

该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。

github 收录

中国行政区划shp数据

   中国行政区划数据是重要的基础地理信息数据,目前不同来源的全国行政区划数据非常多,但能够开放获取的高质量行政区域数据少之又少。基于此,锐多宝的地理空间制作一套2013-2023年可开放获取的高质量行政区划数据。该套数据以2022年国家基础地理信息数据中的县区划数据作为矢量基础,辅以高德行政区划数据、天地图行政区划数据,参考历年来民政部公布的行政区划为属性基础,具有时间跨度长、属性丰富、国界准确、更新持续等特性。   中国行政区划数据统计截止时间是2023年2月12日,包含省、市、县、国界、九段线等矢量shp数据。该数据基于2020年行政区划底图,按时间顺序依次制作了2013-2023年初的行政区划数据。截止2023年1月1日,我国共有34个省级单位,分别是4个直辖市、23个省、5个自治区和2个特别行政区。截止2023年1月1日,我国共有333个地级单位,分别是293个地级市、7个地区、30个自治州和3个盟,其中38个矢量要素未纳入统计(比如直辖市北京等、特别行政区澳门等、省直辖县定安县等)。截止2023年1月1日,我国共有2843个县级单位,分别是1301个县、394个县级市、977个市辖区、117个自治县、49个旗、3个自治旗、1个特区和1个林区,其中9个矢量要素未纳入县级类别统计范畴(比如特别行政区香港、无县级单位的地级市中山市东莞市等)。

CnOpenData 收录

ELSA

ELSA(English Longitudinal Study of Ageing)是一个纵向研究项目,旨在调查英国50岁及以上人群的健康、经济状况和社会关系。数据集包括参与者的健康状况、生活方式、经济状况、社会网络等多方面的信息。

www.elsa-project.ac.uk 收录

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录