five

nateraw/rice-image-dataset|图像识别数据集|农业数据集

收藏
hugging_face2022-07-08 更新2024-03-04 收录
图像识别
农业
下载链接:
https://hf-mirror.com/datasets/nateraw/rice-image-dataset
下载链接
链接失效反馈
资源简介:
Rice Image Dataset包含75,000张来自五种不同稻米品种(Arborio, Basmati, Ipsala, Jasmine和Karacadag)的图片,每种品种有15,000张图片。此外,还有一个包含106个特征的数据集,这些特征包括12个形态特征、4个形状特征和90个颜色特征。数据集用于通过人工神经网络(ANN)、深度神经网络(DNN)和卷积神经网络(CNN)模型对稻米品种进行分类,其中CNN模型的分类准确率达到了100%。
提供机构:
nateraw
原始信息汇总

数据集概述

数据集名称

  • 名称: Rice Image Dataset

数据集描述

  • 摘要: 该数据集包含75,000张稻米图像,每种稻米品种(Arborio, Basmati, Ipsala, Jasmine, Karacadag)各有15,000张。此外,还包含一个具有106个特征的第二数据集,包括12个形态学特征、4个形状特征和90个颜色特征。使用人工神经网络(ANN)、深度神经网络(DNN)和卷积神经网络(CNN)模型进行稻米品种的分类,其中CNN模型达到100%的分类准确率。

数据集结构

  • 图像数据: 75,000张图像,每种稻米品种15,000张。
  • 特征数据: 包含12个形态学特征、4个形状特征和90个颜色特征的106个特征。

数据集创建

许可证信息

  • 许可证: cc0-1.0

引用信息

bibtex [More Information Needed]

数据集亮点

  • 使用五种稻米品种:Arborio, Basmati, Ipsala, Jasmine, Karacadag。
  • 通过ANN、DNN和CNN模型实现稻米品种分类,其中CNN模型达到100%的分类准确率。
  • 数据集包含丰富的形态学、形状和颜色特征,适用于多种机器学习模型的训练和测试。
AI搜集汇总
数据集介绍
main_image_url
构建方式
在构建nateraw/rice-image-dataset时,研究者们采用了多种深度学习方法,包括人工神经网络(ANN)、深度神经网络(DNN)和卷积神经网络(CNN),以分类和评估不同品种的稻米。该数据集包含了75,000张图像,每种稻米品种(Arborio、Basmati、Ipsala、Jasmine和Karacadag)各有15,000张。此外,数据集还提供了106个特征,包括12个形态特征、4个形状特征和90个颜色特征,这些特征是从图像中提取的,用于进一步的分析和分类。
特点
nateraw/rice-image-dataset的主要特点在于其大规模的图像数据和丰富的特征集。数据集不仅包含了高分辨率的稻米图像,还提供了详细的形态、形状和颜色特征,这些特征有助于更精确地分类和评估稻米品种。此外,数据集的构建过程中采用了多种先进的深度学习模型,这些模型在分类任务中表现出色,尤其是CNN模型达到了100%的分类准确率。
使用方法
使用nateraw/rice-image-dataset时,研究者可以利用其丰富的图像和特征数据进行稻米品种的分类和质量评估。数据集的图像部分适合用于训练和验证卷积神经网络(CNN)等图像处理模型,而特征数据则可以用于训练人工神经网络(ANN)和深度神经网络(DNN)。通过结合这些数据和模型,研究者可以开发出高效且准确的稻米分类系统,从而在农业和食品科学领域中发挥重要作用。
背景与挑战
背景概述
在农业科技领域,稻米品种的分类与质量评估一直是研究的重点。nateraw/rice-image-dataset数据集由Murat Koklu、Ismail Cinar和Yusuf Sefa Taspinar等人于2021年创建,旨在通过图像分析技术对不同稻米品种进行分类。该数据集包含了75,000张图像,涵盖了Arborio、Basmati、Ipsala、Jasmine和Karacadag五种常见的稻米品种,每种品种各有15,000张图像。通过使用人工神经网络(ANN)、深度神经网络(DNN)和卷积神经网络(CNN)等模型,研究人员成功实现了高达100%的分类准确率,显著推动了稻米品种分类技术的发展。
当前挑战
尽管nateraw/rice-image-dataset在稻米品种分类方面取得了显著成果,但其构建过程中仍面临若干挑战。首先,数据集的多样性和代表性问题,确保每种稻米品种的图像能够全面反映其特征,是数据收集阶段的主要挑战。其次,图像质量的一致性问题,如光照、角度和背景的统一,对模型的训练效果有直接影响。此外,模型的泛化能力也是一个重要挑战,确保在不同环境和条件下仍能保持高准确率。最后,数据集的更新与维护,随着新品种的出现和现有品种的变化,数据集需要不断更新以保持其时效性和有效性。
常用场景
经典使用场景
在农业科学领域,nateraw/rice-image-dataset 数据集的经典使用场景主要集中在稻米品种的分类与质量评估。通过该数据集,研究人员可以利用深度学习模型,如卷积神经网络(CNN),对不同品种的稻米进行精确分类。这种分类不仅有助于提高稻米市场的透明度,还能为农业生产提供科学依据,确保稻米品质的一致性。
实际应用
在实际应用中,nateraw/rice-image-dataset 数据集被广泛用于稻米加工和质量控制环节。例如,稻米加工厂可以利用该数据集训练的模型,实时监控和分类不同品种的稻米,确保产品质量。此外,农业科研机构和种子公司也可以利用该数据集进行稻米品种的遗传研究和育种优化,提高稻米的产量和抗病性。
衍生相关工作
基于 nateraw/rice-image-dataset 数据集,许多相关研究工作得以展开。例如,有研究者利用该数据集开发了基于深度学习的稻米品种分类系统,显著提高了分类精度。此外,还有研究探讨了如何利用该数据集中的图像特征进行稻米质量评估,为稻米市场的质量标准制定提供了科学依据。这些衍生工作不仅丰富了农业科学的研究内容,也为实际应用提供了技术支持。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国区域地面气象要素驱动数据集 v2.0(1951-2024)

中国区域地面气象要素驱动数据集(China Meteorological Forcing Data,以下简称 CMFD)是为支撑中国区域陆面、水文、生态等领域研究而研发的一套高精度、高分辨率、长时间序列数据产品。本页面发布的 CMFD 2.0 包含了近地面气温、气压、比湿、全风速、向下短波辐射通量、向下长波辐射通量、降水率等气象要素,时间分辨率为 3 小时,水平空间分辨率为 0.1°,时间长度为 74 年(1951~2024 年),覆盖了 70°E~140°E,15°N~55°N 空间范围内的陆地区域。CMFD 2.0 融合了欧洲中期天气预报中心 ERA5 再分析数据与气象台站观测数据,并在辐射、降水数据产品中集成了采用人工智能技术制作的 ISCCP-ITP-CNN 和 TPHiPr 数据产品,其数据精度较 CMFD 的上一代产品有显著提升。 CMFD 历经十余年的发展,其间发布了多个重要版本。2019 年发布的 CMFD 1.6 是完全采用传统数据融合技术制作的最后一个 CMFD 版本,而本次发布的 CMFD 2.0 则是 CMFD 转向人工智能技术制作的首个版本。此版本与 1.6 版具有相同的时空分辨率和基础变量集,但在其它诸多方面存在大幅改进。除集成了采用人工智能技术制作的辐射和降水数据外,在制作 CMFD 2.0 的过程中,研发团队尽可能采用单一来源的再分析数据作为输入并引入气象台站迁址信息,显著缓解了 CMFD 1.6 中因多源数据拼接和气象台站迁址而产生的虚假气候突变。同时,CMFD 2.0 数据的时间长度从 CMFD 1.6 的 40 年大幅扩展到了 74 年,并将继续向后延伸。CMFD 2.0 的网格空间范围虽然与 CMFD 1.6 相同,但其有效数据扩展到了中国之外,能够更好地支持跨境区域研究。为方便用户使用,CMFD 2.0 还在基础变量集之外提供了若干衍生变量,包括近地面相对湿度、雨雪分离降水产品等。此外,CMFD 2.0 摒弃了 CMFD 1.6 中通过 scale_factor 和 add_offset 参数将实型数据化为整型数据的压缩技术,转而直接将实型数据压缩存储于 NetCDF4 格式文件中,从而消除了用户使用数据时进行解压换算的困扰。 本数据集原定版本号为 1.7,但鉴于本数据集从输入数据到研制技术都较上一代数据产品有了大幅的改变,故将其版本号重新定义为 2.0。

国家青藏高原科学数据中心 收录

MeSH

MeSH(医学主题词表)是一个用于索引和检索生物医学文献的标准化词汇表。它包含了大量的医学术语和概念,用于描述医学文献中的主题和内容。MeSH数据集包括主题词、副主题词、树状结构、历史记录等信息,广泛应用于医学文献的分类和检索。

www.nlm.nih.gov 收录

中国交通事故深度调查(CIDAS)数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心 收录

PDT Dataset

PDT数据集是由山东计算机科学中心(国家超级计算济南中心)和齐鲁工业大学(山东省科学院)联合开发的无人机目标检测数据集,专门用于检测树木病虫害。该数据集包含高分辨率和低分辨率两种版本,共计5775张图像,涵盖了健康和受病虫害影响的松树图像。数据集的创建过程包括实地采集、数据预处理和人工标注,旨在为无人机在农业中的精准喷洒提供高精度的目标检测支持。PDT数据集的应用领域主要集中在农业无人机技术,旨在提高无人机在植物保护中的目标识别精度,解决传统检测模型在实际应用中的不足。

arXiv 收录

FlowBench

FlowBench是由爱荷华州立大学创建的一个大规模流体模拟数据集,包含超过10,000个样本,旨在评估神经PDE求解器在复杂几何形状上的性能。数据集涵盖了多种复杂几何形状(参数化和非参数化)和流体条件(雷诺数和格拉晓夫数),捕捉了从稳态到瞬态的各种流体现象。每个样本都包含速度、压力和温度场的数据,以及升力、阻力和努塞尔数等工程特征。FlowBench的创建过程包括使用高保真模拟器进行直接数值模拟,确保数据的准确性和可靠性。该数据集主要应用于工程领域,如航空航天、汽车设计和生物流体学,旨在解决复杂几何形状上的流体动力学问题。

arXiv 收录