Fruits-360|图像识别数据集|农业技术数据集
收藏数据集概述
数据集名称
Fruits-360: 包含水果和蔬菜图像的数据集
版本
2019.09.21.0
包含内容
数据集包含多种水果和蔬菜的图像,具体包括:
- 苹果(不同品种:Crimson Snow, Golden, Golden-Red, Granny Smith, Pink Lady, Red, Red Delicious)
- 杏
- 鳄梨
- 成熟鳄梨
- 香蕉(黄色、红色、Lady Finger)
- 红甜菜根
- 蓝莓
- 仙人掌果实
- 哈密瓜(2种品种)
- 杨桃
- 花椰菜
- 樱桃(不同品种,Rainier)
- 樱桃蜡(黄色、红色、黑色)
- 栗子
- 克莱门汀
- 椰子
- 枣
- 茄子
- 姜根
- 百香果
- 葡萄(蓝色、粉色、白色(不同品种))
- 葡萄柚(粉色、白色)
- 番石榴
- 榛子
- 越橘
- 猕猴桃
- 柿子
- 大头菜
- 金橘
- 柠檬(普通、Meyer)
- 酸橙
- 荔枝
- 柑橘
- 芒果(绿色、红色)
- 山竹
- 百香果
- 蟾蜍皮瓜
- 桑葚
- 油桃(常规、扁平)
- 坚果(森林、山核桃)
- 洋葱(红色、白色)
- 橙子
- 木瓜
- 百香果
- 桃子(不同品种)
- 美洲南瓜
- 梨(不同品种,Abate, Forelle, Kaiser, Monster, Red, Williams)
- 辣椒(红色、绿色、黄色)
- 酸浆(普通、带壳)
- 菠萝(普通、迷你)
- 红心火龙果
- 李子(不同品种)
- 石榴
- 甜柚
- 土豆(红色、甜、白色)
- 榅桲
- 红毛丹
- 覆盆子
- 红加仑
- 蛇果
- 草莓(普通、楔形)
- 番茄(不同品种,Maroon, Cherry Red, Yellow)
- 核桃
数据集属性
- 总图像数:82213
- 训练集大小:61488图像(每张图像一种水果或蔬菜)
- 测试集大小:20622图像(每张图像一种水果或蔬菜)
- 多水果集大小:103图像(每张图像多于一种水果或水果类别)
- 类别数:120(水果和蔬菜)
- 图像大小:100x100像素
- 文件名格式:image_index_100.jpg 或 r_image_index_100.jpg 或 r2_image_index_100.jpg 或 r3_image_index_100.jpg(其中“r”表示水果旋转,“r2”表示水果沿第三轴旋转,“100”来自图像大小100x100像素)
数据集结构
- 训练和测试图像分别存储在Training和Test文件夹中。
- 包含多个水果的图像存储在test-multiple_fruits文件夹中。
- 用于训练神经网络的Python代码存储在src/image_classification文件夹中,使用TensorFlow库。
- 用于从背景中提取水果或蔬菜的C++代码存储在src/utils文件夹中。
- 相关研究论文存储在papers文件夹中。
下载方式
数据集可通过Kaggle下载。
许可证
MIT License
版权所有 (c) 2017-2019 Mihai Oltean, Horea Muresan

中国1km分辨率逐月降水量数据集(1901-2024)
该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2024.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。
国家青藏高原科学数据中心 收录
CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
PDT Dataset
PDT数据集是由山东计算机科学中心(国家超级计算济南中心)和齐鲁工业大学(山东省科学院)联合开发的无人机目标检测数据集,专门用于检测树木病虫害。该数据集包含高分辨率和低分辨率两种版本,共计5775张图像,涵盖了健康和受病虫害影响的松树图像。数据集的创建过程包括实地采集、数据预处理和人工标注,旨在为无人机在农业中的精准喷洒提供高精度的目标检测支持。PDT数据集的应用领域主要集中在农业无人机技术,旨在提高无人机在植物保护中的目标识别精度,解决传统检测模型在实际应用中的不足。
arXiv 收录
MeSH
MeSH(医学主题词表)是一个用于索引和检索生物医学文献的标准化词汇表。它包含了大量的医学术语和概念,用于描述医学文献中的主题和内容。MeSH数据集包括主题词、副主题词、树状结构、历史记录等信息,广泛应用于医学文献的分类和检索。
www.nlm.nih.gov 收录