Fruits-360|图像识别数据集|食品分类数据集
收藏数据集概述
数据集名称
Fruits-360: 包含水果和蔬菜的图像数据集
版本
2020.05.18.0
包含内容
数据集包含多种水果和蔬菜的图像,具体包括:
- 苹果(不同品种)
- 杏
- 鳄梨
- 香蕉(不同颜色)
- 甜菜根
- 蓝莓
- 仙人掌果实
- 哈密瓜(两种品种)
- 星果
- 花椰菜
- 樱桃(不同品种)
- 樱桃蜡(不同颜色)
- 栗子
- 柑橘
- 椰子
- 玉米(带壳)
- 黄瓜(成熟)
- 日期
- 茄子
- 无花果
- 姜根
- 西番莲
- 葡萄(不同颜色和品种)
- 葡萄柚(不同颜色)
- 番石榴
- 榛子
- 越橘
- 猕猴桃
- 柿子
- 大头菜
- 金橘
- 柠檬(普通和Meyer品种)
- 酸橙
- 荔枝
- 柑橘
- 芒果(不同颜色)
- 山竹
- 百香果
- 青蛙皮瓜
- 桑葚
- 油桃(常规和平)
- 坚果(森林和山核桃)
- 洋葱(红和白)
- 橙子
- 木瓜
- 西番莲果
- 桃子(不同品种)
- 美洲南瓜
- 梨(不同品种)
- 辣椒(不同颜色)
- 灯笼果(普通和带壳)
- 菠萝(普通和迷你)
- 红龙果
- 李子(不同品种)
- 石榴
- 甜柚
- 土豆(红、甜、白)
- 榅桲
- 红毛丹
- 覆盆子
- 红加仑
- 蛇果
- 草莓(普通和楔形)
- 树番茄
- 蜜柑
- 西红柿(不同品种)
- 核桃
- 西瓜
数据集属性
- 总图像数:90483
- 训练集大小:67692图像(每张图像一个水果或蔬菜)
- 测试集大小:22688图像(每张图像一个水果或蔬菜)
- 多水果集大小:103图像(每张图像包含多个水果或水果类别)
- 类别数:131(水果和蔬菜)
- 图像大小:100x100像素
- 文件名格式:image_index_100.jpg 或 r_image_index_100.jpg 或 r2_image_index_100.jpg 或 r3_image_index_100.jpg("r"表示水果旋转,"r2"表示水果绕第三轴旋转)
存储结构
- 训练和测试图像分别存储在Training和Test文件夹中。
- 包含多个水果的图像存储在test-multiple_fruits文件夹中。
- 用于训练神经网络的Python代码存储在src/image_classification和src/image_classification_tf_1.8.0文件夹中。
- 用于从背景中提取水果或蔬菜的C++代码存储在src/utils文件夹中。
- 相关研究论文存储在papers文件夹中。
许可证
MIT License
版权所有 (c) 2017-2020 Mihai Oltean, Horea Muresan

中国1km分辨率逐月降水量数据集(1901-2023)
该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。
国家青藏高原科学数据中心 收录
中国气象数据
本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。
github 收录
PCLT20K
PCLT20K数据集是由湖南大学等机构创建的一个大规模PET-CT肺癌肿瘤分割数据集,包含来自605名患者的21,930对PET-CT图像,所有图像都带有高质量的像素级肿瘤区域标注。该数据集旨在促进医学图像分割研究,特别是在PET-CT图像中肺癌肿瘤的分割任务。
arXiv 收录
AgiBot World
为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。
github 收录
DAT
DAT是一个统一的跨场景跨领域基准,用于开放世界无人机主动跟踪。它提供了24个视觉复杂的场景,以评估算法的跨场景和跨领域泛化能力,并具有高保真度的现实机器人动力学建模。
github 收录