植物类型数据集
收藏魔搭社区2026-05-23 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/reymond/plants_type_dataset
下载链接
链接失效反馈官方服务:
资源简介:
## 数据集描述
### 数据集简介
数据集包含30种类型的植物图像,其中21000张训练图片,3000张验证图片,数据大小共1.2GB,支持识别以下植物类型:芦荟、香蕉、木胡瓜、哈密瓜、木薯、叶子、玉米、黄瓜、姜黄、茄子、沙姜、生姜、番石榴、羽衣甘蓝、豇豆、芒果、甜瓜、橙子、稻谷、番木瓜、辣椒、菠萝、葡萄柚、红葱、大豆、菠菜、红薯、烟草、莲雾、西瓜。
## 数据集的格式和结构
### 数据格式
数据集包括训练集train和验证集val,train和val文件夹之下按文件夹进行分类,共有2个子文件夹,同类别标签的图片在同一个文件夹下,图片格式为JPG。同时包含与标注文件中label id相对应的类名文件classname.txt。
### 数据集加载方式
```python
from modelscope.msdatasets import MsDataset
from modelscope.utils.constant import DownloadMode
ms_train_dataset = MsDataset.load(
'plants_type_dataset', namespace='reymond',
subset_name='default', split='train') # 加载训练集
print(next(iter(ms_train_dataset)))
ms_val_dataset = MsDataset.load(
'plants_type_dataset', namespace='reymond',
subset_name='default', split='validation') # 加载验证集
print(next(iter(ms_val_dataset)))
```
### 数据分片
本数据集包含train和val数据集。
| 子数据集 | train | val | test |
|---------|-------------:|-----------:|---------:|
| default | 训练集 | 验证集 | / |
### 原始数据链接
https://www.kaggle.com/datasets/yudhaislamisulistya/plants-type-datasets
### Clone with HTTP
```bash
git clone https://www.modelscope.cn/datasets/reymond/plants_type_dataset.git
```
### 数据集简介
本数据集涵盖30类植物图像,包含21000张训练样本与3000张验证样本,整体数据规模达1.2GB,可用于识别以下植物品类:芦荟、香蕉、木胡瓜、哈密瓜、木薯、叶片、玉米、黄瓜、姜黄、茄子、沙姜、生姜、番石榴、羽衣甘蓝、豇豆、芒果、甜瓜、橙子、稻谷、番木瓜、辣椒、菠萝、葡萄柚、红葱、大豆、菠菜、甘薯、烟草、莲雾、西瓜。
### 数据集的格式和结构
#### 数据格式
本数据集包含训练集(train)与验证集(val)两类子数据集,两类子数据集均以文件夹实现类别分类,共包含2个层级子文件夹,同一类别标签的图像存储于同名文件夹内,图像格式为JPG。同时配套有与标注文件中标签ID相对应的类名文件`classname.txt`。
#### 数据集加载方式
python
from modelscope.msdatasets import MsDataset
from modelscope.utils.constant import DownloadMode
ms_train_dataset = MsDataset.load(
'plants_type_dataset', namespace='reymond',
subset_name='default', split='train') # 加载训练数据集
print(next(iter(ms_train_dataset)))
ms_val_dataset = MsDataset.load(
'plants_type_dataset', namespace='reymond',
subset_name='default', split='validation') # 加载验证数据集
print(next(iter(ms_val_dataset)))
#### 数据分片
本数据集包含train与val两类子数据集。
| 子数据集 | 训练集 | 验证集 | 测试集 |
|---------|-------------:|-----------:|---------:|
| default | 训练集 | 验证集 | 无 |
### 原始数据链接
https://www.kaggle.com/datasets/yudhaislamisulistya/plants-type-datasets
### Clone with HTTP
bash
git clone https://www.modelscope.cn/datasets/reymond/plants_type_dataset.git
提供机构:
maas
创建时间:
2023-10-20
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个包含30种植物类型图像的中等规模分类数据集,总计24,000张图像(21,000张训练图像和3,000张验证图像),总大小为1.2GB。图像按类别组织在训练集和验证集的子文件夹中,格式为JPG,支持如Aloe、Banana、Watermelon等多种常见植物的识别,适用于图像分类任务的模型训练和验证。
以上内容由遇见数据集搜集并总结生成



