PlantVillage dataset|植物健康监测数据集|图像分类数据集
收藏Plant Disease Detection 数据集概述
数据集信息
-
数据集名称: PlantVillage
-
数据来源: PlantVillage dataset
-
数据结构: bash /root_dir ├── Class_1 │ ├── img1.jpg │ ├── img2.jpg │ └── ... ├── Class_2 │ ├── img1.jpg │ ├── img2.jpg │ └── ... └── ...
-
数据内容: 包含健康和患病植物叶子的图像,涵盖多个类别。
数据集使用
- 数据加载: 使用自定义数据加载器
CustomImageDataset
处理多类图像数据集,并应用数据增强和变换。 - 模型训练: 使用自定义的卷积神经网络 (CNN) 模型
CNNClassifier
进行训练,模型包含卷积层、批量归一化、Dropout 层和全连接层。 - 训练优化: 使用 Early Stopping 和学习率调度器优化训练过程。
- 模型评估: 通过混淆矩阵和分类报告评估模型性能。
- 可视化: 使用 Grad-CAM 可视化技术突出显示影响预测的关键图像区域。
- 推理: 对未见过的图像进行疾病预测,并提供前三个预测类别的置信度分数。
性能指标
- 训练曲线: 显示损失、准确率和学习率的变化趋势。
- 示例分析: 训练和验证损失稳步下降,准确率超过 98%,表明模型具有良好的泛化能力。
使用方法
- 数据集准备: 下载 PlantVillage 数据集并按指定结构组织。
- 模型训练: 运行
python main.py
进行模型训练,保存最佳模型权重并显示评估指标。 - 预测新图像: 替换
sample_image_path
为测试图像路径,运行推理函数进行疾病预测和 Grad-CAM 热图可视化。

Google Scholar
Google Scholar是一个学术搜索引擎,旨在检索学术文献、论文、书籍、摘要和文章等。它涵盖了广泛的学科领域,包括自然科学、社会科学、艺术和人文学科。用户可以通过关键词搜索、作者姓名、出版物名称等方式查找相关学术资源。
scholar.google.com 收录
UCI Machine Learning Repository
UCI机器学习库是一个包含数据库、领域理论和数据生成器的集合,这些被机器学习社区用于机器学习算法的实证分析。
github 收录
FER2013
FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。
github 收录
Traditional-Chinese-Medicine-Dataset-SFT
该数据集是一个高质量的中医数据集,主要由非网络来源的内部数据构成,包含约1GB的中医各个领域临床案例、名家典籍、医学百科、名词解释等优质内容。数据集99%为简体中文内容,质量优异,信息密度可观。数据集适用于预训练或继续预训练用途,未来将继续发布针对SFT/IFT的多轮对话和问答数据集。数据集可以独立使用,但建议先使用配套的预训练数据集对模型进行继续预训练后,再使用该数据集进行进一步的指令微调。数据集还包含一定比例的中文常识、中文多轮对话数据以及古文/文言文<->现代文翻译数据,以避免灾难性遗忘并加强模型表现。
huggingface 收录
网易云音乐数据集
该数据集包含了网易云音乐平台上的歌手信息、歌曲信息和歌单信息,数据通过爬虫技术获取并整理成CSV格式,用于音乐数据挖掘和推荐系统构建。
github 收录