five

CNH-98

收藏
github2023-02-07 更新2024-05-31 收录
下载链接:
https://github.com/scut-aitcm/Chinese-Herbs-Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
Chinese-Herbs Dataset (CNH-98) 是一个包含9184张图像的数据集,涵盖98个类别,分为8个主要类别,包括果实与种子、根茎、花朵、树皮、叶状体、全草、叶子、树脂等。每个类别包含14至246张图像,平均每个类别有94张图像。

The Chinese-Herbs Dataset (CNH-98) is a collection of 9,184 images spanning 98 categories, which are divided into 8 main groups including fruits and seeds, rhizomes, flowers, barks, thalluses, whole herbs, leaves, and resins. Each category contains between 14 to 246 images, with an average of 94 images per category.
创建时间:
2018-11-16
原始信息汇总

Chinese Herbs Dataset (CNH-98) 概述

数据集基本信息

  • 图像数量: 9184张
  • 类别数量: 98类
  • 平均每类图像数量: 约94张
  • 图像范围: 每类14至246张

类别分布

  • 主要类别: 8类
    • Fruits & Seeds
    • Rhizome
    • Flowers
    • Bark
    • Thallophyte
    • Whole Herbs
    • Leaves
    • Resin

类别示例

  • Fruits & Seeds: Star Anise, Siraitia Grosvenorii, Ginkgo, Chinese Wolfberry, Selfheal, Fructus Arctii等
  • Rhizome: Liquorice, Thorowax Root, Rhizoma Alismatis, Unibract Fritillary Bulb等
  • Flowers: Saffron, Flos Daturae, Cloves, Magnolia, Coltsfoot, Flos Jasmine, Lily等
  • Bark: Cinnamon, Cortex Moutan, Eucommia Ulmoides等
  • Thallophyte: Glossy Ganoderma, Tremella, Cordyceps Sinensis等
  • Whole Herbs: Abrus cantoniensis, Anoectochilus roxburghii等
  • Leaves: Lophatherum Gracile等
  • Resin: Frankincense, Myrrh等

数据集来源

数据集使用

  • 非商业用途请联系:crghwen@scut.edu.cn
搜集汇总
数据集介绍
main_image_url
构建方式
CNH-98数据集的构建过程体现了对中医药材图像数据的系统性收集与整理。该数据集通过从医院、中药材商店以及Google图片等多元化来源获取图像,确保了数据的广泛性和代表性。每类药材的图像数量从14到246不等,平均每类包含94张图像,总计9184张图像,覆盖了98种不同的中药材类别。这种构建方式不仅保证了数据的丰富性,也为后续的深度学习模型训练提供了坚实的基础。
特点
CNH-98数据集的特点在于其细致的分类和广泛的覆盖范围。数据集将中药材分为8个大类,包括果实与种子、根茎、花、树皮、菌类、全草、叶和树脂,每一类下又细分为多个具体的中药材品种。这种多层次分类体系不仅有助于研究者深入理解中药材的多样性,也为图像识别和分类任务提供了清晰的标签体系。此外,数据集中每类药材的图像数量分布较为均衡,确保了模型训练的稳定性和可靠性。
使用方法
CNH-98数据集的使用方法主要围绕图像分类和识别任务展开。研究者可以通过加载数据集中的图像和标签,利用深度学习框架如TensorFlow或PyTorch进行模型的训练与验证。数据集中的图像尺寸统一为32x32像素,适合用于卷积神经网络(CNN)等模型的输入。此外,数据集还提供了一个包含20类药材的样本集,供研究者快速上手和测试。对于非商业用途的研究者,可以通过联系数据集提供方获取完整数据集,进一步推动中医药材图像识别领域的研究。
背景与挑战
背景概述
CNH-98数据集是一个专注于中草药图像分类的公开数据集,由华南理工大学的研究团队于近年创建。该数据集包含了9184张图像,涵盖了98个不同类别的中草药,这些类别进一步细分为8个大类,包括果实与种子、根茎、花、树皮、菌类、全草、叶和树脂。数据集的图像来源多样,包括医院、中草药店以及Google图片等。CNH-98的创建旨在为中草药识别和分类研究提供一个标准化的基准,推动了计算机视觉在传统医学领域的应用。
当前挑战
CNH-98数据集在构建和应用过程中面临多重挑战。首先,中草药的形态多样性和视觉相似性使得图像分类任务极具挑战性,尤其是在类别间差异较小的情况下。其次,数据集的构建过程中,研究人员需要确保图像的质量和代表性,这涉及到从不同来源收集图像并进行严格的筛选和标注。此外,数据集中各类别的样本数量不均衡,某些类别的图像数量较少,可能导致模型训练时的偏差问题。这些挑战不仅考验了数据集的构建质量,也对后续的算法设计和模型优化提出了更高的要求。
常用场景
经典使用场景
CNH-98数据集在中医药领域的图像识别和分类研究中具有重要应用。该数据集包含了9184张图像,涵盖98种中草药类别,分为8大类,如果实与种子、根茎、花、树皮等。研究者可以利用该数据集进行中草药图像的自动化识别和分类,尤其是在深度学习模型的训练和验证中,CNH-98为算法提供了丰富的样本数据,帮助提升模型的准确性和鲁棒性。
衍生相关工作
CNH-98数据集催生了一系列与中草药图像识别相关的研究工作。例如,基于该数据集的深度学习模型在图像分类、目标检测和特征提取等领域取得了显著进展。许多研究利用CNH-98进行迁移学习和数据增强实验,进一步提升了模型的泛化能力。此外,该数据集还为跨领域研究提供了基础,如结合自然语言处理技术,开发智能问答系统,帮助用户查询中草药信息。
数据集最近研究
最新研究方向
在中医药领域,CNH-98数据集为研究者提供了一个丰富的图像资源库,涵盖了98种中草药的9184张图像,分为8个主要类别。这一数据集的最新研究方向聚焦于利用深度学习技术进行中草药的自动识别与分类,特别是在图像处理和模式识别领域的应用。研究者们正探索如何通过卷积神经网络(CNN)等先进算法,提高中草药识别的准确性和效率,这对于中医药的现代化和国际化具有重要意义。此外,该数据集还被用于研究不同中草药之间的相似性和差异性,为中医药的科学研究提供了新的视角和方法。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作