yusuf802/new-image-dataset|图像识别数据集|农作物病害识别数据集
收藏数据集概述
数据集配置
- 默认配置 (
default
)- 训练集 (
train
): 路径为data/train-*
- 测试集 (
test
): 路径为data/test-*
- 训练集 (
数据集信息
- 特征
- 图像 (
image
): 数据类型为图像 - 标签 (
label
): 数据类型为类别标签,包含以下类别名称:- 0: Apple_Black_rot
- 1: Apple_Cedar_apple_rust
- 2: Apple_Powdery_mildew
- 3: Apple_healthy
- 4: Apple_scab
- 5: Cherry_(including_sour)_Powdery_mildew
- 6: Cherry_(including_sour)_healthy
- 7: Corn_(maize)_Cercospora_leaf_spot Gray_leaf_spot
- 8: Corn_(maize)_Common_rust
- 9: Corn_(maize)_Northern_Leaf_Blight
- 10: Corn_(maize)_healthy
- 11: Cotton_leaf_diseased
- 12: Cotton_leaf_fresh
- 13: Grape_Black_rot
- 14: Grape___Esca_(Black_Measles)
- 15: Grape___Leaf_blight_(Isariopsis_Leaf_Spot)
- 16: Grape___healthy
- 17: Orange_Haunglongbing_(Citrus_greening)
- 18: Orange__Black_Rot
- 19: Orange__Canker
- 20: Orange__Healthy
- 21: Peach_Bacterial_spot
- 22: Peach_healthy
- 23: Pepper,_bell_Bacterial_spot
- 24: Pepper,_bell_healthy
- 25: Potato_Early_blight
- 26: Potato_Late_blight
- 27: Potato_healthy
- 28: Squash_Powdery_mildew
- 29: Strawberry_Leaf_scorch
- 30: Strawberry_healthy
- 31: Tomato_Bacterial_spot
- 32: Tomato_Early_blight
- 33: Tomato_Late_blight
- 34: Tomato_Leaf_Mold
- 35: Tomato_Septoria_leaf_spot
- 36: Tomato_Spider_mites_Two_spotted_spider_mite
- 37: Tomato_Target_Spot
- 38: Tomato_Tomato_Yellow_Leaf_Curl_Virus
- 39: Tomato_Tomato_mosaic_virus
- 40: Tomato_healthy
- 41: Wheat_healthy
- 42: Wheat_leaf_rust
- 43: Wheat_nitrogen_deficiency
- 图像 (
数据集分割
- 训练集 (
train
)- 字节数: 5580252809.260068
- 样本数: 56842
- 测试集 (
test
)- 字节数: 960697024.6779323
- 样本数: 10032
数据集大小
- 下载大小: 6476692260 字节
- 数据集大小: 6540949833.938 字节

中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录
MedChain
MedChain是由香港城市大学、香港中文大学、深圳大学、阳明交通大学和台北荣民总医院联合创建的临床决策数据集,包含12,163个临床案例,涵盖19个医学专科和156个子类别。数据集通过五个关键阶段模拟临床工作流程,强调个性化、互动性和顺序性。数据来源于中国医疗网站“iiYi”,经过专业医生验证和去识别化处理,确保数据质量和患者隐私。MedChain旨在评估大型语言模型在真实临床场景中的诊断能力,解决现有基准在个性化医疗、互动咨询和顺序决策方面的不足。
arXiv 收录
开源PHM数据集
本文分享了一个全球各大学、研究机构和公司捐赠的PHM(Prognostics and Health Management)开源数据集,涵盖加工制造、轨道交通、能源电力和半导体等行业的多种场景,包含部件级、设备级和产线级数据。用户可以利用这些数据开发智能分析和建模算法,数据集分类包括故障诊断、健康评估和寿命预测。
github 收录
LibriSpeech
LibriSpeech 是一个大约 1000 小时的 16kHz 英语朗读语音语料库,由 Vassil Panayotov 在 Daniel Povey 的协助下编写。数据来自 LibriVox 项目的已读有声读物,并经过仔细分割和对齐。
OpenDataLab 收录