17 Category Flower Dataset|花卉识别数据集|图像分类数据集
收藏Big-Data-Machine-Learning-Task-3
数据集概述
- 数据集名称:17 Category Flower Dataset
- 数据集来源:牛津大学Visual Geometry Group
- 数据集描述:包含在英国常见的17种花卉的图片,每种花卉有80张图片,总共1360张图片。
- 数据集用途:用于花卉分类任务,基于VGG16卷积神经网络模型。
实验目的
- 利用VGG16模型进行17类花卉的分类。
实验原理
- 图像分类方法:包括传统机器学习算法(如KNN、SVM、决策树)和深度学习算法(如CNN、AlexNet、VGG)。
- VGGNet介绍:由牛津大学计算机视觉组和谷歌DeepMind共同研究的深度卷积神经网络。
实验步骤
- 图片读取:读取图片并调整大小,存储至列表。
- 数据处理:将图片转换为矩阵形式,存储为npy文件,建立类别分类字典。
- 数据集划分:训练集占80%,测试集占20%,设置random_state为1。
- 模型建立:建立Sequential模型,添加层,设置模型训练参数。
- 模型训练:加入EarlyStopping防止过拟合,使用ModelCheckpoint实现断点续训,保存模型为model1.h5。
- 模型预测:使用predict()函数进行预测,调用confusion_matrix()评估模型。
- 预测界面:建立UI进行图片加载和识别。
实验结果
- VGG16模型在17类花卉分类任务中表现出色,具有较好的泛化能力。
实验总结
- 实验表明卷积神经网络在花卉分类任务中具有强大的特征提取能力和分类准确性。通过优化模型训练过程,可以进一步提升模型性能。

中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
FAOSTAT Forestry
FAOSTAT Forestry数据集包含了全球森林资源的相关统计数据,涵盖了森林面积、木材产量、森林管理等多个方面。该数据集提供了详细的国别数据,帮助用户了解全球森林资源的现状和变化趋势。
www.fao.org 收录
光伏电站发电量预估数据
1、准确预测一个地区分布式光伏场站的整体输出功率,可以提高电网的稳定性,增加电网消纳光电能量的能力,在降低能源消耗成本的同时促进低碳能源发展,实现动态供需状态预测的方法,为绿色电力源网荷储的应用落地提供支持。 2、准确预估光伏电站发电量,可以自动发现一些有故障的设备或者低效电站,提升发电效能。1、逆变器及电站数据采集,将逆变器中计算累计发电量数据,告警数据同步到Maxcompute大数据平台 2、天气数据采集, 通过API获取ERA5气象数据包括光照辐射、云量、温度、湿度等 3、数据特征构建, 在大数据处理平台进行数据预处理,用累计发电量矫正小时平均发电功率,剔除异常数据、归一化。告警次数等指标计算 4、异常数据处理, 天气、设备数据根据经纬度信息进行融合, 并对融合后的数据进行二次预处理操作,剔除辐照度和发电异常的一些数据 5、算法模型训练,基于XGBoost算法模型对历史数据进行训练, 生成训练集并保存至OSS 6、算法模型预测,基于XGBoost算法模型接入OSS训练集对增量数据进行预测, 并评估预测准确率等效果数据,其中误差率=(发电量-预估发电量)/发电量,当误差率低于一定阈值时,该数据预测为准确。预测准确率=预测准确数量/预测数据总量。
浙江省数据知识产权登记平台 收录
ISIC 2019
ISIC 2019数据集包含25,331张皮肤病变图像,用于皮肤癌检测挑战。这些图像分为三个类别:良性、恶性黑色素瘤和基底细胞癌。数据集还包括每张图像的元数据,如病变类型、患者年龄和性别等。
challenge2019.isic-archive.com 收录