Multi-Class weather dataset|天气图像识别数据集|机器学习数据集
收藏数据集概述
数据集名称
Multi-Class weather dataset for Classification task using general VGG and customize VGG model keras
数据集用途
用于分类任务,使用VGG和定制VGG模型进行图像分类。
数据集内容
包含四类天气图像:Cloudy, Rain, shine, and Sunrise。
数据集规模
- 训练集:901张图像
- 测试集:224张图像
- 总计:1122张图像
数据集划分
- 训练集占比:80%
- 测试集占比:20%
图像处理
所有图像被调整为128x128x3的尺寸。
类别分布
Class | No. of Train Images | No. of Test Images |
---|---|---|
cloudy | 240 | 60 |
rain | 172 | 43 |
shine | 203 | 50 |
sunrise | 286 | 71 |
模型架构
Baseline VGG16
- 包含13个卷积层和3个密集层。
- 使用ReLU激活函数和Softmax激活函数。
- 参数总数:65,070,916
- 训练参数:65,070,916
- 非训练参数:0
- 一次训练时间:49s 109ms
- 训练准确率:0.9488
- 测试准确率:0.8482
- 权重文件大小:508,457 KB
Customize VGG16
- 包含10个卷积层。
- 使用Batch Normalization和Dropout以解决过拟合问题。
- 参数总数:3,629,908
- 训练参数:3,629,908
- 非训练参数:0
- 一次训练时间:10s 24ms
- 训练准确率:0.8854
- 测试准确率:0.8661
- 权重文件大小:28,435 KB
实验结果
图像分类性能
- Baseline VGG16:训练准确率0.9488,测试准确率0.8482。
- Customize VGG16:训练准确率0.8854,测试准确率0.8660。
错误分类图像
- Baseline VGG16错误分类图像。
- Customize VGG16错误分类图像。

中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
RAVDESS
情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。
OpenDataLab 收录
猫狗图像数据集
该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。
github 收录
THUCNews
THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。
github 收录
典型分布式光伏出力预测数据集
光伏电站出力数据每5分钟从电站机房监控系统获取;气象实测数据从气象站获取,气象站建于电站30号箱变附近,每5分钟将采集的数据通过光纤传输到机房;数值天气预报数据利用中国电科院新能源气象应用机房的WRF业务系统(包括30TF计算刀片机、250TB并行存储)进行中尺度模式计算后输出预报产品,每日8点前通过反向隔离装置推送到电站内网预测系统。
国家基础学科公共科学数据中心 收录