kaggle 猫狗大战|图像识别数据集|深度学习数据集
收藏数据集概述
数据集名称
- 名称:cats_vs_dogs
- 别名:kaggle 猫狗大战
数据集组成部分
- 训练集:包含经过裁剪的猫狗图片,数量未详述。
- 验证集:包含分组的猫狗图片,数量未详述。
模型信息
- 模型类型:DNN(深度神经网络)
- 模型参数:
- 所有模型均为img_size 250*250,采用5折验证。
- 模型文件包括:k_1_dnn_250_250.h5, k_2_dnn_250_250.h5, k_3_dnn_250_250.h5, k_4_dnn_250_250.h5, k_5_dnn_250_250.h5
实验结果
- 第一次训练:训练集准确率98%,验证集准确率88%-90%。
- 第二次训练:验证集loss降至0.26左右,准确度超过90%。
- 模型融合:平均融合后的loss为0.21060,测试集上的结果约为92%。
数据处理
- 数据清洗:使用bbox工具裁剪图片,并剔除有问题的训练数据。
- 数据增广:对训练数据进行增广处理,效果显著。
实验配置
- 模型选择:三层卷积网络模型、AlexNet与17层的CNN网络。
- 超参数设置:DNN模型,图像大小为250*250。
- 优化器与激活函数:使用Adam优化器,最后一层激活函数为sigmoid。
- Batch Size:设置为2的幂。

FER2013
FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。
github 收录
中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录
VisDrone2019
VisDrone2019数据集由AISKYEYE团队在天津大学机器学习和数据挖掘实验室收集,包含288个视频片段共261,908帧和10,209张静态图像。数据集覆盖了中国14个不同城市的城市和乡村环境,包括行人、车辆、自行车等多种目标,以及稀疏和拥挤场景。数据集使用不同型号的无人机在各种天气和光照条件下收集,手动标注了超过260万个目标边界框,并提供了场景可见性、对象类别和遮挡等重要属性。
github 收录
GME Data
关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。
github 收录
stochastic/random_streetview_images_pano_v0.0.2
随机街景图像数据集是从randomstreetview.com抓取的带有标签的全景图像。每张图像显示一个可以通过Google Street View访问的位置,这些图像被大致组合以提供单个位置的约360度视角。该数据集的设计目的是仅基于其视觉内容对图像进行地理定位。数据集包含约10,000张图像,涵盖了55个国家的约175张照片,主要集中在欧洲和亚洲。
hugging_face 收录