ImageNet Selected Classes Dataset|图像分类数据集|图像修复数据集
收藏数据集概述
数据集简介
- 项目目标:通过机器学习技术重建图像中的缺失区域,并使用定量指标(如均方误差MSE和平均绝对误差MAE)以及视觉示例与原始图像进行比较。
- 数据集来源:从ImageNet中选取了10个类别:蝴蝶、熊猫、鹦鹉、博美犬、金鱼、大象、猴子、波斯猫、企鹅和小熊猫。
- 图像尺寸:每张图像被调整为224x224像素。
- 掩码区域:随机大小的黑色区域(30x30到60x60像素)模拟缺失数据,掩码位置随机。
- 数据集划分:
- 训练集:70%
- 验证集:10%
- 测试集:20%
模型概述
基线模型
- 描述:为掩码区域分配随机RGB值。
- 结果:
- 均方误差(MSE):1139.2030
- 平均绝对误差(MAE):7.0292
线性回归模型
- 描述:将掩码区域分为4个子区域,并使用线性回归预测每个子区域的像素值。
- 训练:
- 使用Kaiming初始化权重。
- 使用梯度下降法训练权重。
- 结果:
- 均方误差(MSE):446.1911
- 平均绝对误差(MAE):4.4127
基础神经网络
- 描述:使用卷积神经网络(CNN)预测掩码区域子区域的平均RGB值。
- 训练:
- 检测掩码区域并将其分为4x4子区域。
- 使用均方误差(MSE)损失进行训练。
- 结果:
- 均方误差(MSE):336.2765
- 平均绝对误差(MAE):3.4692
注意力模型
- 描述:使用带有空间和通道注意力机制的CNN进行增强重建。
- 组件:
- 空间注意力:突出重要空间区域。
- 通道注意力:调整各个特征通道的重要性。
- 残差和跳跃连接:帮助梯度流动和重用特征。
- 结果:
- 均方误差(MSE):57.1340
- 平均绝对误差(MAE):1.3617
结果总结
指标 | 模型 | 值 |
---|---|---|
均方误差(MSE) | 基线 | 1139.2030 |
线性回归 | 446.1911 | |
神经网络 | 336.2765 | |
注意力(最佳) | 57.1340 | |
平均绝对误差(MAE) | 基线 | 7.0292 |
线性回归 | 4.4127 | |
神经网络 | 3.4692 | |
注意力(最佳) | 1.3617 |
数据集准备
-
下载:从Hugging Face仓库获取数据集。
-
数据集结构:
dataset/ train/ image1.jpg image1_masked.jpg ... validation/ ... test/ ...
-
示例数据集:预处理的数据集可在Google Drive下载。
保存的模型
- 格式:训练好的模型保存为
.pth
文件。 - 示例模型:可在Google Drive下载。

中国近海台风路径集合数据集(1945-2024)
1945-2024年度,中国近海台风路径数据集,包含每个台风的真实路径信息、台风强度、气压、中心风速、移动速度、移动方向。 数据源为获取温州台风网(http://www.wztf121.com/)的真实观测路径数据,经过处理整合后形成文件,如使用csv文件需使用文本编辑器打开浏览,否则会出现乱码,如要使用excel查看数据,请使用xlsx的格式。
国家海洋科学数据中心 收录
中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
EOL (Encyclopedia of Life)
EOL (Encyclopedia of Life) 是一个全球性的合作项目,旨在创建一个包含地球上所有已知物种信息的在线百科全书。数据集包括物种的分类信息、描述、图像、视频、音频以及分布和生态信息等。
eol.org 收录
波士顿房价数据集
波士顿房价数据集是一个经典的机器学习数据集,通常用于回归任务,尤其是房价预测。下方文档中有所有字段顺序的描述。
阿里云天池 收录
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录