FishNoFish

github2024-04-20 更新2024-05-31 收录

下载链接：

https://github.com/HeatherFryling/FishNoFishForAll

下载链接

链接失效反馈

官方服务：

资源简介：

FishNoFish数据集由1592个三元组JPEG sRGB、线性RGB TIFF和对数RGB EXR图像组成，分为1273个训练图像、158个验证图像和161个测试图像。图像被调整到短边为64像素。

The FishNoFish dataset consists of 1,592 triplet sets, with each set containing a JPEG sRGB image, a linear RGB TIFF image, and a log RGB EXR image. These sets are split into 1,273 training samples, 158 validation samples, and 161 test samples. All images are resized to have a shorter side of 64 pixels.

创建时间：

2024-04-15

原始信息汇总

FishNoFish 数据集

数据集描述

FishNoFish 数据集包含 1592 组图像，每组图像包括 sRGB JPEG、线性 RGB TIFF 和 log RGB EXR 格式。数据集分为 1273 张训练图像、158 张验证图像和 161 张测试图像。所有图像的短边被调整为 64 像素。

数据格式

sRGB JPEG
线性 RGB TIFF
log RGB EXR

数据集划分

训练集：1273 张图像
验证集：158 张图像
测试集：161 张图像

数据处理脚本

linearize.py：将 RAW 文件线性化并存储到目标目录。
linearize_resize_min.py：将 RAW 文件转换为 16 位 TIFF 文件，并指定最小边长。
convert_to_log.py：将 16 位 TIFF 文件转换为 32 位 EXR log 图像。
resize_jpg_min.py：调整 JPEG 文件的大小。
resize_linear_min.py：调整线性 RGB 图像的大小。

搜集汇总

数据集介绍

构建方式

FishNoFish数据集的构建基于对图像格式的深入研究，旨在比较JPEG、线性TIFF和log EXR图像在小型卷积神经网络中的性能差异。该数据集包含了1592组三元组图像，分别以sRGB JPEG、线性RGB TIFF和log RGB EXR格式呈现，并被划分为1273张训练图像、158张验证图像和161张测试图像。所有图像均被调整为短边64像素，同时提供了原始相机文件以供进一步实验。

使用方法

使用FishNoFish数据集时，用户首先需克隆项目仓库并下载数据集文件。随后，安装Python 3.10及项目依赖，通过提供的Jupyter Notebook进行实验复现。数据集提供了多种图像处理脚本，如`linearize.py`和`convert_to_log.py`，用于从RAW格式转换为线性或log RGB格式。用户可根据需求选择合适的脚本进行图像预处理，并通过Notebook训练FishNet64模型，探索不同图像格式对模型性能的影响。

背景与挑战

背景概述

FishNoFish数据集由1592组图像组成，每组包含sRGB JPEG、线性RGB TIFF和log RGB EXR三种格式的图像，旨在探索不同图像格式对卷积神经网络性能的影响。该数据集的核心研究问题在于验证log RGB图像是否能为卷积网络提供对强度和颜色平衡变化的鲁棒性。研究由相关领域的学者在2023年提出，其成果发表于BMVC会议，并作为博士论文的一部分，深入探讨了图像格式对计算机视觉任务的影响。FishNoFish数据集的发布为图像处理和计算机视觉领域的研究提供了新的实验平台，特别是在对象检测和阴影去除等任务中，具有重要的应用价值。

当前挑战

FishNoFish数据集面临的挑战主要集中在图像格式的多样性和处理复杂性上。首先，不同格式的图像（如sRGB JPEG、线性RGB TIFF和log RGB EXR）在数据预处理和模型训练过程中表现出不同的特性，这要求研究者具备对多种图像处理技术的深入理解。其次，数据集的构建过程中，如何确保不同格式图像之间的转换精度，避免插值误差和信息丢失，是一个技术难点。此外，数据集的规模相对较小，如何在有限的样本中训练出具有泛化能力的模型，也是一个亟待解决的问题。这些挑战不仅影响了数据集的实际应用效果，也对后续研究提出了更高的技术要求。

常用场景

经典使用场景

FishNoFish数据集的经典使用场景主要集中在图像格式对卷积神经网络（CNN）性能的影响研究中。通过提供同一图像在sRGB JPEG、线性TIFF和log EXR三种格式下的数据，研究者能够比较不同图像格式对小型CNN模型性能的差异。这种比较有助于理解图像格式对模型训练和推理的影响，特别是在对象检测和阴影去除等计算机视觉任务中。

解决学术问题

FishNoFish数据集解决了计算机视觉领域中关于图像格式对模型性能影响的重要学术问题。通过提供同一图像在不同格式下的数据，研究者能够系统地分析和比较sRGB JPEG、线性TIFF和log EXR格式对卷积神经网络的训练和推理性能的影响。这一研究不仅揭示了图像格式对模型性能的潜在影响，还为优化图像处理和模型训练提供了理论依据。

实际应用

FishNoFish数据集在实际应用中具有广泛的应用场景，特别是在需要高精度图像处理的领域，如医学影像分析、自动驾驶和工业检测等。通过比较不同图像格式对模型性能的影响，开发者可以选择最适合特定应用场景的图像格式，从而提高模型的准确性和效率。此外，该数据集还支持对RAW图像的进一步处理和分析，为图像处理技术的实际应用提供了有力支持。

数据集最近研究