five

ttgroup/blueneg-release

收藏
Hugging Face2025-08-04 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/ttgroup/blueneg-release
下载链接
链接失效反馈
官方服务:
资源简介:
BlueNeg数据集是一个35mm负片数据集,用于恢复通道异质性的退化。该数据集包含损坏的蓝色通道负片、完整的蓝色通道负片、损坏的蓝色通道打印照片、完整的蓝色通道打印照片、损坏的蓝色通道负片预览(反转后)、完整的蓝色通道负片预览(反转后)、伪真实值和测试集。数据集旨在利用红色和绿色通道的信息来恢复蓝色通道,从而恢复彩色照片。数据集包含元信息,如文件名称、分区、是否为测试集、日期、卷号、照片在卷中的编号、位置、地理坐标、胶片类型、路径和场景属性等。数据集遵循特定的命名约定,便于识别和管理文件。许可证允许学术和商业用途,但要求注明版权信息。

The BlueNeg dataset is a 35mm negative film dataset for restoring channel-heterogeneous deterioration. The dataset includes corrupted blue channel negatives, intact blue channel negatives, corrupted blue channel printed photos, intact blue channel printed photos, corrupted blue channel negative previews (after negation), intact blue channel negative previews (after negation), pseudo ground truth, and test sets. The dataset aims to restore the blue channel by exploiting the retained information from the red and green channels to restore color photographs. The dataset includes meta information such as filename, partition, test set flag, date, roll ID, number in roll, location, geographic location, film type, negative path, printed path, preview path, pseudo ground truth path, and scene properties. The dataset follows a specific naming convention for easy file identification and management. The license allows academic and commercial use, but requires attribution of copyright information.
提供机构:
ttgroup
原始信息汇总

BlueNeg: A 35mm Negative Film Dataset for Restoring Channel-Heterogeneous Deterioration

描述

该数据集收集的图像用于研究修复受损负片的问题。由于负片的物理特性,红、绿、蓝光敏层在负片内部的位置不同,因此这三层的退化速率也不同。Tien-Tsin Wong发现蓝色通道相对于其他两个通道更为脆弱,因为蓝色光敏层位于乳剂侧的最外层。这意味着退化速率是异质的。这一特性继承自其祖先,即Prokudin-Gorsky将三种颜色负片(R、G、B)存储在三块单独的玻璃板上。

由于蓝色通道更脆弱,而其他两个通道相对保存完好,这意味着可以通过利用红色和绿色通道中保留的信息来恢复彩色照片。这在最新的AI技术中尤其有效。然而,大多数现有的照片修复技术是基于印刷照片开发的,其退化性质与负片不同。因此,创建了这个数据集。

数据信息

数据源 分区 数量 文件夹 每通道位数 分辨率 文件扩展名 公开
负片 blue-corrupted 297 negative-16bit 16 10,128 x 6,840 dng
负片 blue-intact 194 negative-16bit 16 10,128 x 6,840 dng
印刷照片 blue-corrupted 247 printed-16bit 16 2,994 x 1,920 tif
印刷照片 blue-intact 151 printed-16bit 16 2,994 x 1,920 tif
负片预览(反转后) blue-corrupted 297 negative-preview-8bit 8 1,322 x 892 preview.png
负片预览(反转后) blue-intact 194 negative-preview-8bit 8 1,322 x 892 preview.png
伪真值 blue-corrupted 247 pseudogt-8bit 8 < 1,322 x 892 pseudogt.png
印刷照片(测试集) blue-corrupted 30 - 16 2,994 x 1,920 tif
伪真值(测试集) blue-corrupted 30 - 8 < 1,322 x 892 pseudogt.png

元信息

元信息存储在meta.jsontransformations.pkl中。元信息包括以下字段:

  • meta.json

    • filename
    • partition
    • is_testset
    • date
    • roll_id
    • number_in_roll
    • location
    • geo_location
    • film_type
    • negative_path
    • printed_path
    • preview_path
    • pseudogt_path
    • scene_property
      • is_indoor
      • is_daytime
  • transformations.pkl

    • matrix: 透视投影矩阵,用于将印刷照片扭曲到负片预览
    • bbox: 扭曲后的印刷照片在负片预览中的边界框,格式为[x0, y0, x1, y1],预览[y0:y1, x0:x1, :]与伪真值大小相同

命名约定

YYYYMMDD[R]-NN-NAME.EXT

  • YYYYMMDD: 照片拍摄日期(可能不总是准确,但大致正确)
  • [R]: 卷号,如果可用
  • NN: 卷中的照片编号
  • NAME: 照片名称,通常是地点或照片主题
  • EXT: 文件扩展名,例如.dng, .tif, .preview.png, .pseudogt.png

许可证

本数据集的许可证与CC-BY 4.0精神相同,但请注意,本许可证不是CC-BY 4.0。请查看LICENSE文件以获取更多详细信息。

所有照片由Tien-Tsin Wong拥有并受版权保护。您自动获得使用这些图像进行学术和商业用途的许可,前提是在任何形式的出版、复制、再分发或图像衍生物中包含“版权所有:Tien-Tsin Wong”的图像信用。

引用

如果您发现该数据集对您有用,请在您的工作/出版物中引用以下出版物:

  • Hanyuan Liu, Chengze Li, Minshan Xie, Zhenni Wang, Jiawen Liang, Chi-Sing Leung, and Tien-Tsin Wong, "BlueNeg: A 35mm Negative Film Dataset for Restoring Channel-Heterogeneous Deterioration", arXiv preprint, 2024.

bibtex @misc{blueneg, title={BlueNeg: A 35mm Negative Film Dataset for Restoring Channel-Heterogeneous Deterioration}, author={Hanyuan Liu and Chengze Li and Minshan Xie and Zhenni Wang and Jiawen Liang and Chi-Sing Leung and Tien-Tsin Wong}, year={2024}, eprint={to be updated}, archivePrefix={arXiv}, primaryClass={cs.CV} }

搜集汇总
数据集介绍
main_image_url
构建方式
在影像修复领域,针对负片特有的通道异质性退化问题,BlueNeg数据集的构建体现了严谨的科学方法。该数据集通过采集35毫米负片及其对应的冲印照片,系统性地捕捉了因物理结构导致的蓝色通道优先退化现象。构建过程涉及高精度扫描,生成16位深度的原始负片图像与冲印照片,并辅以经过反相处理的预览图像。同时,通过几何配准技术生成伪真实值,为模型训练提供了可靠的监督信号。数据采集涵盖了多样化的场景与光照条件,确保了样本的代表性与广泛性。
特点
BlueNeg数据集的核心特征在于其精准模拟了负片材料中蓝色感光层因位于乳剂最外层而更易退化的物理特性。数据集包含负片、冲印照片、预览图像及伪真实值四种数据类型,每种均明确标注蓝色通道完好与损坏两种状态。图像具有超高分辨率,负片原始数据可达10128×6840像素,并保存为16位深度的专业格式,保留了丰富的动态范围与细节信息。此外,数据集提供了详尽的元数据,包括拍摄时间、地理位置、场景属性及图像间的几何变换矩阵,为深入研究通道间信息迁移提供了结构化支持。
使用方法
该数据集主要用于训练与评估针对通道异质性退化的图像修复算法。研究人员可加载负片或冲印照片中蓝色通道损坏的图像作为输入,并利用对应的完好通道图像或伪真实值作为训练目标。数据集已按‘blue-corrupted’与‘blue-intact’分区,便于构建有监督学习任务。通过解析附带的元数据文件,可以获取图像配对关系及空间变换参数,实现数据对齐与增强。对于模型测试,未公开的测试集可用于评估算法的泛化性能。使用时应遵循许可协议,在成果中注明图像版权归属。
背景与挑战
背景概述
在数字图像修复领域,针对历史影像的复原研究长期聚焦于印刷照片的退化问题,而忽视了底片材料的独特物理特性。由黄天赐教授及其研究团队构建的BlueNeg数据集,于2025年正式发布,旨在解决35毫米彩色负片因通道异质性退化带来的修复难题。该数据集的核心研究问题源于负片感光乳剂层的物理结构:蓝色感光层位于最外层,使其在长期保存中更易受损,而红、绿通道相对完好。这一特性使得利用红、绿通道的保留信息来重建严重退化的蓝色通道成为可能,为基于人工智能的影像修复技术开辟了新的研究方向,并弥补了现有修复方法在底片材料上的研究空白。
当前挑战
BlueNeg数据集所应对的领域挑战,在于解决彩色负片特有的通道异质性退化问题,这与传统印刷照片的均匀退化模式存在本质区别,要求修复模型能够跨通道迁移信息。在数据集构建过程中,团队面临多重技术挑战:首先,需要精确采集并配准超高分辨率的原始负片扫描图像与对应的印刷照片,以建立可靠的退化-修复对应关系;其次,由于缺乏退化的蓝色通道的真实无损基准,构建有效的伪真值数据成为关键难点,这依赖于复杂的图像配准与投影变换技术;此外,数据集中包含的不同位深、分辨率及文件格式的多种数据分区,也对其在模型训练中的标准化处理提出了更高要求。
常用场景
经典使用场景
在数字图像修复领域,BlueNeg数据集为研究35毫米负片特有的通道异质性退化问题提供了关键资源。该数据集的核心应用场景在于训练和评估针对蓝色通道退化的修复算法,通过利用红色与绿色通道相对完好的信息,引导模型重建受损的蓝色通道,从而恢复负片的原始色彩与细节。这种基于通道间信息迁移的修复范式,为处理历史影像资料中的色彩失真问题奠定了技术基础。
解决学术问题
BlueNeg数据集针对传统图像修复方法在负片修复上的局限性,系统性地解决了通道异质性退化这一学术难题。它使研究者能够深入探究负片三层感光乳剂因物理位置差异导致的非均匀老化机制,并推动开发能够自适应利用多通道信息的修复模型。该数据集的建立填补了负片专用修复数据资源的空白,为计算机视觉与文化遗产保护领域的交叉研究提供了重要的实验平台。
衍生相关工作
围绕BlueNeg数据集,学术界已衍生出一系列专注于通道感知修复的经典研究工作。这些工作主要探索了基于注意力机制的跨通道信息融合网络、针对异质性退化的生成对抗网络架构,以及结合物理退化模型的深度学习框架。相关成果不仅推动了图像修复子领域的发展,也为多模态媒体修复、高动态范围成像等相邻研究方向提供了可借鉴的技术思路与方法论。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作