five

HaineiFRDM Film Restoration Dataset

收藏
arXiv2026-01-01 更新2026-01-05 收录
下载链接:
https://anonymous.4open.science/r/HaineiFRDM
下载链接
链接失效反馈
官方服务:
资源简介:
HaineiFRDM电影修复数据集由同济大学与上海电影修复实验室联合构建,包含真实退化胶片和合成数据两种类型。数据集包含5分钟训练用24fps真实修复影片及10分钟2K分辨率测试影片,通过人工筛选像素匹配的高清帧并标注视频描述,同时采用缺陷模板融合和画质退化模拟技术生成合成数据。该数据集旨在解决开源电影修复方法缺乏高质量训练数据的问题,为高分辨率胶片修复任务提供基准测试支持。

The HaineiFRDM Film Restoration Dataset was jointly developed by Tongji University and the Shanghai Film Restoration Laboratory, encompassing two categories of data: real degraded film footage and synthetic data. The dataset includes a 5-minute 24fps real restored film for training and a 10-minute 2K-resolution test film. High-definition frames with pixel-level matches are manually screened, and video descriptions are annotated for the dataset. Meanwhile, synthetic data is generated using defect template fusion and image quality degradation simulation technologies. This dataset aims to address the shortage of high-quality training data for open-source film restoration methods, and provides benchmark support for high-resolution film restoration tasks.
提供机构:
同济大学; 上海电影修复实验室
创建时间:
2026-01-01
搜集汇总
数据集介绍
main_image_url
构建方式
在电影修复领域,高质量数据集的稀缺长期制约着开源方法的发展。HaineiFRDM数据集的构建采用了双轨策略,一方面从专业修复实验室及商业软件发布的对比视频中,精心筛选并逐帧匹配,收集了像素对齐的高分辨率真实受损与修复后帧序列,并辅以缺陷掩码与视频描述;另一方面,为扩充数据规模,设计了一套合成退化模型,通过采集无瑕疵电影片段与多种真实缺陷模板,结合随机质量退化与胶片纹理模拟,生成了高度逼真的合成退化数据,从而构建了一个包含真实与合成样本的综合性基准。
特点
该数据集的核心特征在于其针对高分辨率电影修复任务的专门化设计。它不仅提供了2K乃至更高分辨率的真实电影扫描帧,弥补了以往开源研究多基于低分辨率裁剪数据的局限,而且涵盖了多样化的拍摄风格、镜头角度以及复杂的结构化缺陷(如划痕、灰尘)与非结构化退化。尤为重要的是,每段数据均配有精确的缺陷掩码、视频内容描述及全局帧信息,为模型理解场景语义、实现局部修复时的全局一致性提供了关键支持,使其能够更贴近专业修复人员的实际工作流程与质量要求。
使用方法
该数据集旨在为基于扩散模型的电影修复算法提供训练与评估基准。研究人员可利用其提供的退化-修复帧对及缺陷掩码,训练模型学习缺陷识别与内容修复的能力。数据集附带的视频描述与全局帧信息,可用于驱动模型的全局提示融合与帧融合模块,增强其对整体场景的理解。在评估阶段,其包含的真实受损电影测试集与合成退化基准,支持对模型在电影级分辨率下的修复效果、细节保持能力以及时序一致性进行全面、客观的量化分析与定性比较。
背景与挑战
背景概述
HaineiFRDM胶片修复数据集由同济大学与上海电影修复实验室于2025年联合构建,旨在应对传统胶片数字化修复中面临的高昂人力成本与技术瓶颈。该数据集聚焦于高分辨率真实退化胶片的修复问题,通过整合真实修复样本与合成退化数据,为基于扩散模型的智能修复方法提供了关键训练与评估基准。其核心研究在于探索扩散模型的内容理解能力,以替代传统基于光流或手工特征的修复方法,从而在保持电影原始美学风格的前提下,高效去除划痕、灰尘等结构化缺陷,并处理色彩退化等非结构化问题,对推动电影文化遗产的数字化保存与自动化修复具有重要意义。
当前挑战
该数据集致力于解决高分辨率真实胶片修复的领域挑战,主要包括:现有开源方法因训练数据质量低下、依赖噪声光流而导致的修复性能有限,难以在快速运动场景中保持时空一致性,且普遍缺乏对2K/4K高分辨率数据的处理能力。在构建过程中,研究团队面临多重挑战:首先,高质量像素对齐的真实修复数据极其稀缺,需从商业修复视频中手动筛选并逐帧校验;其次,为扩充数据规模而设计的合成退化模型,需模拟多种真实缺陷类型并避免引入色彩失真;再者,为适配消费级显卡的显存限制,必须设计分块训练与推理策略,同时解决由此引发的块间纹理与色彩不一致问题;最后,还需构建涵盖不同拍摄风格与退化类型的评估基准,以全面衡量模型在真实场景下的泛化能力。
常用场景
经典使用场景
在电影修复领域,HaineiFRDM数据集为基于扩散模型的高分辨率老电影修复研究提供了核心数据支撑。该数据集通过整合真实退化影片与合成退化数据,构建了包含退化帧、修复帧、缺陷掩膜及视频描述的多模态数据对,为模型训练与评估建立了标准化基准。其典型应用场景聚焦于训练能够理解复杂场景内容并精准识别物理损伤的智能修复模型,尤其针对2K及以上高分辨率影片中难以区分的划痕、灰尘等结构化缺陷。
实际应用
在实际应用层面,HaineiFRDM数据集直接服务于电影修复实验室的工业化流程。它使得在消费级显卡(如24GB显存的RTX 4090)上训练和推理高分辨率影片修复模型成为可能,显著降低了专业修复的时间与经济成本。数据集支撑的模型能够辅助修复专家处理海量帧序列,在保持影片原始美学风格与纹理细节的前提下,自动化去除划痕、灰尘等物理损伤,而将色彩调整、抖动修复等复杂任务留给后续专业环节,实现了人机协同的高效修复范式。
衍生相关工作
围绕HaineiFRDM数据集,衍生出了一系列专注于高效高分辨率视频修复的经典研究工作。这些工作主要沿两个方向拓展:一是借鉴其分块训练与推理框架,发展出更多内存优化的扩散模型架构,以在有限显存下处理4K甚至更高分辨率的视频;二是受其全局-局部融合机制与纹理重建模块的启发,后续研究提出了更精细的跨块一致性保持方法,例如改进的全局残差引导策略和频率域特征对齐技术。这些衍生工作共同推动了基于生成先验的电影修复技术向实用化、高性能方向演进。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作