CIN-VBMLR

Hugging Face2026-01-23 更新2026-01-24 收录

下载链接：

https://huggingface.co/datasets/Hurtubisedavid/CIN-VBMLR

下载链接

链接失效反馈

官方服务：

资源简介：

CINE-VBMLR是一个专为高端电影摄像机校准和跟踪设计的专用数据集。它引入了一种名为CINE-VBMLR（电影变分贝叶斯多项逻辑回归）的新方法，该方法最初用于眼动估计中的可变模糊模型，用于解决电影环境中的相机姿态和内在参数。该数据集在MELS Studios使用专业电影设备（ARRI）获取，提供高动态范围（HDR）图像以及精确的逐帧镜头数据系统（LDS）元数据。主要目标是训练和验证基于Python的机器学习模型，利用“从散焦深度（DfD）”来提高相机跟踪的准确性，特别是在传统针孔模型失败的情况下（例如，浅景深镜头）。数据集结构包括原始线性像素数据和光学元数据，分别存储在/data和/metadata目录中。元数据模式（LDS）包含每帧的精确数据，如时间码、焦距、光圈值、焦距长度、相机倾斜和滚动数据等。采集细节包括位置、相机系统、镜头、录制格式、分辨率和帧率。理论背景部分解释了CINE-VBMLR方法的起源、适应电影领域的调整以及联合估计的目标。

创建时间：

2026-01-22

原始信息汇总

CINE-VBMLR 数据集概述

数据集基本信息

数据集名称：CINE-VBMLR (Cinema-grade Variable Blur Dataset for Camera Tracking)
许可证：CC-BY-ND-4.0 (Creative Commons Attribution-NonCommercial 4.0 International)
任务类别：深度估计、视频分类、目标检测
标签：相机校准、散焦深度、电影、ARRI、机器学习
数据规模：10B < n < 100B

数据集简介

CINE-VBMLR 是一个专为高端电影相机校准和追踪设计的专用数据集。它引入了一种名为 CINE-VBMLR（Cinema Variational Bayesian Multinomial Logistic Regression）的新方法，该方法改编自最初用于眼动追踪的可变模糊模型，旨在解决电影环境中的相机姿态和内在参数问题。

该数据集在 MELS Studios 使用专业电影设备（ARRI）采集，提供了高动态范围（HDR）图像以及精确的逐帧镜头数据系统（LDS）元数据。

其主要目标是训练和验证基于 Python 的机器学习模型，这些模型利用 散焦深度（DfD） 来提高在传统针孔模型失效（例如浅景深镜头）情况下的相机追踪精度。

数据集结构

数据组织

数据集的结构将原始线性像素数据与光学元数据分开存储：

/data：OpenEXR（.exr）文件序列。
- 格式：RGB Float16（半精度）或 Float32。
- 色彩空间：线性（通过 ACES/CST 从 ARRI LogC3 转换而来）。
- 分辨率：3200 x 1800（源分辨率）。
/metadata：包含帧精确 ARRI LDS 数据的 CSV 文件。

元数据模式（LDS）

每个视频帧对应 CSV 文件中的一行，包含通过 ARRI Meta Extract 提取的真实值：

列键	描述	单位
`Master TC`	源时间码（与 EXR 文件名对齐）	HH:MM:SS:FF
`LDS Focus Distance`	镜头的精确对焦距离	米/英尺
`LDS Iris`	光圈值（T 档）	T-Stop
`LDS Focal Length`	焦距（恒定或变焦）	毫米
`Camera Tilt`	来自相机机身的 IMU 俯仰数据	度
`Camera Roll`	来自相机机身的 IMU 横滚数据	度
`Lens Model`	例如，ARRI Signature Prime 21mm	字符串

采集详情

地点：MELS Studios（蒙特利尔）。
相机系统：ARRI ALEXA Mini LF。
镜头：ARRI Signature Primes（例如，21mm）。
录制格式：Apple ProRes 4444（为科学分析转换为线性 EXR）。
分辨率：3.2K（3200x1800）。
帧率：23.976 fps。

理论背景：CINE-VBMLR 方法

该数据集支持 CINE-VBMLR 方法，该方法将 VBMLR 估计技术应用于相机追踪。

起源（VBMLR）：该方法源自凝视估计研究中描述的可变模糊模型，其中视网膜（或传感器）上的模糊圆用于推断深度和方向 [1]。
电影应用适配：与简单的眼睛或网络摄像头不同，电影镜头具有复杂的光学特性。我们利用空间域中的散焦深度优化技术 [2][3] 来建模点扩散函数（PSF）和弥散圆（CoC）。
联合估计：目标是执行相机模糊和姿态的联合估计 [4]，并使用此数据集中的精确元数据作为监督学习或验证的真实值。

许可与使用条款

数据集许可证：CC-BY-NC-4.0。
- 署名：您必须向作者和 Studios B79/MELS 提供适当的署名。
- 非商业性：未经明确许可，您不得将此材料用于商业目的。
代码许可证：相关源代码在 GitHub 上发布，采用 Apache License 2.0。
商业许可咨询：有关商业合作或许可的询问，请联系 David Hurtubise，邮箱：hurtubisedavid@gmail.com。

创建者

David Hurtubise, Djemel Ziou, Marie-Flavie Auclair Fortier (Université de Sherbrooke)

搜集汇总

数据集介绍

构建方式

在电影工业的精密光学测量领域，CINE-VBMLR数据集的构建体现了对专业级成像质量的极致追求。该数据集于蒙特利尔的MELS Studios内，采用ARRI ALEXA Mini LF摄影机与Signature Prime系列镜头进行采集，确保了影像的高动态范围与光学真实性。原始素材以Apple ProRes 4444格式记录，并科学转换为线性色彩的OpenEXR序列，同时通过ARRI镜头数据系统同步捕获每一帧的精确元数据，包括焦距、光圈、对焦距离及机身姿态，从而为基于离焦深度的相机标定研究提供了结构化的高保真数据基础。

特点

本数据集的核心特征在于其深度融合了电影级影像数据与帧级同步的镜头元数据。所有图像均以3200x1800分辨率存储，保留了线性色彩空间下的浮点精度，有效支持高动态范围下的光学分析。与之配套的LDS元数据表格提供了镜头对焦距离、光圈值、焦距及相机倾斜角等关键参数，形成了完整的真值标注体系。这种数据组织形式特别适用于训练和验证那些依赖离焦信息进行相机姿态与内参联合估计的机器学习模型，为传统针孔模型在浅景深场景中的局限提供了新的解决路径。

使用方法

使用CINE-VBMLR数据集时，研究者可依据其清晰的数据结构展开分析。图像数据存放于`/data`目录，以OpenEXR格式提供，可直接用于离焦深度计算或光学传递函数建模。相应的LDS元数据则存储于`/metadata`的CSV文件中，通过时间码与图像帧精确对齐，便于监督学习中的真值对照。该数据集支持以变分贝叶斯多项逻辑回归为核心的CINE-VBMLR方法，用户可结合深度离焦理论，利用提供的镜头参数优化相机模糊与姿态的联合估计，从而推动电影摄影机跟踪技术的算法创新与性能验证。

背景与挑战

背景概述

CINE-VBMLR数据集由蒙特利尔大学舍布鲁克分校的研究团队于近期创建，旨在推动高端电影摄影机标定与追踪技术的发展。该数据集在MELS工作室利用专业ARRI电影设备采集，整合了高动态范围影像与精确的镜头数据系统元数据。其核心研究问题聚焦于通过散焦深度方法，在浅景深等传统针孔模型失效的复杂电影拍摄场景中，实现相机姿态与内参的联合估计。这一创新为计算机视觉与电影制作的交叉领域提供了高质量的基准数据，有望提升视觉特效与虚拟制作中相机运动的真实感与准确性。

当前挑战

该数据集致力于解决电影级相机追踪中的核心挑战，即在具有复杂光学特性（如显著散焦）的场景下，实现高精度的相机姿态与内参估计。传统基于针孔假设的方法在此类场景中性能显著下降。在构建过程中，研究团队面临多重技术挑战：采集并同步高动态范围线性图像序列与帧级精确的镜头元数据，确保数据的高保真度与一致性；将源于眼球注视估计的变模糊模型，适配至具有非理想光学像差的电影镜头，以建立可靠的散焦深度优化模型；此外，还需在严格的非商业许可框架下，处理与发布大规模专业电影级数据所涉及的技术与合规性问题。

常用场景

经典使用场景

在高端电影制作领域，CINE-VBMLR数据集为相机校准与追踪提供了关键支持。该数据集通过专业ARRI设备采集的高动态范围图像与精确的镜头数据系统元数据，专门用于训练和验证基于深度离焦的机器学习模型。其经典应用场景涉及解决浅景深拍摄中传统针孔模型失效的问题，为电影摄影中的复杂光学特性建模提供了真实世界的数据基础。

实际应用

在实际电影与视觉特效制作中，CINE-VBMLR数据集能够显著提升虚拟摄影机与实拍镜头的匹配精度。通过利用镜头元数据与高分辨率线性图像，该数据集支持开发实时相机跟踪算法，用于增强现实、视觉特效合成以及虚拟制片流程。其非商业许可确保了学术与工业界在创新技术研发中的合规使用，为高质量内容创作提供了可靠的技术支撑。

衍生相关工作

围绕CINE-VBMLR数据集，衍生出了一系列基于变模糊模型与深度离焦的经典研究工作。这些研究包括空间域离焦估计的优化算法、相机模糊与姿态的联合估计方法，以及适用于电影光学特性的参数标定技术。相关成果已发表于《计算机视觉与图像理解》等权威期刊，并推动了眼动估计技术与电影摄影领域的交叉创新，为后续的实时跟踪与三维重建研究奠定了理论基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集