InFlux
收藏Hugging Face2025-10-24 更新2025-10-25 收录
下载链接:
https://huggingface.co/datasets/princeton-vl/InFlux
下载链接
链接失效反馈官方服务:
资源简介:
InFlux数据集是一个包含动态内参标注的现实世界视频基准测试。它包含386个高分辨率室内外视频,共有143K+帧被标注了地面真实内参。数据集的特点是捕捉了更广泛的内参变化和场景多样性,适用于具有动态相机内参的视频研究。
创建时间:
2025-10-21
原始信息汇总
InFlux数据集概述
数据集简介
InFlux是一个真实世界基准数据集,为具有动态相机内参的视频提供逐帧真实内参标注。与现有基准相比,该数据集捕获了更广泛的内参变化和场景多样性,包含来自386个高分辨率室内外动态相机内参视频的143,000+标注帧。
技术特性
- 数据集格式:视频文件(.mp4)和标注文件(.json)
- 视频特性:包含动态内参、运动物体和相机运动
- 标注内容:逐帧相机内参真值
- 失真模型:采用Brown-Conrady径向-切向畸变模型
数据组成
- 动态内参视频:386个MP4格式视频文件
- 视频帧数与划分文件:video_frame_count_and_split.json
- 验证集真值标注:gt_validation_dict.json
文件结构说明
video_frame_count_and_split.json
- 记录每个视频的帧数量
- 标识视频所属的数据划分(验证集或测试集)
- 结构示例: json { "video_shot_1": { "frame_count": 1234, "split": "val" } }
gt_validation_dict.json
- 提供验证集视频帧的相机内参真值
- 包含内参参数:fx, fy, cx, cy, k1, k2, p1, p2
- 提供镜头元数据:焦距(毫米)、对焦距离(米)
- 支持外推内参值(当镜头元数据超出查找表范围时)
使用要求
- MP4文件需要使用VLC媒体播放器进行本地播放
- 数据下载和提交说明请参考官方GitHub仓库:https://github.com/princeton-vl/InFlux/tree/main
- 更多信息请访问项目网站:https://influx.cs.princeton.edu/
许可信息
- 数据集采用CC-BY-4.0许可协议
搜集汇总
数据集介绍
构建方式
在计算机视觉领域,准确捕捉相机内参的动态变化对于三维重建和视觉定位至关重要。InFlux数据集通过采集386段高分辨率室内外视频,涵盖丰富的光照条件和场景多样性,构建了超过14.3万帧的标注数据。其核心构建方法依赖于查找表插值技术,逐帧生成包含焦距、主点坐标及径向切向畸变参数的精确真值,并通过镜头元数据外推机制确保参数在动态范围内的完整性。
使用方法
研究者可通过解析视频帧序列与配套JSON文件开展内参预测任务。验证集真值字典以键值对结构关联视频帧与内参矩阵,支持端到端模型训练与评估。测试阶段需依据帧数统计文件划分数据流,利用VLC媒体播放器实现视频解码与可视化分析。该数据集为动态相机标定算法提供了标准化评测平台,推动视觉系统在真实场景中的自适应能力发展。
背景与挑战
背景概述
在计算机视觉领域,相机内参标定是三维重建与场景理解的基础任务。由普林斯顿大学视觉与学习实验室开发的InFlux数据集于2024年发布,专注于动态内参标定这一前沿研究方向。该数据集通过386段高分辨率视频和14.3万帧精确标注,首次系统性地捕捉了真实场景中焦距、主点坐标和镜头畸变等内参的连续变化规律,为自动驾驶、增强现实等需要实时相机参数估计的应用提供了关键数据支撑。
当前挑战
动态内参标定面临的核心挑战在于如何建模镜头机械运动与光学特性变化的耦合关系。InFlux构建过程中需克服多维度标注难题:既要通过查找表插值处理镜头元数据的非线性映射,又需在快速变焦场景下保持亚像素级标注精度。数据集设计还须平衡室内外光照差异、运动模糊干扰等实际因素,确保标注数据在复杂物理环境下的可靠性。
常用场景
经典使用场景
在计算机视觉领域,相机内参标定是三维重建与场景理解的基础环节。InFlux数据集凭借其动态内参标注特性,成为评估视觉里程计与同步定位与地图构建算法的基准平台。研究者可借助其逐帧真实值,验证动态场景下相机参数估计模型的鲁棒性,尤其适用于自动驾驶与机器人导航中镜头焦距实时变化的复杂环境。
解决学术问题
该数据集突破了传统静态标定数据集的局限性,为解决动态内参估计这一长期挑战提供了实证基础。通过提供涵盖室内外场景的14.3万帧标注数据,它有效支撑了镜头畸变建模、焦距自适应推理等研究方向,显著提升了视觉系统在真实世界中应对光学参数连续变化的泛化能力,推动了自监督标定与在线校准理论的发展。
实际应用
在工业实践中,InFlux的高精度动态标注为增强现实系统提供了核心支撑。当移动设备在室内外切换时,其镜头参数会因自动对焦与变焦机制产生波动,该数据集可训练模型实时补偿图像畸变,确保虚拟物体与物理场景的精准融合。此外,在智能监控领域,它还能提升移动摄像机的目标跟踪稳定性,避免因焦距变化导致的定位漂移。
数据集最近研究
最新研究方向
在计算机视觉领域,相机内参标定作为三维重建与增强现实等任务的基础环节,其动态变化特性逐渐成为研究焦点。InFlux数据集凭借14.3万帧带动态内参标注的真实场景视频,为镜头畸变实时校正提供了前所未有的数据支撑。当前研究正围绕时序内参预测模型展开探索,通过融合物理镜头元数据与深度学习架构,显著提升了移动拍摄场景下的几何一致性。这一进展不仅推动了自动驾驶视觉系统的鲁棒性优化,更在动态焦距摄影测量领域催生了新型自监督学习方法,为复杂环境下的实时视觉感知奠定了理论基础。
以上内容由遇见数据集搜集并总结生成



