BVI-CR

Name: BVI-CR
Creator: 布里斯托尔大学视觉研究所
Published: 2024-11-18 07:22:48
License: 暂无描述

arXiv2024-11-18 更新2024-11-20 收录

下载链接：

https://github.com/fan-aaron-zhang/bvi-cr

下载链接

链接失效反馈

官方服务：

资源简介：

BVI-CR数据集是由布里斯托尔大学视觉研究所和Condense Reality Ltd联合创建的多视角体积视频数据集，包含18个多视角RGBD捕捉序列，每个序列包含10个1080p分辨率的视频，时长为10-15秒，帧率为30FPS。数据集内容涵盖多种人类动作，包括单人和多人互动场景，旨在为体积视频压缩、重建和质量评估提供全面的测试平台。数据集的创建过程包括使用Microsoft Azure相机进行多视角捕捉，结合深度传感器生成高质量的3D网格和纹理。该数据集主要应用于虚拟现实和增强现实领域，旨在解决体积视频数据的高效压缩和传输问题。

The BVI-CR dataset is a multi-view volumetric video dataset jointly created by the Vision Institute of the University of Bristol and Condense Reality Ltd. It contains 18 multi-view RGBD capture sequences, each of which consists of 10 videos at 1080p resolution, with a duration of 10 to 15 seconds and a frame rate of 30 FPS. The dataset covers a diverse range of human actions, including single-person and multi-person interactive scenarios, and is designed to serve as a comprehensive testbed for volumetric video compression, reconstruction and quality assessment. The dataset was constructed using Microsoft Azure cameras for multi-view capture, paired with depth sensors to generate high-quality 3D meshes and textures. This dataset is primarily applied in the fields of virtual reality (VR) and augmented reality (AR), aiming to address the challenges of efficient compression and transmission of volumetric video data.

提供机构：

布里斯托尔大学视觉研究所

创建时间：

2024-11-18

原始信息汇总

BVI-CR 数据集概述

数据集名称

BVI-CR

数据集描述

该数据集用于 BVI-CR 数据库。

搜集汇总

数据集介绍

构建方式

BVI-CR数据集的构建基于Condense Reality开发的体积视频捕捉工作室，该工作室配备了十台Microsoft Azure相机，每台相机均配备Time-of-Flight深度传感器，以确保高分辨率RGB视频和深度图像的同步捕捉。在每次捕捉前，所有相机和传感器进行几何校准，以确保3D空间中的精确对齐。捕捉过程中，演员在预定的动作范围内表演，数据随后通过融合RGB和深度数据生成3D多边形网格和相关纹理。这一过程确保了数据的高质量和多样性，为体积视频压缩和重建提供了坚实的基础。

使用方法

BVI-CR数据集适用于多种体积视频处理任务，特别是体积视频压缩和重建。研究者可以使用该数据集来开发和验证新的压缩算法，通过比较不同算法的性能指标如PSNR、SSIM和IV-PSNR来评估其效率和质量。此外，数据集还可用于神经渲染和质量评估等任务，为沉浸式媒体技术的研究提供了一个全面的平台。数据集的公开访问地址为https://github.com/fan-aaron-zhang/bvi-cr，方便研究者获取和使用。

背景与挑战

背景概述

BVI-CR数据集，由布里斯托尔大学视觉研究所（Bristol Vision Institute）和Condense Reality Ltd联合开发，旨在解决体积视频压缩中的关键问题。该数据集创建于2024年，包含了18个多视角RGBD捕捉序列及其相应的纹理多边形网格，描绘了多样的人类动作。每个视频序列包含10个1080p分辨率的视角，时长在10-15秒之间，帧率为30FPS。BVI-CR数据集的推出填补了高质量体积视频数据集的空白，为体积重建、压缩和质量评估等任务提供了重要的开发和验证平台，对沉浸式媒体技术的发展具有显著影响。

当前挑战

BVI-CR数据集在构建过程中面临多项挑战。首先，体积视频数据的获取和处理需要大量的资源和复杂的设备配置，如多摄像头的同步和高精度的3D姿态校准。其次，数据集的设计需涵盖多样的人类动作和复杂的场景，以确保算法在不同条件下的鲁棒性和有效性。此外，体积视频压缩技术的开发和验证依赖于高质量的数据集，而现有数据集在多样性和质量上存在不足。BVI-CR数据集通过提供丰富的多视角捕捉和高质量的3D网格数据，为解决这些挑战提供了坚实的基础。

常用场景

经典使用场景

BVI-CR数据集在多视角体积视频压缩领域展现了其经典应用场景。该数据集通过提供18个多视角RGBD捕捉序列及其相应的纹理多边形网格，为研究人员提供了一个全面的平台，用于开发和验证高效的3D数据压缩方法。这些序列涵盖了多样的人类动作，从基本的肢体运动到复杂的人体变形，为体积视频压缩算法提供了丰富的训练和测试数据。

解决学术问题

BVI-CR数据集解决了在体积视频压缩领域中缺乏全面和高品质数据集的问题。传统上，3D数据压缩方法的开发和验证受限于数据获取的难度和资源消耗。BVI-CR通过提供高质量的多视角捕捉数据，为研究人员提供了一个标准化的测试平台，有助于推动体积视频压缩技术的发展，特别是在神经表示和压缩算法方面。

实际应用

BVI-CR数据集在实际应用中具有广泛的前景，特别是在虚拟现实（VR）和增强现实（AR）领域。例如，在直播演唱会或体育赛事中，体积视频技术可以提供更加沉浸式的观看体验。此外，在沉浸式会议和XR博物馆展览中，BVI-CR数据集可以用于开发和优化体积视频压缩算法，以满足高带宽和低延迟的需求，从而提升用户体验。

数据集最近研究