VolE数据集

Name: VolE数据集
Creator: 巴塞罗那大学
Published: 2025-05-15 20:03:05
License: 暂无描述

arXiv2025-05-15 更新2025-05-20 收录

下载链接：

http://arxiv.org/abs/2505.10205v1

下载链接

链接失效反馈

官方服务：

资源简介：

VolE数据集是专门为食品体积估计技术的研究而创建的新数据集，包含21个食品对象，每个对象都具有精确的体积和质量。数据集设计旨在涵盖先前基准中缺失的挑战性场景，以推动食品体积估计技术的发展。数据集的创建过程利用了先进的图像采集和分割技术，确保了数据的准确性和多样性。VolE数据集主要应用于食品体积估计领域，旨在解决传统体积估计方法中存在的问题，如对单目的硬件依赖、深度信息的需求以及校准的复杂性等。通过提供更准确、更具适应性的体积估计方法，VolE数据集有助于提高食品营养管理和健康监测的效率。

The VolE dataset is a novel dataset specifically created for research on food volume estimation techniques. It contains 21 food objects, each with precise volume and mass values. The dataset is designed to cover challenging scenarios missing in previous benchmarks, so as to advance the development of food volume estimation technologies. The creation of the dataset leverages advanced image acquisition and segmentation technologies to ensure data accuracy and diversity. The VolE dataset is primarily applied in the field of food volume estimation, aiming to address the issues existing in traditional volume estimation methods, such as reliance on monocular hardware, requirement for depth information, and complexity of calibration, etc. By providing more accurate and adaptable volume estimation methods, the VolE dataset helps improve the efficiency of food nutrition management and health monitoring.

提供机构：

巴塞罗那大学

创建时间：

2025-05-15

搜集汇总

数据集介绍

构建方式

VolE数据集通过结合增强现实技术与计算机视觉方法构建，利用ARCore/ARKit框架在自由运动场景下捕获多视角图像及相机位置信息。数据采集过程中，采用智能手机内置传感器获取精确的空间坐标，并通过FoodMem模型实现食物视频分割以生成高质量掩膜。该数据集包含21种不同形状、纹理的食物对象，每种对象均通过水置换法测量真实体积和质量作为基准数据，确保数据标注的精确性和可靠性。

特点

VolE数据集的核心特点在于其无参考物、无深度依赖的构建范式，突破了传统方法对专用硬件或固定拍摄环境的限制。数据集涵盖低纹理食物和复杂几何形状场景，每个样本包含360度环绕拍摄的图像序列、AR估计的3D坐标、逐帧分割掩膜及精确的体积-质量元数据。特别设计的自由运动捕获场景模拟真实用餐环境，为食品体积估计研究提供了更贴近实际应用的测试基准。

使用方法

该数据集适用于三维重建与食品体积估计算法的开发与评估。使用时需加载图像序列与对应相机位姿，通过FoodMem生成食物掩膜后输入三维重建管线。研究者可利用提供的真实体积数据验证算法精度，或通过调整帧采样策略（如汉明距离阈值）平衡计算效率与重建质量。数据集支持与MTF、DTU等基准的直接对比，其无标定特性尤其适合移动端膳食评估应用的算法验证。

背景与挑战

背景概述

VolE数据集由Umair Haroon、Ahmad AlMughrabi等研究人员于2025年提出，旨在解决食品体积估计中的关键问题。该数据集专注于通过移动设备驱动的三维重建技术，实现无需参考物体或深度信息的食品体积精确测量。研究团队来自巴塞罗那大学等机构，得到了多项欧盟项目的资助。VolE的创新性在于利用AR兼容移动设备捕获的图像和相机位置信息，结合先进的食品视频分割技术，实现了自由运动场景下的高精度三维建模。该数据集包含21种食品对象的精确地面真实体积和质量数据，填补了食品体积估计领域高质量基准数据集的空白，对医疗营养管理和健康监测应用具有重要意义。

当前挑战

VolE数据集面临的挑战主要体现在两个层面：在领域问题层面，食品体积估计需要克服低纹理物体、无边界重建和复杂几何形状带来的建模困难，传统方法依赖专用硬件或固定环境，难以适应自由运动场景；在构建过程层面，数据采集需解决AR设备空间映射精度、多视角图像配准，以及食品分割掩模的生成一致性等问题。此外，数据标注需要采用水置换法等精密测量技术，其±5mL的误差容限对实验设计提出了严格要求。这些挑战使得食品体积估计成为计算机视觉和三维重建领域尚未完全解决的开放性问题。

常用场景

经典使用场景

VolE数据集在食品体积估计和三维重建领域具有广泛的应用场景。该数据集通过结合移动设备驱动的三维重建技术，能够精确估计自由运动场景中的食品体积。其经典使用场景包括医疗营养管理和健康监测应用，特别是在需要高精度食品体积估计的场合。VolE数据集通过多视角图像和相机位置信息，生成精确的三维模型，为研究人员提供了丰富的实验数据。

解决学术问题

VolE数据集解决了食品体积估计中的多个关键学术问题。首先，它克服了传统方法依赖单目数据或专用硬件的局限性，如三维扫描仪或深度传感器。其次，该数据集通过引入无参考和无深度的框架，显著提高了体积估计的准确性。此外，VolE数据集还解决了食品形状和纹理多样性带来的挑战，通过先进的视频分割技术生成食品掩模，从而提升了三维重建的可靠性。这些创新为食品体积估计领域的研究提供了重要的技术支持和数据基础。

衍生相关工作

VolE数据集衍生了一系列相关研究工作，推动了食品体积估计和三维重建领域的发展。基于该数据集，研究人员提出了多种改进算法，如VolETA和FoodMem，这些方法在食品分割和体积估计任务中表现出色。此外，VolE数据集还激发了关于无参考和无深度框架的研究，为后续工作提供了重要的技术参考。相关研究不仅扩展了VolE数据集的应用范围，还进一步提升了食品体积估计的准确性和效率，为该领域的持续创新奠定了坚实基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集