YCB-LUMA

github2024-11-21 更新2024-11-27 收录

下载链接：

https://github.com/tpoellabauer/ycb-luma

下载链接

链接失效反馈

官方服务：

资源简介：

YCB-LUMA数据集是一个用于2D物体检测的YCB亮度键控测试数据集。该数据集包含多个物体的视频和生成的掩码，用于训练和测试物体检测算法。

The YCB-LUMA dataset is a YCB luma-keyed test dataset for 2D object detection. This dataset contains videos of multiple objects and generated masks, which are used for training and testing object detection algorithms.

创建时间：

2024-11-19

原始信息汇总

YCB-LUMA 数据集

概述

YCB-LUMA 数据集用于2D物体检测的亮度键控测试数据集的处理脚本。

使用方法

脚本执行顺序

generate_input_dirs.py (可选)
- 仅在需要创建新的文件夹或在没有输入视频的情况下运行。
generate_masks.py
- 生成掩码和RGB图像，CPU使用率可能较高。
delete_files.py
- 过滤并删除噪声较大或质量差的掩码。
count.py (可选)
- 统计输入视频和生成的掩码数量。

脚本描述

generate_input_dirs.py

根据 data.csv 生成所需的输入目录。
data.csv 使用分号 ; 作为分隔符。
生成的文件夹路径为 <name of dataset>/in/<name of generated directory>。

generate_masks.py

从输入视频生成掩码和RGB图像。
输出目录自动生成。
生成包含视频ID和输入名称的单独CSV文件。

count.py

统计输入视频和生成的掩码数量。
结果保存为单独的CSV文件，使用分号 ; 作为分隔符。

delete_files.py

根据 files_to_delete.csv 删除指定的输出文件。
文件名不需要排序。

引用

如果使用该数据集，请引用以下文献：

@misc{pöllabauer2024ycblumaycbobjectdataset, title={YCB-LUMA: YCB Object Dataset with Luminance Keying for Object Localization}, author={Thomas Pöllabauer}, year={2024}, eprint={2411.13149}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2411.13149}, } @inproceedings{pöllabauer2024fast, title={Fast Training Data Acquisition for Object Detection and Segmentation using Black Screen Luminance Keying}, author={ extbf{Thomas P{"o}llabauer} and Knauthe, Volker and Boller, André and Kuijper, Arjan and Fellner, Dieter}, booktitle={Journal of WSCG}, volume={32}, number={1-2}, pages={101-110}, year={2024}, } @inproceedings{poellabauer2024LUMA++, title={Advanced Post-Processing for Object Detection Dataset Generation}, author={ extbf{Thomas P{"o}llabauer} and Berkei, Sarah and Knauthe, Volker and Kuijper, Arjan}, series={Lecture Notes in Computer Science}, booktitle={Proceedings of the 19th International Symposium on Visual Computing (ISCV24)}, year={2024} }

搜集汇总

数据集介绍

构建方式

在YCB-LUMA数据集的构建过程中，首先通过generate_input_dirs.py脚本根据data.csv文件生成所需的输入目录。随后，generate_masks.py脚本从输入视频中生成掩码和RGB图像，同时自动生成输出目录和包含视频ID及名称的CSV文件。delete_files.py脚本用于过滤和删除噪声或质量差的掩码文件。最后，count.py脚本可选地统计输入视频和生成的掩码数量，并将结果保存为CSV文件。

特点

YCB-LUMA数据集的显著特点在于其针对2D物体检测的优化设计，通过黑屏亮度键控技术生成高质量的掩码图像。数据集的结构化存储方式，使得每个物体的掩码和RGB图像分别存储在独立的文件夹中，便于后续处理和分析。此外，数据集的构建过程中包含了质量控制步骤，确保了数据的准确性和可靠性。

使用方法

使用YCB-LUMA数据集时，首先需运行generate_input_dirs.py脚本生成输入目录，然后将视频文件放入相应目录。接着，运行generate_masks.py脚本生成掩码和RGB图像。若需过滤噪声文件，可运行delete_files.py脚本。最后，可选地使用count.py脚本统计数据集中的视频和掩码数量。数据集的输出结果可用于进一步的物体检测和分割任务。

背景与挑战

背景概述

YCB-LUMA数据集是由Thomas Pöllabauer等研究人员于2024年创建，专注于2D物体检测领域。该数据集通过使用亮度键控技术，为YCB物体数据集增加了新的维度，旨在提升物体定位的准确性。主要研究人员包括Thomas Pöllabauer及其团队，他们在计算机视觉领域具有深厚的研究背景。YCB-LUMA数据集的创建不仅丰富了现有的物体检测数据资源，还为相关研究提供了新的实验平台，推动了2D物体检测技术的发展。

当前挑战

YCB-LUMA数据集在构建过程中面临多项挑战。首先，亮度键控技术的应用需要高计算资源，可能导致CPU使用率过高，影响设备性能。其次，数据集的生成过程涉及多个步骤，如视频处理、掩码生成和文件删除，这些步骤的自动化和效率提升是一个重要挑战。此外，数据集的质量控制，特别是噪声过滤和不良掩码的删除，也是确保数据集准确性和可用性的关键问题。最后，数据集的扩展性和适应性，即如何快速适应新物体或新场景的需求，也是未来研究的重要方向。

常用场景

经典使用场景

YCB-LUMA数据集在二维物体检测领域中，主要用于生成和处理物体掩码（masks）和RGB图像。通过一系列脚本，如generate_masks.py，该数据集能够从输入视频中提取关键帧，并生成相应的掩码和RGB图像，为后续的物体检测和分割任务提供高质量的训练数据。这一过程不仅自动化程度高，而且能够有效过滤噪声，确保数据的纯净性。

解决学术问题

YCB-LUMA数据集解决了在二维物体检测中，如何高效且准确地生成训练数据的问题。传统的数据采集方法往往依赖于手工标注，耗时且易出错。YCB-LUMA通过自动化的脚本处理，不仅提高了数据生成的效率，还减少了人为误差，为学术研究提供了更为可靠的数据支持。此外，该数据集的应用也推动了相关算法在物体检测和分割任务中的性能提升。

衍生相关工作

基于YCB-LUMA数据集，许多相关研究工作得以展开。例如，Thomas Pöllabauer等人提出了“Fast Training Data Acquisition for Object Detection and Segmentation using Black Screen Luminance Keying”方法，进一步优化了数据采集的速度和精度。此外，“Advanced Post-Processing for Object Detection Dataset Generation”研究则探讨了如何通过高级后处理技术提升数据集的质量，这些工作都极大地丰富了二维物体检测领域的研究内容。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集