synthetic_rse_restaurant_filtered_v1.0

Hugging Face2025-03-18 更新2025-03-19 收录

下载链接：

https://huggingface.co/datasets/vidore/synthetic_rse_restaurant_filtered_v1.0

下载链接

链接失效反馈

官方服务：

资源简介：

Vidore Benchmark 2 - ESG Restaurant Dataset是一个针对快餐行业ESG报告的视觉检索任务评估的数据集。它包括一个经过策划的文档集合、查询、相关性判断（qrels）和页面图像。共有30个文档，57个查询，1538个页面和222个相关性判断。

创建时间：

2025-03-07

搜集汇总

数据集介绍

构建方式

该数据集作为Vidore Benchmark 2系列的一部分，专注于快餐行业的环境、社会和治理（ESG）报告。数据集的构建通过精心筛选的文档、查询、相关性判断（qrels）以及页面图像，形成了一个用于视觉检索任务的基准测试集。数据集的结构分为四个主要部分：`docs`、`corpus`、`queries`和`qrels`，分别包含文档元数据、页面级信息、查询信息以及相关性判断。

特点

该数据集的特点在于其专注于快餐行业的ESG报告，提供了丰富的视觉和文本信息。数据集包含30个文档、57个查询、1538个页面图像以及222个相关性判断。每个查询均以法语呈现，且每个查询平均对应3.9个页面。数据集的结构设计使得其特别适用于视觉检索系统的性能评估，尤其是在文档图像理解领域。

使用方法

该数据集主要用于评估视觉检索系统的性能，特别是那些专注于文档图像理解的系统。用户可以通过`vidore-benchmark`命令行工具对模型进行评估。首先，安装`vidore-benchmark`包，然后使用指定的模型和数据集进行测试。具体的评估命令包括模型类、模型名称、数据集名称以及数据集格式等参数。更多使用细节可参考官方文档。

背景与挑战

背景概述

synthetic_rse_restaurant_filtered_v1.0数据集是Vidore Benchmark 2系列的一部分，专注于评估视觉检索应用，特别是与快餐行业的环境、社会和治理（ESG）报告相关的任务。该数据集由ILLUIN Technology等机构的研究人员于2024年创建，旨在为视觉检索系统提供基准测试。数据集包含文档、查询、相关性判断（qrels）以及页面图像，涵盖了30个文档、57个查询和1538个页面。通过该数据集，研究人员能够评估视觉语言模型在文档检索任务中的表现，尤其是在多模态数据（文本与图像）处理方面的能力。

当前挑战

该数据集的核心挑战在于如何有效处理多模态数据，尤其是图像与文本的联合检索任务。由于ESG报告通常包含大量视觉信息（如图表、图像等），如何准确理解并检索这些信息是一个关键问题。此外，数据集的构建过程中也面临了诸多挑战，例如如何确保文档与查询之间的语义一致性，以及如何生成高质量的相关性判断（qrels）。这些挑战不仅要求模型具备强大的视觉理解能力，还需要在文本与图像之间建立有效的关联。因此，该数据集为视觉检索领域的研究提供了重要的实验平台，同时也推动了多模态模型的发展。

常用场景

经典使用场景

synthetic_rse_restaurant_filtered_v1.0数据集主要用于视觉检索系统的评估，特别是在快餐行业的环境、社会和治理（ESG）报告领域。该数据集通过提供文档、查询、相关性判断和页面图像，为研究人员提供了一个标准化的测试平台，用于验证和改进视觉检索模型的性能。

实际应用

在实际应用中，synthetic_rse_restaurant_filtered_v1.0数据集可用于开发自动化文档检索系统，特别是在快餐行业的ESG报告分析中。这些系统可以帮助企业快速检索和分析大量文档中的关键信息，提升决策效率和准确性。

衍生相关工作

该数据集衍生了多项经典工作，特别是在视觉语言模型的应用方面。例如，ColPali模型通过该数据集进行了性能评估，展示了其在文档检索任务中的高效性。此外，该数据集还为其他研究者提供了基准，推动了视觉检索领域的研究进展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集