synthetic_rse_restaurant_filtered_v1.0
收藏Hugging Face2025-03-18 更新2025-03-19 收录
下载链接:
https://huggingface.co/datasets/vidore/synthetic_rse_restaurant_filtered_v1.0
下载链接
链接失效反馈官方服务:
资源简介:
Vidore Benchmark 2 - ESG Restaurant Dataset是一个针对快餐行业ESG报告的视觉检索任务评估的数据集。它包括一个经过策划的文档集合、查询、相关性判断(qrels)和页面图像。共有30个文档,57个查询,1538个页面和222个相关性判断。
创建时间:
2025-03-07
搜集汇总
数据集介绍

构建方式
该数据集作为Vidore Benchmark 2系列的一部分,专注于快餐行业的环境、社会和治理(ESG)报告。数据集的构建通过精心筛选的文档、查询、相关性判断(qrels)以及页面图像,形成了一个用于视觉检索任务的基准测试集。数据集的结构分为四个主要部分:`docs`、`corpus`、`queries`和`qrels`,分别包含文档元数据、页面级信息、查询信息以及相关性判断。
特点
该数据集的特点在于其专注于快餐行业的ESG报告,提供了丰富的视觉和文本信息。数据集包含30个文档、57个查询、1538个页面图像以及222个相关性判断。每个查询均以法语呈现,且每个查询平均对应3.9个页面。数据集的结构设计使得其特别适用于视觉检索系统的性能评估,尤其是在文档图像理解领域。
使用方法
该数据集主要用于评估视觉检索系统的性能,特别是那些专注于文档图像理解的系统。用户可以通过`vidore-benchmark`命令行工具对模型进行评估。首先,安装`vidore-benchmark`包,然后使用指定的模型和数据集进行测试。具体的评估命令包括模型类、模型名称、数据集名称以及数据集格式等参数。更多使用细节可参考官方文档。
背景与挑战
背景概述
synthetic_rse_restaurant_filtered_v1.0数据集是Vidore Benchmark 2系列的一部分,专注于评估视觉检索应用,特别是与快餐行业的环境、社会和治理(ESG)报告相关的任务。该数据集由ILLUIN Technology等机构的研究人员于2024年创建,旨在为视觉检索系统提供基准测试。数据集包含文档、查询、相关性判断(qrels)以及页面图像,涵盖了30个文档、57个查询和1538个页面。通过该数据集,研究人员能够评估视觉语言模型在文档检索任务中的表现,尤其是在多模态数据(文本与图像)处理方面的能力。
当前挑战
该数据集的核心挑战在于如何有效处理多模态数据,尤其是图像与文本的联合检索任务。由于ESG报告通常包含大量视觉信息(如图表、图像等),如何准确理解并检索这些信息是一个关键问题。此外,数据集的构建过程中也面临了诸多挑战,例如如何确保文档与查询之间的语义一致性,以及如何生成高质量的相关性判断(qrels)。这些挑战不仅要求模型具备强大的视觉理解能力,还需要在文本与图像之间建立有效的关联。因此,该数据集为视觉检索领域的研究提供了重要的实验平台,同时也推动了多模态模型的发展。
常用场景
经典使用场景
synthetic_rse_restaurant_filtered_v1.0数据集主要用于视觉检索系统的评估,特别是在快餐行业的环境、社会和治理(ESG)报告领域。该数据集通过提供文档、查询、相关性判断和页面图像,为研究人员提供了一个标准化的测试平台,用于验证和改进视觉检索模型的性能。
实际应用
在实际应用中,synthetic_rse_restaurant_filtered_v1.0数据集可用于开发自动化文档检索系统,特别是在快餐行业的ESG报告分析中。这些系统可以帮助企业快速检索和分析大量文档中的关键信息,提升决策效率和准确性。
衍生相关工作
该数据集衍生了多项经典工作,特别是在视觉语言模型的应用方面。例如,ColPali模型通过该数据集进行了性能评估,展示了其在文档检索任务中的高效性。此外,该数据集还为其他研究者提供了基准,推动了视觉检索领域的研究进展。
以上内容由遇见数据集搜集并总结生成



