five

vidore/vidore_v3_hr

收藏
Hugging Face2026-01-15 更新2025-11-15 收录
下载链接:
https://hf-mirror.com/datasets/vidore/vidore_v3_hr
下载链接
链接失效反馈
官方服务:
资源简介:
ViDoRe V3 : HR 数据集是一个由欧洲联盟发布的报告组成的语料库,旨在用于复杂文档理解任务。该数据集包含14个与欧盟人力资源状况相关的文档,文档语言为英文。每个文档通过OCR管道提取了文本内容,并包含文档的图像和页面编号信息。数据集还包括与这些文档相关的查询、相关文档的映射以及原始PDF文件。

The ViDoRe V3 : HR dataset is a corpus of reports released by the European Union, intended for complex-document understanding tasks. This dataset contains 14 documents related to the HR status of the EU, with the documents being in English. Each document has text content extracted via an OCR pipeline, and includes the image of the document and page number information. The dataset also includes queries related to these documents, mappings to relevant documents, and the original PDF files.
提供机构:
vidore
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作