five

mteb/VidoreSyntheticDocQAHealthcareIndustryRetrieval

收藏
Hugging Face2025-10-21 更新2025-10-25 收录
下载链接:
https://hf-mirror.com/datasets/mteb/VidoreSyntheticDocQAHealthcareIndustryRetrieval
下载链接
链接失效反馈
官方服务:
资源简介:
VidoreSyntheticDocQAHealthcareIndustryRetrieval是一个用于视觉文档检索的任务的数据集,包含了图像和与之相关的文本信息。该数据集专门针对医疗行业的文档进行合成,用于测试文档检索任务。数据集分为三个部分:corpus包含图像和文本信息,qrels包含查询和相关文档的评分信息,queries包含查询信息。数据集可用于评估嵌入模型在视觉文档检索任务上的表现。

VidoreSyntheticDocQAHealthcareIndustryRetrieval is a dataset for visual document retrieval tasks, containing images and associated text information. This dataset is specifically synthesized for documents in the healthcare industry for testing document retrieval tasks. The dataset is divided into three parts: corpus includes image and text information, qrels includes query and relevance document scoring information, and queries includes query information. The dataset can be used to evaluate the performance of embedding models on visual document retrieval tasks.
提供机构:
mteb
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作