five

MRBench/mbeir_infoseek_task8

收藏
Hugging Face2024-06-07 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/MRBench/mbeir_infoseek_task8
下载链接
链接失效反馈
官方服务:
资源简介:
--- language: - en task_categories: - multimodal-retrieval source_datasets: - m-beir task_ids: - image,text-to-image,text config_names: - query - corpus - qrels tags: - information-retrieval - multimodal-retrieval dataset_info: - config_name: qrels features: - name: query-id dtype: string - name: Q0 dtype: string - name: corpus-id dtype: string - name: score dtype: int8 splits: - name: test num_examples: 131376 - config_name: corpus features: - name: id dtype: string - name: modality dtype: string - name: text dtype: string - name: image dtype: image splits: - name: corpus num_examples: 481782 - config_name: query features: - name: id dtype: string - name: modality dtype: string - name: text dtype: string - name: image dtype: image splits: - name: test num_examples: 17593 configs: - config_name: qrels data_files: - split: test path: qrels-* - config_name: corpus data_files: - split: corpus path: corpus-* - config_name: query data_files: - split: test path: query-* ---

语言: - 英语 任务类别: - 多模态检索(multimodal-retrieval) 源数据集: - m-beir 任务子类型: - 图像、文本到图像、文本 配置名称: - 查询集(query) - 语料库(corpus) - 相关性标注文件(qrels) 标签: - 信息检索(information-retrieval) - 多模态检索(multimodal-retrieval) 数据集信息: - 配置名称:qrels 特征: - 名称:query-id,数据类型:字符串 - 名称:Q0,数据类型:字符串 - 名称:corpus-id,数据类型:字符串 - 名称:score,数据类型:int8 拆分: - 名称:test,样本数量:131376 - 配置名称:corpus 特征: - 名称:id,数据类型:字符串 - 名称:modality,数据类型:字符串 - 名称:text,数据类型:字符串 - 名称:image,数据类型:图像 拆分: - 名称:corpus,样本数量:481782 - 配置名称:query 特征: - 名称:id,数据类型:字符串 - 名称:modality,数据类型:字符串 - 名称:text,数据类型:字符串 - 名称:image,数据类型:图像 拆分: - 名称:test,样本数量:17593 配置项: - 配置名称:qrels,数据文件: - 拆分:test,路径:qrels-* - 配置名称:corpus,数据文件: - 拆分:corpus,路径:corpus-* - 配置名称:query,数据文件: - 拆分:test,路径:query-*
提供机构:
MRBench
原始信息汇总

数据集概述

语言

  • 英语 (en)

任务类别

  • 多模态检索 (multimodal-retrieval)

任务ID

  • 图像 (image)
  • 文本到图像 (text-to-image)
  • 文本 (text)

配置名称

  • query
  • corpus
  • qrels

标签

  • 信息检索 (information-retrieval)
  • 多模态检索 (multimodal-retrieval)

数据集信息

qrels 配置

  • 特征:
    • query-id: 字符串 (string)
    • Q0: 字符串 (string)
    • corpus-id: 字符串 (string)
    • score: 整数 (int8)
  • 分割:
    • test: 131376 个样本

corpus 配置

  • 特征:
    • id: 字符串 (string)
    • modality: 字符串 (string)
    • text: 字符串 (string)
    • image: 图像 (image)
  • 分割:
    • corpus: 481782 个样本

query 配置

  • 特征:
    • id: 字符串 (string)
    • modality: 字符串 (string)
    • text: 字符串 (string)
    • image: 图像 (image)
  • 分割:
    • test: 17593 个样本

配置文件

qrels 配置

  • 数据文件:
    • test: qrels-*

corpus 配置

  • 数据文件:
    • corpus: corpus-*

query 配置

  • 数据文件:
    • test: query-*
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
MRBench/mbeir_infoseek_task8是一个多模态检索数据集,包含图像和文本数据,规模在10万到100万之间,适用于信息检索和多模态检索任务。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作