five

MRBench/mbeir_edis_task2

收藏
Hugging Face2024-06-07 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/MRBench/mbeir_edis_task2
下载链接
链接失效反馈
官方服务:
资源简介:
--- language: - en task_categories: - multimodal-retrieval source_datasets: - m-beir task_ids: - text-to-image,text config_names: - query - corpus - qrels tags: - information-retrieval - multimodal-retrieval dataset_info: - config_name: qrels features: - name: query-id dtype: string - name: Q0 dtype: string - name: corpus-id dtype: string - name: score dtype: int8 splits: - name: test num_examples: 8341 - config_name: corpus features: - name: id dtype: string - name: modality dtype: string - name: text dtype: string - name: image dtype: image splits: - name: corpus num_examples: 1047067 - config_name: query features: - name: id dtype: string - name: modality dtype: string - name: text dtype: string - name: image dtype: image splits: - name: test num_examples: 3241 configs: - config_name: qrels data_files: - split: test path: qrels-* - config_name: corpus data_files: - split: corpus path: corpus-* - config_name: query data_files: - split: test path: query-* ---

语言: - 英语 任务类别: - 多模态检索(multimodal-retrieval) 源数据集: - m-beir 任务子类型: - 文本到图像(text-to-image)、文本 配置名称: - 查询(query) - 语料库(corpus) - qrels 标签: - 信息检索(information-retrieval) - 多模态检索(multimodal-retrieval) 数据集信息: - 配置名称:qrels 字段特征: - 字段名称:查询ID(query-id),数据类型:字符串 - 字段名称:Q0,数据类型:字符串 - 字段名称:语料库ID(corpus-id),数据类型:字符串 - 字段名称:评分,数据类型:8位整数 数据拆分: - 拆分名称:测试集,样本数:8341 - 配置名称:语料库(corpus) 字段特征: - 字段名称:ID,数据类型:字符串 - 字段名称:模态(modality),数据类型:字符串 - 字段名称:文本,数据类型:字符串 - 字段名称:图像(image),数据类型:图像格式 数据拆分: - 拆分名称:语料库拆分,样本数:1047067 - 配置名称:查询(query) 字段特征: - 字段名称:ID,数据类型:字符串 - 字段名称:模态(modality),数据类型:字符串 - 字段名称:文本,数据类型:字符串 - 字段名称:图像(image),数据类型:图像格式 数据拆分: - 拆分名称:测试集,样本数:3241 配置项: - 配置名称:qrels 数据文件: - 拆分集:测试集,文件路径:qrels-* - 配置名称:语料库(corpus) 数据文件: - 拆分集:语料库拆分,文件路径:corpus-* - 配置名称:查询(query) 数据文件: - 拆分集:测试集,文件路径:query-*
提供机构:
MRBench
原始信息汇总

数据集概述

语言

  • 英文(en)

任务类别

  • 多模态检索(multimodal-retrieval)

任务ID

  • 文本到图像(text-to-image)
  • 文本(text)

配置名称

  • query
  • corpus
  • qrels

标签

  • 信息检索(information-retrieval)
  • 多模态检索(multimodal-retrieval)

数据集信息

qrels 配置

  • 特征
    • query-id: 字符串(string)
    • Q0: 字符串(string)
    • corpus-id: 字符串(string)
    • score: 整数(int8)
  • 分割
    • test: 8341 个样本

corpus 配置

  • 特征
    • id: 字符串(string)
    • modality: 字符串(string)
    • text: 字符串(string)
    • image: 图像(image)
  • 分割
    • corpus: 1047067 个样本

query 配置

  • 特征
    • id: 字符串(string)
    • modality: 字符串(string)
    • text: 字符串(string)
    • image: 图像(image)
  • 分割
    • test: 3241 个样本

配置文件路径

qrels 配置

  • 数据文件
    • test: qrels-*

corpus 配置

  • 数据文件
    • corpus: corpus-*

query 配置

  • 数据文件
    • test: query-*
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
MRBench/mbeir_edis_task2是一个多模态数据集,包含图像和文本两种模态,主要用于信息检索和多模态检索任务。数据集规模较大,包含1.05M行corpus数据,总大小为20.1GB,适用于多模态表示和检索研究。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作