MRBench/mbeir_edis_task2
收藏Hugging Face2024-06-07 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/MRBench/mbeir_edis_task2
下载链接
链接失效反馈官方服务:
资源简介:
---
language:
- en
task_categories:
- multimodal-retrieval
source_datasets:
- m-beir
task_ids:
- text-to-image,text
config_names:
- query
- corpus
- qrels
tags:
- information-retrieval
- multimodal-retrieval
dataset_info:
- config_name: qrels
features:
- name: query-id
dtype: string
- name: Q0
dtype: string
- name: corpus-id
dtype: string
- name: score
dtype: int8
splits:
- name: test
num_examples: 8341
- config_name: corpus
features:
- name: id
dtype: string
- name: modality
dtype: string
- name: text
dtype: string
- name: image
dtype: image
splits:
- name: corpus
num_examples: 1047067
- config_name: query
features:
- name: id
dtype: string
- name: modality
dtype: string
- name: text
dtype: string
- name: image
dtype: image
splits:
- name: test
num_examples: 3241
configs:
- config_name: qrels
data_files:
- split: test
path: qrels-*
- config_name: corpus
data_files:
- split: corpus
path: corpus-*
- config_name: query
data_files:
- split: test
path: query-*
---
语言:
- 英语
任务类别:
- 多模态检索(multimodal-retrieval)
源数据集:
- m-beir
任务子类型:
- 文本到图像(text-to-image)、文本
配置名称:
- 查询(query)
- 语料库(corpus)
- qrels
标签:
- 信息检索(information-retrieval)
- 多模态检索(multimodal-retrieval)
数据集信息:
- 配置名称:qrels
字段特征:
- 字段名称:查询ID(query-id),数据类型:字符串
- 字段名称:Q0,数据类型:字符串
- 字段名称:语料库ID(corpus-id),数据类型:字符串
- 字段名称:评分,数据类型:8位整数
数据拆分:
- 拆分名称:测试集,样本数:8341
- 配置名称:语料库(corpus)
字段特征:
- 字段名称:ID,数据类型:字符串
- 字段名称:模态(modality),数据类型:字符串
- 字段名称:文本,数据类型:字符串
- 字段名称:图像(image),数据类型:图像格式
数据拆分:
- 拆分名称:语料库拆分,样本数:1047067
- 配置名称:查询(query)
字段特征:
- 字段名称:ID,数据类型:字符串
- 字段名称:模态(modality),数据类型:字符串
- 字段名称:文本,数据类型:字符串
- 字段名称:图像(image),数据类型:图像格式
数据拆分:
- 拆分名称:测试集,样本数:3241
配置项:
- 配置名称:qrels
数据文件:
- 拆分集:测试集,文件路径:qrels-*
- 配置名称:语料库(corpus)
数据文件:
- 拆分集:语料库拆分,文件路径:corpus-*
- 配置名称:查询(query)
数据文件:
- 拆分集:测试集,文件路径:query-*
提供机构:
MRBench
原始信息汇总
数据集概述
语言
- 英文(en)
任务类别
- 多模态检索(multimodal-retrieval)
任务ID
- 文本到图像(text-to-image)
- 文本(text)
配置名称
- query
- corpus
- qrels
标签
- 信息检索(information-retrieval)
- 多模态检索(multimodal-retrieval)
数据集信息
qrels 配置
- 特征
- query-id: 字符串(string)
- Q0: 字符串(string)
- corpus-id: 字符串(string)
- score: 整数(int8)
- 分割
- test: 8341 个样本
corpus 配置
- 特征
- id: 字符串(string)
- modality: 字符串(string)
- text: 字符串(string)
- image: 图像(image)
- 分割
- corpus: 1047067 个样本
query 配置
- 特征
- id: 字符串(string)
- modality: 字符串(string)
- text: 字符串(string)
- image: 图像(image)
- 分割
- test: 3241 个样本
配置文件路径
qrels 配置
- 数据文件
- test: qrels-*
corpus 配置
- 数据文件
- corpus: corpus-*
query 配置
- 数据文件
- test: query-*
搜集汇总
数据集介绍

背景与挑战
背景概述
MRBench/mbeir_edis_task2是一个多模态数据集,包含图像和文本两种模态,主要用于信息检索和多模态检索任务。数据集规模较大,包含1.05M行corpus数据,总大小为20.1GB,适用于多模态表示和检索研究。
以上内容由遇见数据集搜集并总结生成



