MRBench/mbeir_infoseek_task8
收藏Hugging Face2024-06-07 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/MRBench/mbeir_infoseek_task8
下载链接
链接失效反馈官方服务:
资源简介:
---
language:
- en
task_categories:
- multimodal-retrieval
source_datasets:
- m-beir
task_ids:
- image,text-to-image,text
config_names:
- query
- corpus
- qrels
tags:
- information-retrieval
- multimodal-retrieval
dataset_info:
- config_name: qrels
features:
- name: query-id
dtype: string
- name: Q0
dtype: string
- name: corpus-id
dtype: string
- name: score
dtype: int8
splits:
- name: test
num_examples: 131376
- config_name: corpus
features:
- name: id
dtype: string
- name: modality
dtype: string
- name: text
dtype: string
- name: image
dtype: image
splits:
- name: corpus
num_examples: 481782
- config_name: query
features:
- name: id
dtype: string
- name: modality
dtype: string
- name: text
dtype: string
- name: image
dtype: image
splits:
- name: test
num_examples: 17593
configs:
- config_name: qrels
data_files:
- split: test
path: qrels-*
- config_name: corpus
data_files:
- split: corpus
path: corpus-*
- config_name: query
data_files:
- split: test
path: query-*
---
语言:
- 英语
任务类别:
- 多模态检索(multimodal-retrieval)
源数据集:
- m-beir
任务子类型:
- 图像、文本到图像、文本
配置名称:
- 查询集(query)
- 语料库(corpus)
- 相关性标注文件(qrels)
标签:
- 信息检索(information-retrieval)
- 多模态检索(multimodal-retrieval)
数据集信息:
- 配置名称:qrels
特征:
- 名称:query-id,数据类型:字符串
- 名称:Q0,数据类型:字符串
- 名称:corpus-id,数据类型:字符串
- 名称:score,数据类型:int8
拆分:
- 名称:test,样本数量:131376
- 配置名称:corpus
特征:
- 名称:id,数据类型:字符串
- 名称:modality,数据类型:字符串
- 名称:text,数据类型:字符串
- 名称:image,数据类型:图像
拆分:
- 名称:corpus,样本数量:481782
- 配置名称:query
特征:
- 名称:id,数据类型:字符串
- 名称:modality,数据类型:字符串
- 名称:text,数据类型:字符串
- 名称:image,数据类型:图像
拆分:
- 名称:test,样本数量:17593
配置项:
- 配置名称:qrels,数据文件:
- 拆分:test,路径:qrels-*
- 配置名称:corpus,数据文件:
- 拆分:corpus,路径:corpus-*
- 配置名称:query,数据文件:
- 拆分:test,路径:query-*
提供机构:
MRBench
原始信息汇总
数据集概述
语言
- 英语 (en)
任务类别
- 多模态检索 (multimodal-retrieval)
任务ID
- 图像 (image)
- 文本到图像 (text-to-image)
- 文本 (text)
配置名称
- query
- corpus
- qrels
标签
- 信息检索 (information-retrieval)
- 多模态检索 (multimodal-retrieval)
数据集信息
qrels 配置
- 特征:
- query-id: 字符串 (string)
- Q0: 字符串 (string)
- corpus-id: 字符串 (string)
- score: 整数 (int8)
- 分割:
- test: 131376 个样本
corpus 配置
- 特征:
- id: 字符串 (string)
- modality: 字符串 (string)
- text: 字符串 (string)
- image: 图像 (image)
- 分割:
- corpus: 481782 个样本
query 配置
- 特征:
- id: 字符串 (string)
- modality: 字符串 (string)
- text: 字符串 (string)
- image: 图像 (image)
- 分割:
- test: 17593 个样本
配置文件
qrels 配置
- 数据文件:
- test: qrels-*
corpus 配置
- 数据文件:
- corpus: corpus-*
query 配置
- 数据文件:
- test: query-*
搜集汇总
数据集介绍

背景与挑战
背景概述
MRBench/mbeir_infoseek_task8是一个多模态检索数据集,包含图像和文本数据,规模在10万到100万之间,适用于信息检索和多模态检索任务。
以上内容由遇见数据集搜集并总结生成



