AIhnIndicRag/msmarco_dev_trimmed
收藏Hugging Face2024-10-02 更新2025-04-26 收录
下载链接:
https://hf-mirror.com/datasets/AIhnIndicRag/msmarco_dev_trimmed
下载链接
链接失效反馈官方服务:
资源简介:
---
language:
- en
multilinguality:
- monolingual
task_categories:
- text-retrieval
source_datasets:
- msmarco
task_ids:
- document-retrieval
config_names:
- corpus
tags:
- text-retrieval
dataset_info:
- config_name: default
features:
- name: query-id
dtype: string
- name: corpus-id
dtype: string
- name: score
dtype: float64
- config_name: corpus
features:
- name: _id
dtype: string
- name: title
dtype: string
- name: text
dtype: string
- config_name: queries
features:
- name: _id
dtype: string
- name: text
dtype: string
configs:
- config_name: default
data_files:
- split: dev
path: qrels/dev.jsonl
- config_name: corpus
data_files:
- split: corpus
path: corpus.jsonl
- config_name: queries
data_files:
- split: queries
path: queries.jsonl
license: cc
---
语言:
- 英语(en)
多语言特性:
- 单语
任务类别:
- 文本检索(text-retrieval)
源数据集:
- MS MARCO
任务子类型:
- 文档检索(document-retrieval)
配置名称:
- 语料库(corpus)
标签:
- 文本检索(text-retrieval)
数据集信息:
- 配置名:默认(default)
特征项:
- 名称:查询ID(query-id)
数据类型:字符串
- 名称:语料库ID(corpus-id)
数据类型:字符串
- 名称:得分(score)
数据类型:双精度浮点数(float64)
- 配置名:语料库(corpus)
特征项:
- 名称:编号(_id)
数据类型:字符串
- 名称:标题(title)
数据类型:字符串
- 名称:文本(text)
数据类型:字符串
- 配置名:查询集(queries)
特征项:
- 名称:编号(_id)
数据类型:字符串
- 名称:文本(text)
数据类型:字符串
配置项:
- 配置名:默认(default)
数据文件:
- 数据拆分:开发集(dev)
路径:qrels/dev.jsonl
- 配置名:语料库(corpus)
数据文件:
- 数据拆分:语料库拆分(corpus)
路径:corpus.jsonl
- 配置名:查询集(queries)
数据文件:
- 数据拆分:查询集拆分(queries)
路径:queries.jsonl
许可证:知识共享许可协议(cc)
提供机构:
AIhnIndicRag



