touche2020
收藏魔搭社区2025-12-04 更新2025-06-14 收录
下载链接:
https://modelscope.cn/datasets/MTEB/touche2020
下载链接
链接失效反馈官方服务:
资源简介:
language:
- en
multilinguality:
- monolingual
task_categories:
- text-retrieval
source_datasets:
- touche2020
task_ids:
- document-retrieval
config_names:
- corpus
tags:
- text-retrieval
dataset_info:
- config_name: default
features:
- name: query-id
dtype: string
- name: corpus-id
dtype: string
- name: score
dtype: float64
splits:
- name: test
num_bytes: 125677
num_examples: 2214
- config_name: corpus
features:
- name: _id
dtype: string
- name: title
dtype: string
- name: text
dtype: string
splits:
- name: corpus
num_bytes: 678068503
num_examples: 382545
- config_name: queries
features:
- name: _id
dtype: string
- name: text
dtype: string
splits:
- name: queries
num_bytes: 2609
num_examples: 49
configs:
- config_name: default
data_files:
- split: test
path: qrels/test.jsonl
- config_name: corpus
data_files:
- split: corpus
path: corpus.jsonl
- config_name: queries
data_files:
- split: queries
path: queries.jsonl
---
语言:
- 英语(en)
多语言属性:
- 单语言(monolingual)
任务类别:
- 文本检索(text-retrieval)
源数据集:
- touche2020
任务子类型:
- 文档检索(document-retrieval)
配置名称:
- 语料库(corpus)
标签:
- 文本检索(text-retrieval)
数据集信息:
- 配置名称:默认(default)
特征:
- 名称:查询ID(query-id),数据类型:字符串(string)
- 名称:语料库ID(corpus-id),数据类型:字符串(string)
- 名称:得分(score),数据类型:float64
划分:
- 名称:测试集(test),字节数:125677,示例数:2214
- 配置名称:语料库(corpus)
特征:
- 名称:标识符(_id),数据类型:字符串(string)
- 名称:标题(title),数据类型:字符串(string)
- 名称:文本内容(text),数据类型:字符串(string)
划分:
- 名称:语料划分(corpus),字节数:678068503,示例数:382545
- 配置名称:查询集(queries)
特征:
- 名称:标识符(_id),数据类型:字符串(string)
- 名称:查询文本(text),数据类型:字符串(string)
划分:
- 名称:查询划分(queries),字节数:2609,示例数:49
配置集:
- 配置名称:默认(default)
数据文件:
- 数据集划分:测试集(test),文件路径:qrels/test.jsonl
- 配置名称:语料库(corpus)
数据文件:
- 数据集划分:语料划分(corpus),文件路径:corpus.jsonl
- 配置名称:查询集(queries)
数据文件:
- 数据集划分:查询划分(queries),文件路径:queries.jsonl
提供机构:
maas
创建时间:
2024-09-06



