fabianschmidt-cohere/MAIR-CliniDS_2015__mteb
收藏Hugging Face2025-12-05 更新2025-12-20 收录
下载链接:
https://hf-mirror.com/datasets/fabianschmidt-cohere/MAIR-CliniDS_2015__mteb
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
- config_name: corpus
features:
- name: _id
dtype: string
- name: title
dtype: string
- name: text
dtype: string
splits:
- name: corpus
num_bytes: 307704144
num_examples: 15000
download_size: 154992898
dataset_size: 307704144
- config_name: default
features:
- name: query-id
dtype: string
- name: corpus-id
dtype: string
- name: score
dtype: int64
splits:
- name: test
num_bytes: 257234
num_examples: 4990
download_size: 40543
dataset_size: 257234
- config_name: instruction
features:
- name: query-id
dtype: string
- name: instruction
dtype: string
splits:
- name: instruction
num_bytes: 8601
num_examples: 30
download_size: 2892
dataset_size: 8601
- config_name: queries
features:
- name: _id
dtype: string
- name: text
dtype: string
splits:
- name: queries
num_bytes: 21477
num_examples: 30
download_size: 16047
dataset_size: 21477
configs:
- config_name: corpus
data_files:
- split: corpus
path: corpus/corpus-*
- config_name: default
data_files:
- split: test
path: data/test-*
- config_name: instruction
data_files:
- split: instruction
path: instruction/instruction-*
- config_name: queries
data_files:
- split: queries
path: queries/queries-*
---
数据集信息:
- 配置名称:语料库(corpus)
特征字段:
- 字段名:_id,数据类型:字符串
- 字段名:title,数据类型:字符串
- 字段名:text,数据类型:字符串
数据集划分:
- 划分名称:语料库(corpus),占用字节数:307704144,样本总数:15000
下载大小:154992898,数据集总大小:307704144
- 配置名称:默认(default)
特征字段:
- 字段名:查询ID(query-id),数据类型:字符串
- 字段名:语料库ID(corpus-id),数据类型:字符串
- 字段名:评分(score),数据类型:64位整型
数据集划分:
- 划分名称:测试集(test),占用字节数:257234,样本总数:4990
下载大小:40543,数据集总大小:257234
- 配置名称:指令(instruction)
特征字段:
- 字段名:查询ID(query-id),数据类型:字符串
- 字段名:指令(instruction),数据类型:字符串
数据集划分:
- 划分名称:指令集(instruction),占用字节数:8601,样本总数:30
下载大小:2892,数据集总大小:8601
- 配置名称:查询集(queries)
特征字段:
- 字段名:_id,数据类型:字符串
- 字段名:text,数据类型:字符串
数据集划分:
- 划分名称:查询集(queries),占用字节数:21477,样本总数:30
下载大小:16047,数据集总大小:21477
配置项:
- 配置名称:语料库(corpus),数据文件:
- 划分集:语料库(corpus),文件路径:corpus/corpus-*
- 配置名称:默认(default),数据文件:
- 划分集:测试集(test),文件路径:data/test-*
- 配置名称:指令(instruction),数据文件:
- 划分集:指令集(instruction),文件路径:instruction/instruction-*
- 配置名称:查询集(queries),数据文件:
- 划分集:查询集(queries),文件路径:queries/queries-*
提供机构:
fabianschmidt-cohere



