ravithejads/ms_marco_hi_temp
收藏Hugging Face2024-03-24 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/ravithejads/ms_marco_hi_temp
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: answers
sequence: string
- name: passages
sequence:
- name: is_selected
dtype: int32
- name: passage_text
dtype: string
- name: url
dtype: string
- name: query
dtype: string
- name: query_id
dtype: int32
- name: query_type
dtype: string
- name: wellFormedAnswers
sequence: string
- name: query_hi
dtype: string
- name: answers_hi
dtype: string
- name: passage_text_hi
sequence: string
- name: query_mr
dtype: string
- name: passage_text_mr
sequence: string
- name: answers_mr
sequence: string
- name: query_te
dtype: string
- name: passage_text_te
sequence: string
- name: answers_te
sequence: string
splits:
- name: test
num_bytes: 660151
num_examples: 20
download_size: 269602
dataset_size: 660151
configs:
- config_name: default
data_files:
- split: test
path: data/test-*
---
数据集信息:
特征项:
- 名称:答案(answers),数据类型:字符串序列(sequence)
- 名称:段落(passages),数据类型为嵌套序列,每个序列元素包含:
- is_selected:32位整型(int32)
- 段落文本(passage_text):字符串型(string)
- 统一资源定位符(url):字符串型(string)
- 名称:查询(query),数据类型:字符串型(string)
- 名称:查询标识符(query_id),数据类型:32位整型(int32)
- 名称:查询类型(query_type),数据类型:字符串型(string)
- 名称:规范答案序列(wellFormedAnswers),数据类型:字符串序列(sequence)
- 名称:印地语查询字段(query_hi):字符串型(string),其中hi为印地语(Hindi)的ISO 639-1语言代码
- 名称:印地语答案序列(answers_hi):字符串序列(sequence)
- 名称:印地语段落文本序列(passage_text_hi):字符串序列(sequence)
- 名称:马拉地语查询字段(query_mr):字符串型(string),其中mr为马拉地语(Marathi)的ISO 639-1语言代码
- 名称:马拉地语段落文本序列(passage_text_mr):字符串序列(sequence)
- 名称:马拉地语答案序列(answers_mr):字符串序列(sequence)
- 名称:泰卢固语查询字段(query_te):字符串型(string),其中te为泰卢固语(Telugu)的ISO 639-1语言代码
- 名称:泰卢固语段落文本序列(passage_text_te):字符串序列(sequence)
- 名称:泰卢固语答案序列(answers_te):字符串序列(sequence)
数据集划分:
- 划分名称:test,字节占用量:660151,样本数量:20
下载大小:269602,数据集总大小:660151
配置项:
- 配置名称:default,数据文件:针对test划分的data/test-* 路径
提供机构:
ravithejads
原始信息汇总
数据集概述
数据集特征
- answers:字符串序列
- passages:序列,包含以下字段:
- is_selected:整型(int32)
- passage_text:字符串
- url:字符串
- query:字符串
- query_id:整型(int32)
- query_type:字符串
- wellFormedAnswers:字符串序列
- query_hi:字符串
- answers_hi:字符串
- passage_text_hi:字符串序列
- query_mr:字符串
- passage_text_mr:字符串序列
- answers_mr:字符串序列
- query_te:字符串
- passage_text_te:字符串序列
- answers_te:字符串序列
数据集分割
- test:
- 数据量:660151字节
- 样本数:20
数据集大小
- 下载大小:269602字节
- 数据集大小:660151字节
配置
- default:
- 数据文件路径:
data/test-*
- 数据文件路径:



