five

ravithejads/ms_marco_hi_temp

收藏
Hugging Face2024-03-24 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/ravithejads/ms_marco_hi_temp
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: answers sequence: string - name: passages sequence: - name: is_selected dtype: int32 - name: passage_text dtype: string - name: url dtype: string - name: query dtype: string - name: query_id dtype: int32 - name: query_type dtype: string - name: wellFormedAnswers sequence: string - name: query_hi dtype: string - name: answers_hi dtype: string - name: passage_text_hi sequence: string - name: query_mr dtype: string - name: passage_text_mr sequence: string - name: answers_mr sequence: string - name: query_te dtype: string - name: passage_text_te sequence: string - name: answers_te sequence: string splits: - name: test num_bytes: 660151 num_examples: 20 download_size: 269602 dataset_size: 660151 configs: - config_name: default data_files: - split: test path: data/test-* ---

数据集信息: 特征项: - 名称:答案(answers),数据类型:字符串序列(sequence) - 名称:段落(passages),数据类型为嵌套序列,每个序列元素包含: - is_selected:32位整型(int32) - 段落文本(passage_text):字符串型(string) - 统一资源定位符(url):字符串型(string) - 名称:查询(query),数据类型:字符串型(string) - 名称:查询标识符(query_id),数据类型:32位整型(int32) - 名称:查询类型(query_type),数据类型:字符串型(string) - 名称:规范答案序列(wellFormedAnswers),数据类型:字符串序列(sequence) - 名称:印地语查询字段(query_hi):字符串型(string),其中hi为印地语(Hindi)的ISO 639-1语言代码 - 名称:印地语答案序列(answers_hi):字符串序列(sequence) - 名称:印地语段落文本序列(passage_text_hi):字符串序列(sequence) - 名称:马拉地语查询字段(query_mr):字符串型(string),其中mr为马拉地语(Marathi)的ISO 639-1语言代码 - 名称:马拉地语段落文本序列(passage_text_mr):字符串序列(sequence) - 名称:马拉地语答案序列(answers_mr):字符串序列(sequence) - 名称:泰卢固语查询字段(query_te):字符串型(string),其中te为泰卢固语(Telugu)的ISO 639-1语言代码 - 名称:泰卢固语段落文本序列(passage_text_te):字符串序列(sequence) - 名称:泰卢固语答案序列(answers_te):字符串序列(sequence) 数据集划分: - 划分名称:test,字节占用量:660151,样本数量:20 下载大小:269602,数据集总大小:660151 配置项: - 配置名称:default,数据文件:针对test划分的data/test-* 路径
提供机构:
ravithejads
原始信息汇总

数据集概述

数据集特征

  • answers:字符串序列
  • passages:序列,包含以下字段:
    • is_selected:整型(int32)
    • passage_text:字符串
    • url:字符串
  • query:字符串
  • query_id:整型(int32)
  • query_type:字符串
  • wellFormedAnswers:字符串序列
  • query_hi:字符串
  • answers_hi:字符串
  • passage_text_hi:字符串序列
  • query_mr:字符串
  • passage_text_mr:字符串序列
  • answers_mr:字符串序列
  • query_te:字符串
  • passage_text_te:字符串序列
  • answers_te:字符串序列

数据集分割

  • test
    • 数据量:660151字节
    • 样本数:20

数据集大小

  • 下载大小:269602字节
  • 数据集大小:660151字节

配置

  • default
    • 数据文件路径:data/test-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作