five

ravithejads/ms_marco_hi_mr

收藏
Hugging Face2024-03-24 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/ravithejads/ms_marco_hi_mr
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个特征,如答案、段落、查询等,并且支持多种语言(如印地语、马拉地语)。数据集包含一个测试集,大小为218320193字节,包含9650个示例。数据集的下载大小为78984379字节。

该数据集包含多个特征,如答案、段落、查询等,并且支持多种语言(如印地语、马拉地语)。数据集包含一个测试集,大小为218320193字节,包含9650个示例。数据集的下载大小为78984379字节。
提供机构:
ravithejads
原始信息汇总

数据集概述

数据集特征

  • answers:字符串序列
  • passages:序列类型,包含以下字段:
    • is_selected:整数类型(int32)
    • passage_text:字符串类型
    • url:字符串类型
  • query:字符串类型
  • query_id:整数类型(int32)
  • query_type:字符串类型
  • wellFormedAnswers:字符串序列
  • query_hi:字符串类型
  • answers_hi:字符串类型
  • passage_text_hi:字符串序列
  • query_mr:字符串类型
  • passage_text_mr:字符串序列
  • answers_mr:字符串序列

数据集划分

  • test
    • num_bytes:218320193字节
    • num_examples:9650个样本

数据集大小

  • download_size:78984379字节
  • dataset_size:218320193字节

配置信息

  • config_name:default
  • data_files
    • split:test
    • path:data/test-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作