MS_MARCO
收藏魔搭社区2025-10-15 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/MS_MARCO
下载链接
链接失效反馈官方服务:
资源简介:
displayName: MS MARCO (Microsoft Machine Reading Comprehension Dataset)
labelTypes:
- Text
- Classification
license:
- MS_MARCO Custom
mediaTypes:
- Text
paperUrl: https://arxiv.org/pdf/1908.01519v2.pdf
publishDate: "2016"
publishUrl: https://microsoft.github.io/msmarco/
publisher:
- Microsoft
tags:
- Natural Language
taskTypes:
- Natural Language Generation
- Dialogue Generation
- Text Classification
- Multi-Turn Question Answering
---
# 数据集介绍
## 简介
一个数据集,其中包含 2,221 个来自不同学科(历史、生物学、地理和哲学)的十二年级入学考试的问题,以及来自历史在线测验的 412 个附加问题。
## 引文
```
@article{hardalov2019beyond,
title={Beyond English-only reading comprehension: Experiments in zero-shot multilingual transfer for Bulgarian},
author={Hardalov, Momchil and Koychev, Ivan and Nakov, Preslav},
journal={arXiv preprint arXiv:1908.01519},
year={2019}
}
```
## Download dataset
:modelscope-code[]{type="git"}
显示名称:MS MARCO(微软机器阅读理解数据集,Microsoft Machine Reading Comprehension Dataset)
标签类型:
- 文本
- 分类
许可协议:
- MS_MARCO Custom
媒体类型:
- 文本
论文链接:https://arxiv.org/pdf/1908.01519v2.pdf
发布日期:"2016"
发布主页链接:https://microsoft.github.io/msmarco/
发布方:
- Microsoft(微软)
标签:
- 自然语言
任务类型:
- 自然语言生成
- 对话生成
- 文本分类
- 多轮问答
---
# 数据集介绍
## 简介
本数据集包含2221道来自历史、生物学、地理学与哲学等不同学科的十二年级入学考试题目,以及412道来自历史在线测验的附加试题。
## 引文
@article{hardalov2019beyond,
title={超越仅英语阅读理解:面向保加利亚语的零样本(zero-shot)多语言迁移实验},
author={Hardalov, Momchil and Koychev, Ivan and Nakov, Preslav},
journal={arXiv预印本 arXiv:1908.01519},
year={2019}
}
## 数据集下载
:modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-09



