MSMARCO 机器阅读理解数据集
收藏阿里云天池2026-06-06 更新2024-03-07 收录
下载链接:
https://tianchi.aliyun.com/dataset/88741
下载链接
链接失效反馈官方服务:
资源简介:
MSMARCO 是机器阅读理解数据集,其包含的 1,010,916 个匿名问题均来自 Bing 的搜索查询日志,日志中均包含 AI 生成的答案和 182,669 条人为重写的答案,该数据集还包含从 3,563,535 个文档中提取的 8,841,823 个段落。
MSMARCO is a machine reading comprehension dataset. It contains 1,010,916 anonymized queries originating from Bing search query logs, which are paired with both AI-generated answers and 182,669 human-rewritten answers. Additionally, the dataset includes 8,841,823 passages extracted from 3,563,535 source documents.
提供机构:
阿里云天池
创建时间:
2021-01-20
搜集汇总
数据集介绍

背景与挑战
背景概述
MSMARCO是一个用于机器阅读理解的数据集,包含超过100万个来自Bing搜索日志的匿名问题,这些问题附有AI生成和人为重写的答案,并从数百万文档中提取了大量相关段落。
以上内容由遇见数据集搜集并总结生成



