five

MSMARCO 机器阅读理解数据集

收藏
超神经2021-01-12 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/5028
下载链接
链接失效反馈
官方服务:
资源简介:
MSMARCO 是机器阅读理解数据集,其包含的 1,010,916 个匿名问题均来自 Bing 的搜索查询日志,日志中均包含 AI 生成的答案和 182,669 条人为重写的答案,该数据集还包含从 3,563,535 个文档中提取的 8,841,823 个段落。

MSMARCO is a machine reading comprehension dataset. Its 1,010,916 anonymized questions are all sourced from Bing's search query logs, with each log containing AI-generated answers and 182,669 human-rewritten answers. Additionally, this dataset includes 8,841,823 paragraphs extracted from 3,563,535 documents.
创建时间:
2019-03-05
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
MSMARCO是一个机器阅读理解数据集,包含来自Bing搜索查询的匿名问题、AI生成答案和人为重写答案,以及从大量文档中提取的段落。该数据集由微软发布和更新,并设有对应的排名比赛。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务