MCAFP
收藏arXiv2016-12-14 更新2024-06-21 收录
下载链接:
http://www.github.com/google/mcafp
下载链接
链接失效反馈官方服务:
资源简介:
MCAFP数据集是由谷歌公司开发的机器阅读理解数据集,包含约200万条新闻文章和相关问题。该数据集利用段落向量模型生成,旨在通过大规模数据提升机器阅读理解能力。数据集内容丰富,覆盖多种语言理解挑战,如词汇匹配、复杂词汇使用和关系确定等。MCAFP数据集的创建过程涉及使用特定的算法从公开可用的新闻数据中提取和生成数据。该数据集主要应用于机器阅读理解领域,旨在通过提供高质量、高容量的训练和测试数据,推动机器理解自然语言文本的能力。
提供机构:
谷歌公司
创建时间:
2016-12-14
搜集汇总
数据集介绍

背景与挑战
背景概述
MCAFP是一个基于Gigaword数据集AFP部分生成的机器阅读理解数据集,包含约200万个示例,采用5选一的多选题形式,人类准确率估计为90%,最佳模型准确率达到83.2%。数据集以加密形式提供,需配合外部LDC数据集使用解码工具生成最终数据。
以上内容由遇见数据集搜集并总结生成



