DuReader 大规模开放域中文机器阅读理解数据集
收藏超神经2022-09-03 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/15639
下载链接
链接失效反馈官方服务:
资源简介:
DuReader 是一个面向机器阅读理解的大型开放域中文数据集,可用于训练或评估机器阅读理解模型和系统。
DuReader is a large-scale open-domain Chinese dataset for machine reading comprehension, which can be used to train and evaluate machine reading comprehension models and systems.
创建时间:
2022-07-19
搜集汇总
数据集介绍

背景与挑战
背景概述
DuReader 是一个大规模开放域中文机器阅读理解数据集,包含20万个问题、42万个答案和100万个文档,数据源自百度搜索和百度知道,答案由人工标注。该数据集还提供了问题类型的注释,如Entity、Description等,适用于训练和评估机器阅读理解模型。
以上内容由遇见数据集搜集并总结生成



