Natural Questions
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/Natural_Questions
下载链接
链接失效反馈官方服务:
资源简介:
自然问题语料库是一个问答数据集,包含 307,373 个训练示例、7,830 个开发示例和 7,842 个测试示例。每个示例都由 google.com 查询和相应的 Wikipedia 页面组成。每个 Wikipedia 页面都有一个在回答问题的页面上注释的段落(或长答案),以及包含实际答案的注释段落的一个或多个短跨度。然而,长答案和短答案注释可以是空的。如果它们都是空的,那么页面上根本没有答案。如果长答案注释不为空,而短答案注释为空,则注释的段落回答了问题,但找不到明确的简短答案。最后,有 1% 的文档有一段用“是”或“否”的简短答案注释的段落,而不是短跨度列表。
提供机构:
OpenDataLab
创建时间:
2022-08-16



