PAQ (Probably Asked Questions)
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/PAQ
下载链接
链接失效反馈官方服务:
资源简介:
可能问的问题 (PAQ) 是一个非常大的资源,包含 6500 万个自动生成的 QA 对。 PAQ 是 65M 自然语言 QA 对的半结构化知识库 (KB),模型可以记忆和/或学习从中检索。 PAQ 与传统 KB 的不同之处在于问题和答案以自然语言存储,并且生成的问题很可能出现在 ODQA 数据集中。 PAQ 是使用问题生成模型和维基百科自动构建的。
Possible Asked Questions (PAQ) is an extremely large-scale resource containing 65 million automatically generated QA pairs. PAQ is a semi-structured knowledge base (KB) of 65M natural language QA pairs, from which models can either memorize the content or learn to retrieve information. Unlike traditional KBs, PAQ stores both questions and answers in natural language, and the generated questions have a high probability of appearing in ODQA datasets. PAQ is automatically built using question generation models and Wikipedia.
提供机构:
OpenDataLab
创建时间:
2022-05-23



