five

PAQ (Probably Asked Questions)

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/PAQ
下载链接
链接失效反馈
官方服务:
资源简介:
可能问的问题 (PAQ) 是一个非常大的资源,包含 6500 万个自动生成的 QA 对。 PAQ 是 65M 自然语言 QA 对的半结构化知识库 (KB),模型可以记忆和/或学习从中检索。 PAQ 与传统 KB 的不同之处在于问题和答案以自然语言存储,并且生成的问题很可能出现在 ODQA 数据集中。 PAQ 是使用问题生成模型和维基百科自动构建的。

Possible Asked Questions (PAQ) is an extremely large-scale resource containing 65 million automatically generated QA pairs. PAQ is a semi-structured knowledge base (KB) of 65M natural language QA pairs, from which models can either memorize the content or learn to retrieve information. Unlike traditional KBs, PAQ stores both questions and answers in natural language, and the generated questions have a high probability of appearing in ODQA datasets. PAQ is automatically built using question generation models and Wikipedia.
提供机构:
OpenDataLab
创建时间:
2022-05-23
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作