GooAQ
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/GooAQ
下载链接
链接失效反馈官方服务:
资源简介:
GooAQ 是一个具有多种答案类型的大规模数据集。该数据集包含从 Google 收集的超过 500 万个问题和 300 万个答案。 GooAQ 问题是使用 Google 搜索引擎的自动完成功能半自动收集的。这导致了具有实际兴趣的自然主义问题,这些问题仍然很短,并且使用简单的语言表达。 GooAQ 的答案是从谷歌对收集到的问题的回答中挖掘出来的,特别是从搜索结果中的答案框中。这产生了丰富的答案类型空间,包含文本答案(短和长)以及更结构化的答案,例如集合。
提供机构:
OpenDataLab
创建时间:
2022-08-16
搜集汇总
数据集介绍

背景与挑战
背景概述
GooAQ是一个大规模问答数据集,包含从Google搜索引擎半自动收集的超过500万问题和300万答案,具有自然、简短的问题表达和多样化的答案类型(包括文本和结构化形式)。该数据集由宾夕法尼亚大学等机构于2021年发布,旨在支持开放领域问答研究。
以上内容由遇见数据集搜集并总结生成



