five

QUASAR-T (QUestion Answering by Search And Reading – Trivia)

收藏
OpenDataLab2026-05-31 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/QUASAR-T
下载链接
链接失效反馈
官方服务:
资源简介:
QUASAR-T 是一个大规模数据集,旨在评估旨在理解自然语言查询并从大型文本语料库中提取其答案的系统。它由 43,013 个开放域琐事问题及其从各种互联网资源获得的答案组成。 ClueWeb09 作为提取这些答案的背景语料库。这些问题的答案是自由形式的文本,尽管大多数是名词短语。

QUASAR-T is a large-scale dataset designed to evaluate systems that aim to understand natural language queries and extract answers from large text corpora. It comprises 43,013 open-domain trivia questions along with their answers obtained from various internet resources. ClueWeb09 serves as the background corpus for extracting these answers. The answers to these questions are free-form text, though most are noun phrases.
提供机构:
OpenDataLab
创建时间:
2022-08-16
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
QUASAR-T是一个大规模开放域问答数据集,包含43,013个琐事问题及其从互联网资源获取的答案,主要用于评估系统从文本语料库中理解查询并提取答案的能力。该数据集以ClueWeb09为背景语料库,答案形式多为自由文本的名词短语。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作