din0s/asqa|自然语言处理数据集|问答系统数据集

hugging_face2022-09-20 更新2024-03-04 收录

自然语言处理

问答系统

下载链接：

https://hf-mirror.com/datasets/din0s/asqa

下载链接

链接失效反馈

资源简介：

ASQA是一个专注于模糊事实问题的首个长篇问答数据集。与以往的长篇答案数据集不同，每个问题都附有长篇答案和可由生成段落回答的抽取式问答对。生成的长篇答案将使用ROUGE和问答准确性进行评估。在论文中，我们展示了这些评估指标与人类判断高度相关。

提供机构：

din0s

原始信息汇总

数据集概述

数据集名称

名称：ASQA
别名：无

数据集基本信息

语言：英语
许可证：Apache-2.0
多语言性：单语
大小：1K<n<10K
来源数据集：扩展自Ambig_QA
标签：事实性问题、长篇答案
任务类别：问答
任务ID：开放领域问答

数据集描述

概述：ASQA是首个专注于模糊事实性问题的长篇问答数据集。与以往的长篇答案数据集不同，每个问题都标注了长篇答案和可从生成文本中提取的问题-答案对。长篇答案的评估使用ROUGE和QA准确性两种指标，这些指标与人类判断高度相关。

支持的任务和排行榜

任务：长篇问答
排行榜：ASQA Leaderboard

数据集结构

数据实例：包含模糊问题、Q&A对、长篇答案等。
数据字段：包括ambiguous_question、annotations、qa_pairs等。
数据分割：训练集4353个实例，开发集948个实例。

附加信息

贡献者：@din0s

AI搜集汇总

数据集介绍

构建方式

ASQA数据集的构建采取了对AmbigQA数据集中每个问题进行长篇回答和提取式问答对标注的方法。该数据集特别关注模糊的事实性问题，旨在通过长篇回答和精确的答案对来评估回答的质量。数据集的构建过程中，每个问题都被专家生成的标注者赋予了长篇答案，并且提供了额外的知识片段以支持答案。

特点

ASQA数据集的特点在于它专注于模糊的事实性问题，并提供了一种新的评估方式，结合了ROUGE和QA准确性两种指标。该数据集包含的问题和答案对经过精心设计，旨在评估模型在生成连贯长篇回答方面的能力，同时确保答案的准确性。此外，数据集的构建考虑了多语言性，尽管目前只提供英语版本。

使用方法

使用ASQA数据集时，用户可以访问包含模糊问题、长篇答案、提取式问答对以及相关维基百科页面的数据实例。数据集分为训练集和开发集，便于模型训练和性能评估。用户可通过Hugging Face的库直接加载数据集，利用其提供的数据字段进行模型的训练和测试，进而提升模型在长篇问答任务上的表现。

背景与挑战

背景概述

ASQA数据集，全称为Ambiguous long-form Question Answering，是由Google Research团队在2022年推出的一项创新性研究。该数据集专注于模糊事实性问题，旨在通过提供长篇回答和可被生成段落回答的提取式问答对，以更全面地解决开放域问答任务。ASQA的创建填补了长篇回答数据集在模糊性问题处理上的空白，其独特的标注方式使得该数据集在评估指标上与人类判断高度相关，对自然语言处理领域，尤其是长篇问答研究产生了重要影响。

当前挑战

ASQA数据集在构建过程中面临的挑战主要包括：如何准确捕捉和标注模糊事实性问题，以及如何确保长篇回答的准确性和相关性。此外，数据集的构建还需解决如何高效地从大量文本中提取有用信息，并构建能够同时满足ROUGE和QA准确度评估的标注系统。在研究领域，ASQA所解决的模糊事实性问题处理，对提升开放域问答系统的准确性和鲁棒性提出了新的挑战。

常用场景

经典使用场景

在深入探讨自然语言处理领域中的长篇问答任务时，ASQA数据集以其独特的专注于模糊事实性问题而备受瞩目。该数据集通过提供既包含长篇回答又包含可由生成段落回答的提取式问答对，成为评估长篇回答质量的重要资源。研究者和开发者通常利用ASQA数据集进行模型训练与测试，以提升模型在理解和生成复杂长篇回答方面的能力。

衍生相关工作

基于ASQA数据集的研究成果，衍生出了一系列相关工作，包括但不限于模糊性问题理解、长篇文本生成、复杂问答系统设计等，进一步推动了自然语言处理领域的学术研究和产业发展。

数据集最近研究