Atipico1/nq-test-adv-replace-v3
收藏Hugging Face2024-02-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Atipico1/nq-test-adv-replace-v3
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: question
dtype: string
- name: entity
dtype: string
- name: similar_entity
dtype: string
- name: answers
sequence: string
- name: ctxs
list:
- name: hasanswer
dtype: bool
- name: score
dtype: float64
- name: text
dtype: string
- name: title
dtype: string
- name: masked_query
dtype: string
- name: original_case
list:
- name: answer
dtype: string
- name: context
dtype: string
- name: distance
dtype: string
- name: original_answers
sequence: string
- name: question
dtype: string
- name: unans_case
list:
- name: answer
dtype: string
- name: answers
sequence: string
- name: context
dtype: string
- name: distance
dtype: string
- name: original_answers
sequence: string
- name: question
dtype: string
- name: conflict_case
list:
- name: answer
dtype: string
- name: conflict_context
dtype: string
- name: context
dtype: string
- name: distance
dtype: string
- name: original_answers
sequence: string
- name: question
dtype: string
- name: context
dtype: string
- name: context_vague
dtype: string
- name: entities
dtype: string
- name: entities_count
dtype: int64
- name: adv_sent
dtype: string
- name: adv_passage
dtype: string
- name: hasanswer
dtype: bool
- name: is_adversarial
dtype: bool
splits:
- name: test
num_bytes: 57386242
num_examples: 3610
download_size: 32792526
dataset_size: 57386242
configs:
- config_name: default
data_files:
- split: test
path: data/test-*
---
数据集信息:
特征列表:
- 名称:问题 (question),数据类型:字符串
- 名称:实体 (entity),数据类型:字符串
- 名称:相似实体 (similar_entity),数据类型:字符串
- 名称:答案 (answers),数据类型:字符串序列
- 名称:上下文列表 (ctxs),子特征如下:
- 名称:是否包含答案 (hasanswer),数据类型:布尔型
- 名称:得分 (score),数据类型:64位浮点型
- 名称:文本 (text),数据类型:字符串
- 名称:标题 (title),数据类型:字符串
- 名称:掩码查询 (masked_query),数据类型:字符串
- 名称:原案例集合 (original_case),子特征如下:
- 名称:答案 (answer),数据类型:字符串
- 名称:上下文 (context),数据类型:字符串
- 名称:距离 (distance),数据类型:字符串
- 名称:原始答案序列 (original_answers),数据类型:字符串序列
- 名称:问题 (question),数据类型:字符串
- 名称:无答案案例集合 (unans_case),子特征如下:
- 名称:答案 (answer),数据类型:字符串
- 名称:答案序列 (answers),数据类型:字符串序列
- 名称:上下文 (context),数据类型:字符串
- 名称:距离 (distance),数据类型:字符串
- 名称:原始答案序列 (original_answers),数据类型:字符串序列
- 名称:问题 (question),数据类型:字符串
- 名称:冲突案例集合 (conflict_case),子特征如下:
- 名称:答案 (answer),数据类型:字符串
- 名称:冲突上下文 (conflict_context),数据类型:字符串
- 名称:上下文 (context),数据类型:字符串
- 名称:距离 (distance),数据类型:字符串
- 名称:原始答案序列 (original_answers),数据类型:字符串序列
- 名称:问题 (question),数据类型:字符串
- 名称:上下文 (context),数据类型:字符串
- 名称:模糊上下文 (context_vague),数据类型:字符串
- 名称:实体集合 (entities),数据类型:字符串
- 名称:实体数量 (entities_count),数据类型:64位整型
- 名称:对抗语句 (adv_sent),数据类型:字符串
- 名称:对抗段落 (adv_passage),数据类型:字符串
- 名称:是否包含答案 (hasanswer),数据类型:布尔型
- 名称:是否为对抗样本 (is_adversarial),数据类型:布尔型
数据集划分:
- 划分名称:测试集 (test),字节大小:57386242,样本数量:3610
下载总大小:32792526
数据集总大小:57386242
配置项:
- 配置名称:默认配置 (default),数据文件:
- 划分test对应的文件路径:data/test-*
提供机构:
Atipico1
原始信息汇总
数据集概述
数据特征
- question: 问题,数据类型为字符串。
- entity: 实体,数据类型为字符串。
- similar_entity: 相似实体,数据类型为字符串。
- answers: 答案序列,数据类型为字符串序列。
- ctxs: 上下文列表,包含以下字段:
- hasanswer: 是否有答案,数据类型为布尔值。
- score: 分数,数据类型为浮点数(float64)。
- text: 文本,数据类型为字符串。
- title: 标题,数据类型为字符串。
- masked_query: 掩码查询,数据类型为字符串。
- original_case: 原始案例列表,包含以下字段:
- answer: 答案,数据类型为字符串。
- context: 上下文,数据类型为字符串。
- distance: 距离,数据类型为字符串。
- original_answers: 原始答案序列,数据类型为字符串序列。
- question: 问题,数据类型为字符串。
- unans_case: 无答案案例列表,包含以下字段:
- answer: 答案,数据类型为字符串。
- answers: 答案序列,数据类型为字符串序列。
- context: 上下文,数据类型为字符串。
- distance: 距离,数据类型为字符串。
- original_answers: 原始答案序列,数据类型为字符串序列。
- question: 问题,数据类型为字符串。
- conflict_case: 冲突案例列表,包含以下字段:
- answer: 答案,数据类型为字符串。
- conflict_context: 冲突上下文,数据类型为字符串。
- context: 上下文,数据类型为字符串。
- distance: 距离,数据类型为字符串。
- original_answers: 原始答案序列,数据类型为字符串序列。
- question: 问题,数据类型为字符串。
- context: 上下文,数据类型为字符串。
- context_vague: 模糊上下文,数据类型为字符串。
- entities: 实体,数据类型为字符串。
- entities_count: 实体数量,数据类型为整数(int64)。
- adv_sent: 对抗性句子,数据类型为字符串。
- adv_passage: 对抗性段落,数据类型为字符串。
- hasanswer: 是否有答案,数据类型为布尔值。
- is_adversarial: 是否为对抗性,数据类型为布尔值。
数据分割
- test: 测试集,包含3610个样本,占用57386242字节。
数据集大小
- 下载大小: 32792526字节
- 数据集大小: 57386242字节
配置
- default: 默认配置,测试集数据文件路径为
data/test-*。
搜集汇总
数据集介绍

构建方式
在自然语言处理领域,对抗性样本的构建对于评估模型鲁棒性至关重要。该数据集以NQ(Natural Questions)数据集为基础,通过系统性的实体替换策略生成对抗性样本。具体而言,针对原始问题中的关键实体,研究者识别并替换为语义相似但可能引发模型误判的实体,从而构建出具有挑战性的测试实例。这一过程不仅保留了原始问题的语义框架,还引入了潜在的上下文冲突,为模型评估提供了丰富的对抗性场景。
特点
该数据集的核心特征在于其多层次的结构化设计,涵盖了原始问题、对抗性实体、上下文信息及多种答案变体。每个样本均包含丰富的元数据,如实体相似性标注、答案存在性标识以及对抗性段落,这些元素共同构成了一个复杂的评估环境。特别值得注意的是,数据集引入了冲突上下文与模糊语境,旨在模拟真实世界中信息不一致或模棱两可的场景,从而全面检验模型在复杂语义环境下的推理能力与鲁棒性。
使用方法
该数据集专为测试开放域问答系统的对抗鲁棒性而设计,适用于模型评估与比较研究。使用者可通过加载测试集样本,系统性地分析模型在实体替换对抗攻击下的表现。典型应用包括计算模型在原始问题与对抗性问题上的准确率差异,或深入探究模型在冲突上下文中的答案选择行为。数据集提供的丰富标注信息支持细粒度分析,如答案存在性检测、上下文相关性评估等,为模型改进提供实证依据。
背景与挑战
背景概述
在自然语言处理领域,开放域问答系统的鲁棒性评估一直是研究热点。Atipico1/nq-test-adv-replace-v3数据集由Atipico1团队构建,旨在通过对抗性样本测试模型在实体替换攻击下的表现。该数据集基于Natural Questions(NQ)基准,通过引入相似实体替换机制,模拟真实场景中信息干扰对问答系统的影响。其核心研究问题聚焦于提升模型对语义干扰的抵御能力,为评估和增强问答系统的稳定性提供了重要工具,推动了对抗性测试在自然语言理解中的应用。
当前挑战
该数据集主要应对开放域问答中对抗性攻击的挑战,具体包括模型在实体替换后对问题意图的误判、以及答案在干扰上下文中的定位困难。构建过程中的挑战涉及高质量相似实体的筛选与替换,需确保替换后文本的语义连贯性与自然性;同时,平衡对抗性样本的难度与真实性,避免引入人为偏差,以有效反映模型在实际应用中的脆弱环节。
常用场景
经典使用场景
在开放域问答系统的评估领域,Atipico1/nq-test-adv-replace-v3数据集扮演着至关重要的角色。该数据集通过精心构造的对抗性样本,模拟了真实世界中实体替换所带来的语义干扰,为研究者提供了一个严谨的测试平台,用以检验问答模型在面临信息冲突和语义模糊时的鲁棒性与推理能力。
实际应用
超越纯粹的学术研究,该数据集对于构建高可靠性的实际问答应用具有直接指导意义。例如,在智能客服、知识库检索以及教育辅助系统中,其对抗性测试框架能够帮助开发者预先识别并修复系统在遭遇用户故意误导或信息噪声时可能产生的错误,从而显著提升终端产品的服务质量和用户信任度。
衍生相关工作
基于该数据集的独特设计,一系列探索模型鲁棒性边界的研究工作得以衍生。这些工作不仅包括针对特定对抗模式(如实体替换)的防御算法改进,还催生了更广义的对抗性训练范式、鲁棒性评估基准的构建,以及对模型决策逻辑进行事后分析的诊断工具,共同丰富了自然语言处理中可信人工智能的研究图谱。
以上内容由遇见数据集搜集并总结生成



