five

Atipico1/nq-test-adv-replace-v3

收藏
Hugging Face2024-02-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Atipico1/nq-test-adv-replace-v3
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: question dtype: string - name: entity dtype: string - name: similar_entity dtype: string - name: answers sequence: string - name: ctxs list: - name: hasanswer dtype: bool - name: score dtype: float64 - name: text dtype: string - name: title dtype: string - name: masked_query dtype: string - name: original_case list: - name: answer dtype: string - name: context dtype: string - name: distance dtype: string - name: original_answers sequence: string - name: question dtype: string - name: unans_case list: - name: answer dtype: string - name: answers sequence: string - name: context dtype: string - name: distance dtype: string - name: original_answers sequence: string - name: question dtype: string - name: conflict_case list: - name: answer dtype: string - name: conflict_context dtype: string - name: context dtype: string - name: distance dtype: string - name: original_answers sequence: string - name: question dtype: string - name: context dtype: string - name: context_vague dtype: string - name: entities dtype: string - name: entities_count dtype: int64 - name: adv_sent dtype: string - name: adv_passage dtype: string - name: hasanswer dtype: bool - name: is_adversarial dtype: bool splits: - name: test num_bytes: 57386242 num_examples: 3610 download_size: 32792526 dataset_size: 57386242 configs: - config_name: default data_files: - split: test path: data/test-* ---

数据集信息: 特征列表: - 名称:问题 (question),数据类型:字符串 - 名称:实体 (entity),数据类型:字符串 - 名称:相似实体 (similar_entity),数据类型:字符串 - 名称:答案 (answers),数据类型:字符串序列 - 名称:上下文列表 (ctxs),子特征如下: - 名称:是否包含答案 (hasanswer),数据类型:布尔型 - 名称:得分 (score),数据类型:64位浮点型 - 名称:文本 (text),数据类型:字符串 - 名称:标题 (title),数据类型:字符串 - 名称:掩码查询 (masked_query),数据类型:字符串 - 名称:原案例集合 (original_case),子特征如下: - 名称:答案 (answer),数据类型:字符串 - 名称:上下文 (context),数据类型:字符串 - 名称:距离 (distance),数据类型:字符串 - 名称:原始答案序列 (original_answers),数据类型:字符串序列 - 名称:问题 (question),数据类型:字符串 - 名称:无答案案例集合 (unans_case),子特征如下: - 名称:答案 (answer),数据类型:字符串 - 名称:答案序列 (answers),数据类型:字符串序列 - 名称:上下文 (context),数据类型:字符串 - 名称:距离 (distance),数据类型:字符串 - 名称:原始答案序列 (original_answers),数据类型:字符串序列 - 名称:问题 (question),数据类型:字符串 - 名称:冲突案例集合 (conflict_case),子特征如下: - 名称:答案 (answer),数据类型:字符串 - 名称:冲突上下文 (conflict_context),数据类型:字符串 - 名称:上下文 (context),数据类型:字符串 - 名称:距离 (distance),数据类型:字符串 - 名称:原始答案序列 (original_answers),数据类型:字符串序列 - 名称:问题 (question),数据类型:字符串 - 名称:上下文 (context),数据类型:字符串 - 名称:模糊上下文 (context_vague),数据类型:字符串 - 名称:实体集合 (entities),数据类型:字符串 - 名称:实体数量 (entities_count),数据类型:64位整型 - 名称:对抗语句 (adv_sent),数据类型:字符串 - 名称:对抗段落 (adv_passage),数据类型:字符串 - 名称:是否包含答案 (hasanswer),数据类型:布尔型 - 名称:是否为对抗样本 (is_adversarial),数据类型:布尔型 数据集划分: - 划分名称:测试集 (test),字节大小:57386242,样本数量:3610 下载总大小:32792526 数据集总大小:57386242 配置项: - 配置名称:默认配置 (default),数据文件: - 划分test对应的文件路径:data/test-*
提供机构:
Atipico1
原始信息汇总

数据集概述

数据特征

  • question: 问题,数据类型为字符串。
  • entity: 实体,数据类型为字符串。
  • similar_entity: 相似实体,数据类型为字符串。
  • answers: 答案序列,数据类型为字符串序列。
  • ctxs: 上下文列表,包含以下字段:
    • hasanswer: 是否有答案,数据类型为布尔值。
    • score: 分数,数据类型为浮点数(float64)。
    • text: 文本,数据类型为字符串。
    • title: 标题,数据类型为字符串。
  • masked_query: 掩码查询,数据类型为字符串。
  • original_case: 原始案例列表,包含以下字段:
    • answer: 答案,数据类型为字符串。
    • context: 上下文,数据类型为字符串。
    • distance: 距离,数据类型为字符串。
    • original_answers: 原始答案序列,数据类型为字符串序列。
    • question: 问题,数据类型为字符串。
  • unans_case: 无答案案例列表,包含以下字段:
    • answer: 答案,数据类型为字符串。
    • answers: 答案序列,数据类型为字符串序列。
    • context: 上下文,数据类型为字符串。
    • distance: 距离,数据类型为字符串。
    • original_answers: 原始答案序列,数据类型为字符串序列。
    • question: 问题,数据类型为字符串。
  • conflict_case: 冲突案例列表,包含以下字段:
    • answer: 答案,数据类型为字符串。
    • conflict_context: 冲突上下文,数据类型为字符串。
    • context: 上下文,数据类型为字符串。
    • distance: 距离,数据类型为字符串。
    • original_answers: 原始答案序列,数据类型为字符串序列。
    • question: 问题,数据类型为字符串。
  • context: 上下文,数据类型为字符串。
  • context_vague: 模糊上下文,数据类型为字符串。
  • entities: 实体,数据类型为字符串。
  • entities_count: 实体数量,数据类型为整数(int64)。
  • adv_sent: 对抗性句子,数据类型为字符串。
  • adv_passage: 对抗性段落,数据类型为字符串。
  • hasanswer: 是否有答案,数据类型为布尔值。
  • is_adversarial: 是否为对抗性,数据类型为布尔值。

数据分割

  • test: 测试集,包含3610个样本,占用57386242字节。

数据集大小

  • 下载大小: 32792526字节
  • 数据集大小: 57386242字节

配置

  • default: 默认配置,测试集数据文件路径为data/test-*
搜集汇总
数据集介绍
main_image_url
构建方式
在自然语言处理领域,对抗性样本的构建对于评估模型鲁棒性至关重要。该数据集以NQ(Natural Questions)数据集为基础,通过系统性的实体替换策略生成对抗性样本。具体而言,针对原始问题中的关键实体,研究者识别并替换为语义相似但可能引发模型误判的实体,从而构建出具有挑战性的测试实例。这一过程不仅保留了原始问题的语义框架,还引入了潜在的上下文冲突,为模型评估提供了丰富的对抗性场景。
特点
该数据集的核心特征在于其多层次的结构化设计,涵盖了原始问题、对抗性实体、上下文信息及多种答案变体。每个样本均包含丰富的元数据,如实体相似性标注、答案存在性标识以及对抗性段落,这些元素共同构成了一个复杂的评估环境。特别值得注意的是,数据集引入了冲突上下文与模糊语境,旨在模拟真实世界中信息不一致或模棱两可的场景,从而全面检验模型在复杂语义环境下的推理能力与鲁棒性。
使用方法
该数据集专为测试开放域问答系统的对抗鲁棒性而设计,适用于模型评估与比较研究。使用者可通过加载测试集样本,系统性地分析模型在实体替换对抗攻击下的表现。典型应用包括计算模型在原始问题与对抗性问题上的准确率差异,或深入探究模型在冲突上下文中的答案选择行为。数据集提供的丰富标注信息支持细粒度分析,如答案存在性检测、上下文相关性评估等,为模型改进提供实证依据。
背景与挑战
背景概述
在自然语言处理领域,开放域问答系统的鲁棒性评估一直是研究热点。Atipico1/nq-test-adv-replace-v3数据集由Atipico1团队构建,旨在通过对抗性样本测试模型在实体替换攻击下的表现。该数据集基于Natural Questions(NQ)基准,通过引入相似实体替换机制,模拟真实场景中信息干扰对问答系统的影响。其核心研究问题聚焦于提升模型对语义干扰的抵御能力,为评估和增强问答系统的稳定性提供了重要工具,推动了对抗性测试在自然语言理解中的应用。
当前挑战
该数据集主要应对开放域问答中对抗性攻击的挑战,具体包括模型在实体替换后对问题意图的误判、以及答案在干扰上下文中的定位困难。构建过程中的挑战涉及高质量相似实体的筛选与替换,需确保替换后文本的语义连贯性与自然性;同时,平衡对抗性样本的难度与真实性,避免引入人为偏差,以有效反映模型在实际应用中的脆弱环节。
常用场景
经典使用场景
在开放域问答系统的评估领域,Atipico1/nq-test-adv-replace-v3数据集扮演着至关重要的角色。该数据集通过精心构造的对抗性样本,模拟了真实世界中实体替换所带来的语义干扰,为研究者提供了一个严谨的测试平台,用以检验问答模型在面临信息冲突和语义模糊时的鲁棒性与推理能力。
实际应用
超越纯粹的学术研究,该数据集对于构建高可靠性的实际问答应用具有直接指导意义。例如,在智能客服、知识库检索以及教育辅助系统中,其对抗性测试框架能够帮助开发者预先识别并修复系统在遭遇用户故意误导或信息噪声时可能产生的错误,从而显著提升终端产品的服务质量和用户信任度。
衍生相关工作
基于该数据集的独特设计,一系列探索模型鲁棒性边界的研究工作得以衍生。这些工作不仅包括针对特定对抗模式(如实体替换)的防御算法改进,还催生了更广义的对抗性训练范式、鲁棒性评估基准的构建,以及对模型决策逻辑进行事后分析的诊断工具,共同丰富了自然语言处理中可信人工智能的研究图谱。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作