Adversarial Attack on Generative Search Engine

github2024-06-05 更新2024-06-08 收录

下载链接：

https://github.com/HKUSTGZ-NLP/Adversarial-Attack

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集用于评估生成式搜索引擎在对抗性事实问题上的鲁棒性，包含多种对抗攻击方法下的原始输入和攻击后的输入及答案，数据格式为JSON。

This dataset is designed to evaluate the robustness of generative search engines against adversarial factual questions. It includes original inputs and their corresponding adversarial inputs and answers under various adversarial attack methods, with the data format being JSON.

创建时间：

2024-06-05

原始信息汇总

数据集概述

数据集名称

Adversarial Attack on Generative Search Engine

数据集用途

用于论文《Evaluating Robustness of Generative Search Engine on Adversarial Factoid Questions》的研究，该论文发表于ACL 2024 Findings。

数据集格式

存储格式：JSON
数据结构：
- index
  - "original_input"
  - method name
    - "declare_input"
    - "declare_ans"
      - model_name
        
        text
        
        reference link
    - "question_input"
    - "question_ans"
      - model_name
        
        text
        
        reference link

数据集内容存储位置

原始输入句子：./adversarial_data/input_data
模型响应：./adversarial_data/model_response
分析数据：./adversarial_data/analysis_supplement_data

数据集涉及的模型

Bing
ChatGPT
GPT4
Gemini-Pro
YouChat
PerplexityAI

论文摘要

论文探讨了生成式搜索引擎的鲁棒性，特别是在面对对抗性事实问题时的表现。通过人类评估，展示了不同生成式搜索引擎在多样查询中的错误响应情况，强调了这些系统的安全风险和部署前的严格评估需求。

引用格式

tex @article{hu2024evaluating, title={Evaluating Robustness of Generative Search Engine on Adversarial Factual Questions}, author={Hu, Xuming and Li, Xiaochuan and Chen, Junzhe and Li, Yinghui and Li, Yangning and Li, Xiaoguang and Wang, Yasheng and Liu, Qun and Wen, Lijie and Yu, Philip S and others}, journal={arXiv preprint arXiv:2403.12077}, year={2024} }

搜集汇总

数据集介绍

构建方式

在构建对抗性攻击生成搜索引擎数据集时，研究团队精心挑选了来自互联网的原始输入句子，并应用了多种对抗性攻击方法对其进行处理。这些方法的具体描述详见论文的第2.1节。数据集以JSON格式存储，每个条目包含原始输入、经过特定方法攻击后的输入、以及不同生成搜索引擎和模型的响应。原始输入句子及其问题格式存储在`./adversarial_data/input_data`目录下，而所有生成搜索引擎和模型的响应则存储在`./adversarial_data/model_response`目录下。此外，用于分析的数据补充部分存储在`./adversarial_data/analysis_supplement_data`目录中。

使用方法

使用该数据集时，研究人员可以首先访问`./adversarial_data/input_data`目录，获取原始输入句子及其问题格式。随后，通过分析`./adversarial_data/model_response`目录中的数据，可以评估不同生成搜索引擎和模型在面对对抗性攻击时的响应情况。此外，`./adversarial_data/analysis_supplement_data`目录中的数据补充部分可用于进一步的深入分析。通过这些步骤，研究人员可以全面评估生成搜索引擎的鲁棒性，并提出改进策略。

背景与挑战

背景概述

生成搜索引擎在信息检索领域展现出革命性的潜力，但其基于大型语言模型（LLMs）的响应并非始终准确。为评估生成搜索引擎在对抗性事实问题上的鲁棒性，Hu等人于2024年创建了‘Adversarial Attack on Generative Search Engine’数据集。该数据集收录了多种生成搜索引擎（如Bing Chat、PerplexityAI等）在面对不同对抗性攻击方法时的响应，旨在揭示这些系统在实际高风险环境中可能面临的安全隐患。通过全面的人工评估，研究团队展示了对抗性事实问题在诱导错误响应方面的有效性，强调了生成搜索引擎在部署前的严格评估需求。

当前挑战

该数据集面临的挑战主要集中在两个方面：首先，生成搜索引擎在处理对抗性事实问题时表现出较高的易感性，这揭示了其在安全性方面的潜在风险。其次，数据集构建过程中需模拟黑箱系统访问，确保对抗性攻击方法的真实性和有效性。此外，评估生成搜索引擎的鲁棒性需要跨越多样的查询场景，这增加了数据集的复杂性和分析难度。这些挑战不仅凸显了生成搜索引擎在实际应用中的脆弱性，也为其未来的改进和优化提供了方向。

常用场景

经典使用场景

在生成式搜索引擎的背景下，该数据集被广泛用于评估生成式搜索引擎在面对对抗性事实问题时的鲁棒性。通过模拟多种对抗性攻击方法，研究人员能够系统地分析不同生成式搜索引擎在处理被篡改的输入时的表现。这种经典的使用场景不仅有助于揭示生成式搜索引擎的潜在漏洞，还为提升其安全性提供了宝贵的实验数据。

解决学术问题

该数据集解决了生成式搜索引擎在面对对抗性攻击时的鲁棒性评估问题。通过提供多种对抗性攻击方法和相应的模型响应，研究人员能够量化生成式搜索引擎在不同攻击下的表现，从而揭示其在高风险环境中的潜在安全风险。这一研究不仅填补了生成式搜索引擎在对抗性攻击方面的评估空白，还为未来的安全研究提供了重要的参考依据。

实际应用

在实际应用中，该数据集为生成式搜索引擎的安全性评估提供了关键工具。通过模拟真实的对抗性攻击场景，企业和研究机构能够预先发现并修复生成式搜索引擎的潜在漏洞，从而提升其在实际部署中的安全性。此外，该数据集还可用于训练和验证新的防御机制，确保生成式搜索引擎在面对复杂网络攻击时仍能保持高准确性和可靠性。

数据集最近研究