Data Advisor

github2024-10-13 更新2024-10-16 收录

下载链接：

https://github.com/FeiWang96/Data-Advisor

下载链接

链接失效反馈

官方服务：

资源简介：

Data Advisor 是一个用于生成安全对齐数据的数据集，旨在帮助大型语言模型进行安全对齐。

Data Advisor is a dataset dedicated to generating safety-aligned data, aimed at assisting large language models with their safety alignment work.

创建时间：

2024-10-04

原始信息汇总

Data Advisor 数据集概述

数据集简介

名称: Data Advisor
来源: EMNLP 2024
主题: 大型语言模型的安全对齐动态数据管理
相关链接:

数据生成

Data Advisor: bash python data_advisor.py python response_generation.py
Self-Instruct: bash python self_instruct.py python response_generation.py

训练

准备 Alpagasus 数据: bash python utils/export_alpagasus.py
训练目标模型: bash python train_target_model.py

评估

模型安全性评估:
- CatQA: bash bash scripts/eval_catqa.sh
- BeaverTails: bash bash scripts/eval_beavertails.sh
模型效用评估: bash bash scripts/eval_mmlu.sh

引用

@inproceedings{wang2024data, title={Data Advisor: Dynamic Data Curation for Safety Alignment of Large Language Models}, author={Wang, Fei and Mehrabi, Ninareh and Goyal, Palash and Gupta, Rahul and Chang, Kai-Wei and Galstyan, Aram}, booktitle={Proceedings of EMNLP 2024}, year={2024} }

搜集汇总

数据集介绍

构建方式

Data Advisor数据集的构建方式主要通过动态数据管理来确保大型语言模型的安全性对齐。具体而言，该数据集通过执行`data_advisor.py`和`response_generation.py`脚本生成安全对齐数据，同时也可通过`self_instruct.py`脚本生成自指导的安全对齐数据。这些脚本生成的数据随后用于训练目标模型，确保其在处理敏感信息时的安全性和可靠性。

特点

Data Advisor数据集的核心特点在于其动态数据管理能力，能够实时调整和优化数据以适应不断变化的安全需求。此外，该数据集结合了Alpagasus数据和自指导的安全对齐数据，提供了多层次的安全保障。通过LlamaGuard在CatQA和BeaverTails上的评估，以及在MMLU上的实用性评估，进一步验证了其高效性和实用性。

使用方法

使用Data Advisor数据集时，首先需通过`export_alpagasus.py`脚本准备Alpagasus数据。随后，结合Data Advisor生成的安全对齐数据，运行`train_target_model.py`脚本进行模型训练。训练完成后，可通过`eval_catqa.sh`和`eval_beavertails.sh`脚本评估模型的安全性，以及通过`eval_mmlu.sh`脚本评估其实用性。

背景与挑战

背景概述

Data Advisor数据集由Wang, Fei等人于2024年创建，作为EMNLP 2024会议的一部分，旨在解决大型语言模型（LLMs）的安全对齐问题。该数据集的核心研究问题是如何动态地进行数据管理，以确保LLMs在生成内容时的安全性。主要研究人员包括Fei Wang, Ninareh Mehrabi, Palash Goyal, Rahul Gupta, Kai-Wei Chang和Aram Galstyan。Data Advisor通过提供安全对齐数据，显著提升了LLMs在处理敏感信息时的表现，对自然语言处理领域具有重要影响。

当前挑战

Data Advisor数据集在构建过程中面临的主要挑战包括：1) 动态数据管理的复杂性，需要实时监控和调整数据以确保安全性；2) 生成安全对齐数据的难度，要求在保持数据多样性的同时，过滤掉潜在的有害内容。此外，数据集的评估也面临挑战，如在CatQA和BeaverTails上评估模型安全性时，需确保评估方法的准确性和全面性。这些挑战不仅影响了数据集的构建，也对LLMs的安全应用提出了更高的要求。

常用场景

经典使用场景

在自然语言处理领域，Data Advisor数据集的经典使用场景主要集中在大型语言模型的安全对齐问题上。通过动态数据管理，该数据集能够生成用于安全对齐的数据，从而提升模型在处理敏感信息时的安全性。具体操作包括使用Data Advisor或Self-Instruct方法生成安全对齐数据，并通过训练目标模型来实现这一目的。

解决学术问题

Data Advisor数据集解决了大型语言模型在处理敏感信息时可能出现的安全问题。通过动态数据管理，该数据集能够生成高质量的安全对齐数据，帮助模型在训练过程中更好地识别和处理潜在的风险。这一创新不仅提升了模型的安全性，还为相关领域的研究提供了新的思路和方法，具有重要的学术意义和影响。

衍生相关工作

Data Advisor数据集的推出，催生了一系列相关的经典工作。例如，基于该数据集的研究论文在EMNLP 2024上发表，详细探讨了动态数据管理在大型语言模型安全对齐中的应用。此外，该数据集还启发了其他研究者在数据管理、模型安全性和隐私保护等领域的深入探索，推动了相关技术的进步和发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集