Trust-Score

github2024-09-18 更新2024-09-19 收录

下载链接：

https://github.com/declare-lab/trust-align

下载链接

链接失效反馈

官方服务：

资源简介：

Trust-Score 是一个更可靠和全面的衡量LLM在RAG框架中能力的指标，涵盖以下方面：LLM是否正确识别可回答的问题？响应是否基于提供的文档，即引文是否支持真实响应中的声明？引文是否相关？

Trust-Score is a more reliable and comprehensive metric for evaluating the capabilities of Large Language Models (LLMs) within the Retrieval-Augmented Generation (RAG) framework. It covers the following critical aspects: whether the LLM correctly identifies answerable questions; whether the LLM's response is grounded in the provided documents, i.e., whether the citations support the claims in the generated response; and whether the citations are relevant.

创建时间：

2024-09-17

原始信息汇总

Trust-Score 和 Trust-Align 数据集概述

数据集概述

Trust-Score

描述: Trust-Score 是一个全面的评估指标，用于衡量大型语言模型（LLM）在检索增强生成（RAG）框架中的可信度。
内容: 包含校准的问题和拒绝回答，以测量模型的可信度。
格式: 支持三种数据格式：EM（精确匹配）、EM@5（前5个精确匹配）和CM（声明匹配）。
数据结构:
- question: 问题。
- answers: 所有黄金答案的列表，每个元素是一个包含不同变体的数组。
- docs: 与问题相关的文档证据列表，包含 title、text、answers_found 和 rec_score 字段。

Trust-Align

描述: Trust-Align 是一个框架，通过高质量的合成引用响应来增强模型的可信度。
内容: 包含用于训练的高质量合成引用响应。
数据结构:
- seed_samples: 种子样本的生成和校准。
- augment_samples: 文档重组。
- positives_synthesis: 生成自然响应。
- negatives_selection: 选择负面响应。

数据集链接

Trust-Score: Huggingface
Trust-Align: Huggingface

引用

bibtex @misc{song2024measuringenhancingtrustworthinessllms, title={Measuring and Enhancing Trustworthiness of LLMs in RAG through Grounded Attributions and Learning to Refuse}, author={Maojia Song and Shang Hong Sim and Rishabh Bhardwaj and Hai Leong Chieu and Navonil Majumder and Soujanya Poria}, year={2024}, eprint={2409.11242}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2409.11242}, }

搜集汇总

数据集介绍

构建方式

Trust-Score数据集的构建基于对大型语言模型（LLMs）在检索增强生成（RAG）框架中的可信度进行全面评估的需求。该数据集包含了经过校准的问题和拒绝回答的样本，旨在测量模型在处理可回答问题时的可信度。Trust-Score的构建过程涉及对多种提示方法的测试，如上下文学习，以评估其在RAG任务中的适应性。此外，Trust-Align框架的引入进一步增强了模型的可信度，通过高质量的合成引文响应来提升模型的表现。

特点

Trust-Score数据集的特点在于其全面性和可靠性，涵盖了LLMs在RAG任务中的多个关键方面，包括正确识别可回答问题、响应是否基于提供的文档以及引文的相关性。该数据集支持三种类型的数据格式：EM（精确匹配）、EM@5（前五精确匹配）和CM（声明匹配），以适应不同类型的评估需求。此外，Trust-Align数据集通过合成引文响应，进一步提升了模型的可信度，显著提高了在ASQA、QAMPARI和ELI5等基准测试中的表现。

使用方法

使用Trust-Score数据集进行评估时，用户需准备符合特定格式的评估数据集，并通过运行提供的Python代码进行模型评估。对于Trust-Align数据集，用户需先下载相关文档语料库和数据集，然后通过一系列脚本进行种子样本和增强样本的筛选，以及正负响应的生成。训练过程则基于alignment-handbook仓库，用户需根据计算环境调整配置文件，并使用提供的脚本进行SFT和DPO训练。

背景与挑战

背景概述

在大型语言模型（LLMs）与检索增强生成（RAG）系统的结合中，Trust-Score数据集应运而生，旨在全面评估LLMs在RAG框架中的可信度。该数据集由Declare Lab的研究团队创建，主要研究人员包括Maojia Song、Shang Hong Sim等，其核心研究问题聚焦于如何通过校准问题和拒绝机制来衡量模型的可信度。Trust-Score的引入填补了现有研究在评估LLMs适应RAG任务适当性方面的空白，对提升RAG系统的整体性能具有重要影响。

当前挑战

Trust-Score数据集面临的挑战主要集中在两个方面：一是如何准确识别可回答问题并确保响应基于提供的文档，即引用的支持性；二是如何确保引用的相关性。在构建过程中，研究人员需克服数据校准和拒绝机制的复杂性，以及合成高质量引用响应的技术难题。此外，如何有效地将Trust-Align框架应用于不同规模的LLMs，以提升其Trust-Score，也是当前研究的重要挑战。

常用场景

经典使用场景

在自然语言处理领域，Trust-Score数据集被广泛用于评估和提升大型语言模型（LLMs）在检索增强生成（RAG）框架中的可信度。该数据集通过校准的问题和拒绝机制，全面衡量模型在识别可回答问题、响应基于提供文档的准确性以及引用相关性等方面的表现。Trust-Score不仅用于模型性能的基准测试，还通过Trust-Align框架进行模型对齐，显著提升LLMs在RAG任务中的表现。

衍生相关工作

Trust-Score数据集的发布催生了多项相关研究工作，特别是在LLMs的可信度评估和模型对齐领域。例如，基于Trust-Score的研究论文提出了多种改进的评估方法和模型对齐技术，进一步提升了LLMs在RAG任务中的表现。此外，Trust-Align框架的成功应用也激发了更多关于如何通过数据驱动的方法提升模型性能的研究，推动了自然语言处理领域的技术进步。

数据集最近研究