faithfulness-ood-meta-llama_Llama-3.1-8B-Instruct-random_insertion

Hugging Face2025-09-11 更新2025-09-12 收录

下载链接：

https://huggingface.co/datasets/yeok/faithfulness-ood-meta-llama_Llama-3.1-8B-Instruct-random_insertion

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个包含文本数据和相关元信息的数据集，用于训练和测试语言模型。数据集中的文本包括不同大小的Qwen和Llama模型指令，以及对应的提示和答案。此外，数据集还包含了每个示例的ID、源信息、奖励分数和影响力分数等信息。数据集分为训练集和测试集，可用于模型的训练和评估。

创建时间：

2025-09-04

原始信息汇总

数据集概述

基本信息

数据集名称: faithfulness-ood-meta-llama_Llama-3.1-8B-Instruct-random_insertion
下载大小: 1,590,288 字节
数据集大小: 7,346,937 字节

数据特征

特征列

Qwen_Qwen2.5-3B-Instruct-y (string)
Qwen_Qwen2.5-7B-Instruct-y (string)
Qwen_Qwen3-4B-y (string)
Qwen_Qwen3-8B-y (string)
delta (string)
id (int64)
meta-llama_Llama-3.1-8B-Instruct-y (string)
meta-llama_Llama-3.2-3B-Instruct-y (string)
sft_gold_answer (string)
sft_prompt (string)
source (string)
x_prime (string)
prompt (string)
answer (string)
completion (string)
reward (float64)
influential (float64)
mention (float64)
biased_towards (null)

数据划分

训练集 (train)

样本数量: 2,478
数据大小: 5,788,558 字节

测试集 (test)

样本数量: 752
数据大小: 1,558,379 字节

搜集汇总

数据集介绍

构建方式

在自然语言处理领域，faithfulness-ood-meta-llama_Llama-3.1-8B-Instruct-random_insertion数据集的构建采用了随机插入技术，通过向原始提示中引入扰动来生成变体样本。该过程涉及多个先进模型如Llama-3.1-8B-Instruct和Qwen系列模型的响应对比，确保了数据多样性和分布外泛化能力。数据集包含2478个训练样本和752个测试样本，每个样本均标注了原始提示、修改提示、模型回答及人工评估指标，形成了严谨的对比评估框架。

特点

该数据集的核心特征在于其多模型响应对比结构和细粒度评估维度，涵盖了忠实度、影响力和提及度等人工标注指标。特征字段包括sft_prompt、x_prime、delta及多个模型的输出回答，提供了丰富的模型行为分析基础。数据分布均匀且规模适中，支持对模型在分布外场景下的忠实性进行深入评估，为可靠性研究提供了高质量基准。

使用方法

研究人员可通过加载该数据集的标准分割（训练集与测试集）进行模型忠实性评估与对比分析。典型应用包括计算各模型在扰动提示下的性能指标差异，或训练检测模型识别分布外样本的偏见倾向。使用时应重点关注prompt、answer及reward等字段，结合人工评估标签进行统计分析，以揭示模型在不确定性环境中的响应模式。

背景与挑战

背景概述

随着大型语言模型在自然语言处理领域的广泛应用，其输出内容的忠实性与泛化能力成为关键研究焦点。faithfulness-ood-meta-llama_Llama-3.1-8B-Instruct-random_insertion数据集由Meta等机构联合构建，旨在评估模型在分布外场景下的回答一致性。该数据集通过对比多个先进模型（包括Qwen系列和Llama系列）的响应差异，深入探究模型在面对语义扰动时的稳定性问题，为可解释人工智能领域提供了重要的基准数据支撑。

当前挑战

该数据集核心挑战在于解决语言模型对输入扰动的过度敏感性，即模型在面对轻微语义调整时可能产生矛盾或不可靠的输出。构建过程中需克服多模型响应对齐的复杂性，包括设计有效的随机插入策略以生成可控的分布外样本，并建立精确的忠实度评估指标来量化模型行为差异，这些技术难点对数据标注一致性和评估框架的鲁棒性提出了较高要求。

常用场景

经典使用场景

在自然语言处理领域，faithfulness-ood-meta-llama_Llama-3.1-8B-Instruct-random_insertion数据集主要用于评估大语言模型在分布外情境下的忠实度表现。该数据集通过随机插入的扰动方式，构建了多种偏离训练分布的测试样本，为研究者提供了检验模型鲁棒性和泛化能力的标准化环境。经典使用场景包括测量模型对输入变化的敏感度，以及识别其在面对非常规文本结构时的响应一致性，这些评估对于理解模型在实际应用中的可靠性至关重要。

实际应用

在实际应用层面，该数据集为开发高可靠性语言模型系统提供了重要支撑。科技公司可依据其评估结果优化智能客服、内容生成等产品的抗干扰能力，确保在接收非常规输入时仍能保持准确响应。教育机构可利用该数据集训练更适应多样化学生提问的教学辅助系统，而金融、医疗等高风险领域则能借此筛选出符合安全标准的对话模型，显著提升人工智能应用的社会接受度和实用价值。

衍生相关工作

该数据集已衍生出多项重要研究工作，包括基于扰动分析的模型脆弱性诊断框架、自适应对抗训练方法以及分布外检测算法的开发。研究者利用其提供的标准评估环境，提出了多种提升模型鲁棒性的新技术，如动态数据增强策略和不确定性校准机制。这些工作不仅深化了对语言模型行为特征的理解，还推动了整个领域向更可靠、可解释的人工智能系统发展，形成了系列具有影响力的学术成果。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集