faithfulness-esnli-meta-llama_Llama-3.1-8B-Instruct-random-insertion

Hugging Face2025-09-12 更新2025-09-13 收录

下载链接：

https://huggingface.co/datasets/yeok/faithfulness-esnli-meta-llama_Llama-3.1-8B-Instruct-random-insertion

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含了用于训练和测试的文本数据，具体字段包括索引、元信息、提示文本、参考答案以及各种插入和偏差文本等。数据集分为训练集和测试集，分别包含9720和1844个示例。

创建时间：

2025-09-01

原始信息汇总

数据集概述

基本信息

数据集名称: faithfulness-esnli-meta-llama_Llama-3.1-8B-Instruct-random-insertion
下载大小: 3694241字节
数据集大小: 15007210.716326531字节

数据特征

特征数量: 11个
特征列表:
- idx (int64)
- meta-llama_Llama-3.1-8B-Instruct-y (string)
- meta-llama_Llama-3.1-8B-Instruct-z (string)
- sft_prompt (string)
- sft_gold_answer (string)
- y_prime_random_insertion (string)
- y_prime_user_bias (string)
- z_prime_random_insertion (string)
- z_prime_user_bias (string)
- delta (string)
- x_prime (string)

数据划分

训练集:
- 样本数量: 4000
- 字节大小: 10240424.24
测试集:
- 样本数量: 1844
- 字节大小: 4766786.476326531

配置信息

默认配置:
- 训练集文件路径: data/train-*
- 测试集文件路径: data/test-*

搜集汇总

数据集介绍

构建方式

在自然语言推理领域，faithfulness-esnli-meta-llama_Llama-3.1-8B-Instruct-random-insertion数据集通过系统化方法构建。该数据集基于e-SNLI框架，采用随机插入技术对原始假设进行扰动，生成具有语义变化的对抗性样本。构建过程中利用Meta的Llama-3.1-8B-Instruct模型生成多样化推理路径，确保数据覆盖多种推理场景和语言现象。每个样本包含原始前提、修改后的假设以及对应的推理标注，形成结构化的对比学习材料。

特点

该数据集最显著的特征在于其精心设计的对比学习结构，同时包含原始样本和经过随机插入修改的对抗样本。数据字段涵盖完整的推理链条，包括模型生成的解释、偏差注入版本和差异标注。数据集提供训练和测试分割，规模适中且质量统一，特别适合 faithfulness 评估和模型鲁棒性研究。其多维度标注体系为可解释性研究提供了丰富的信息层次，能够支持复杂的归因分析任务。

使用方法

研究人员可借助该数据集进行模型忠实度评估和对抗性训练。典型应用包括计算模型在原始样本和扰动样本上的预测一致性，从而量化生成模型的可靠性。数据集中的delta字段可直接用于差异分析，而对称的样本结构支持对比学习算法的实施。使用时应特别注意训练测试分割的规范使用，建议采用交叉验证确保结果稳定性。对于可解释性研究，可深入分析模型生成解释与人工标注间的一致性模式。

背景与挑战

背景概述

在自然语言处理领域，忠实性评估已成为解释性人工智能的核心研究议题。faithfulness-esnli-meta-llama_Llama-3.1-8B-Instruct-random-insertion数据集由研究团队基于e-SNLI框架构建，专注于评估语言模型生成解释的可靠性。该数据集通过结构化提示工程与偏差控制，旨在量化模型输出与真实逻辑依据的一致性程度，为可解释性研究提供关键基准数据。

当前挑战

该数据集需解决语言模型解释忠实性评估中的语义对齐挑战，包括模型生成解释与人类标注逻辑链的偏差度量问题。构建过程中面临提示工程设计的复杂性，需平衡随机插入操作与用户偏差控制的对抗性数据生成，同时确保合成数据与自然语言推理任务的语义一致性，这对数据质量与评估效度提出双重考验。

常用场景

经典使用场景

在自然语言推理领域，faithfulness-esnli-meta-llama_Llama-3.1-8B-Instruct-random-insertion数据集被广泛用于评估大型语言模型生成解释的忠实度。研究者通过对比模型生成的解释与标准标注，系统分析模型在推理过程中是否保持逻辑一致性，这为深入理解模型内部机制提供了关键数据支撑。

解决学术问题

该数据集有效解决了可解释人工智能领域中对模型生成内容可信度评估的难题。通过提供精确的忠实度标注，它使研究者能够量化模型解释与真实推理之间的偏差，为构建更透明、可靠的语言模型奠定了理论基础，推动了可信人工智能研究的发展。

衍生相关工作

基于该数据集，多项经典研究相继展开，包括开发新型忠实度度量指标、构建增强型解释生成模型等。这些工作显著推进了可解释NLP领域的发展，为后续研究提供了丰富基准，并促进了学术界与工业界在模型透明度方面的深入合作。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集