faithfulness-strategy_qa-meta-llama_Llama-3.1-8B-Instruct-user-bias

Hugging Face2025-09-12 更新2025-09-13 收录

下载链接：

https://huggingface.co/datasets/yeok/faithfulness-strategy_qa-meta-llama_Llama-3.1-8B-Instruct-user-bias

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个包含多个文本字段的数据集，用于训练和评估模型。数据集分为训练集和测试集，每个集合包含1080个示例。字段包括索引、元数据、软提示、标准答案等。

This is a dataset containing multiple text fields, designed for model training and evaluation. The dataset is split into a training set and a test set, with each set containing 1080 samples. The fields include index, metadata, soft prompt, standard answer, and so on.

创建时间：

2025-09-01

原始信息汇总

数据集概述

基本信息

数据集名称：faithfulness-strategy_qa-meta-llama_Llama-3.1-8B-Instruct-user-bias
下载大小：2,225,530 字节
数据集大小：5,312,010.655021834 字节
训练集样本数：1,080
测试集样本数：1,080

数据结构

特征字段

idx：int64 类型，索引字段
meta-llama_Llama-3.1-8B-Instruct-y：string 类型
meta-llama_Llama-3.1-8B-Instruct-z：string 类型
sft_prompt：string 类型
sft_gold_answer：string 类型
y_prime_random_insertion：string 类型
y_prime_user_bias：string 类型
z_prime_random_insertion：string 类型
z_prime_user_bias：string 类型
delta：string 类型
x_prime：string 类型

数据划分

训练集：1,080 个样本，占用 2,656,005.327510917 字节
测试集：1,080 个样本，占用 2,656,005.327510917 字节

配置信息

默认配置：包含训练集和测试集数据文件
训练集路径：data/train-*
测试集路径：data/test-*

搜集汇总

数据集介绍

构建方式

在人工智能可信度评估领域，faithfulness-strategy_qa-meta-llama_Llama-3.1-8B-Instruct-user-bias数据集通过精心设计的流程构建而成。该数据集基于StrategyQA问答框架，利用Meta公司研发的Llama-3.1-8B-Instruct模型生成初始回答和推理过程。研究团队采用随机插入和用户偏见注入两种策略，系统性地构建了包含原始回答、修改后回答及相应推理链的对比样本，最终形成包含2160个样本的高质量数据集。

特点

该数据集的核心特征体现在其多维度的对比架构设计。每个样本不仅包含模型原始输出和标准答案，还提供了经过随机插入和用户偏见干预的两种修改版本，以及相应的推理过程变化。这种结构使得数据集能够同时追踪模型输出的语义一致性和推理逻辑的稳定性。数据字段的精心编排为研究大语言模型在存在干扰因素时的忠实度表现提供了全面的观测维度。

使用方法

研究人员在使用该数据集时，可通过对比分析原始输出与干预后输出的差异，深入探究大语言模型的忠实度特性。典型应用包括计算模型输出的语义一致性指标、评估推理链的稳定性，以及分析不同干预策略对模型性能的影响。数据集的标准训练-测试划分确保了评估结果的可靠性，同时其结构化格式便于直接接入主流机器学习框架进行批量处理和分析。

背景与挑战

背景概述

在人工智能伦理与可信机器学习研究领域，faithfulness-strategy_qa-meta-llama_Llama-3.1-8B-Instruct-user-bias数据集由Meta等机构的研究团队于2024年构建，专注于评估大语言模型在问答任务中的忠实性与用户偏见响应机制。该数据集基于StrategyQA框架，通过引入人工构造的偏见性提示与黄金答案对比，旨在揭示模型输出与预设价值观之间的对齐程度，对推动可解释AI与负责任的AI部署具有重要影响。

当前挑战

该数据集核心挑战在于解决大语言模型在复杂问答中因用户隐含偏见导致的忠实性偏离问题，例如模型可能过度迎合用户偏见而生成不准确或伦理缺失的回复。构建过程中需克服多重困难：一是人工注入偏见时需保持语义连贯性与隐蔽性，避免失真；二是确保黄金答案与偏见提示的对比度量具备可解释性与统计显著性；三是处理大规模合成数据时需维持标注一致性与噪声控制。

常用场景

经典使用场景

在自然语言处理领域，faithfulness-strategy_qa-meta-llama_Llama-3.1-8B-Instruct-user-bias数据集主要用于评估和提升大语言模型在问答任务中的忠实度与抗用户偏见干扰能力。研究者通过对比模型原始输出与经过随机插入及用户偏见干预后的生成结果，系统分析模型对语义一致性的保持程度，这为深入理解模型在复杂语境下的可靠性提供了关键实验基础。

解决学术问题

该数据集有效解决了大语言模型生成内容中存在的事实不一致性和对用户输入偏见过度敏感等核心学术问题。通过提供多维度对比数据，它支持对模型忠实度机制的量化研究，显著推进了可控文本生成与偏差缓解领域的发展，为构建更稳健、可信的人工智能系统奠定了数据基础。

衍生相关工作

基于该数据集，已衍生出一系列关于模型忠实度评估框架和去偏见算法的经典研究工作。这些研究不仅提出了新的评估指标和干预策略，还推动了如反事实数据增强、对抗性训练等技术的发展，为后续更广泛的可靠性研究提供了重要方法论支撑和实验范式。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集