faithfulness-social_iqa-debug_1

Hugging Face2025-08-29 更新2025-08-30 收录

下载链接：

https://huggingface.co/datasets/yeok/faithfulness-social_iqa-debug_1

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含了文本和与之相关的概率信息，具体包含原始文本、修改后的文本、文本的概率分布等字段。数据集分为训练集和测试集，可用于文本生成、文本修改等NLP任务。

创建时间：

2025-08-27

原始信息汇总

数据集概述

基本信息

数据集名称: faithfulness-social_iqa-debug_1
存储位置: https://huggingface.co/datasets/yeok/faithfulness-social_iqa-debug_1
总大小: 95,007,491 字节
下载大小: 48,402,021 字节
总样本数: 16,330 条

数据划分

训练集 (train): 15,448 条样本，89,809,023 字节
测试集 (test): 882 条样本，5,198,468 字节

数据结构

数据集包含以下核心字段：

基础字段

x: 字符串类型，原始输入
delta_and_x_prime: 结构体，包含两种扰动方式的结果
- random_insertion: 随机插入扰动
  - delta: 扰动内容（字符串）
  - x_prime: 扰动后输入（字符串）
- user_bias: 用户偏见扰动
  - delta: 扰动内容（字符串）
  - x_prime: 扰动后输入（字符串）
idx: 整型，样本索引

模型输出字段（多个模型版本）

包含以下四个模型的完整输出结果：

1. Qwen_Qwen2.5-3B-Instruct 模型

y_probs: 选项概率（A/B/C）
y: 原始输出
z: 其他输出
delta_and_y_prime: 扰动后的输出及概率
delta_and_z_prime: 扰动后的其他输出

2. meta-llama_Llama-3.2-3B-Instruct 模型

同上结构字段

3. Qwen_Qwen2.5-1.5B-Instruct 模型

同上结构字段

4. Qwen_Qwen3-4B 模型

同上结构字段

扰动分析结构

所有模型均包含两种扰动方式的详细输出：

random_insertion: 随机插入扰动结果
user_bias: 用户偏见扰动结果

每个扰动结果包含：

delta: 扰动内容
y_prime/z_prime: 扰动后输出
y_prime_probs: 扰动后选项概率（A/B/C）

数据用途

该数据集用于评估语言模型在社会常识推理任务中的忠实度，通过对比原始输入与扰动后输入的模型输出差异，分析模型输出的稳定性和可靠性。

搜集汇总

数据集介绍

构建方式

在人工智能伦理研究领域，faithfulness-social_iqa-debug_1数据集通过结构化数据构造方法构建。该数据集基于原始社会情境问答数据，采用随机插入和用户偏见两种干预策略生成扰动样本。每个样本包含原始问题、修改后的变体及对应的模型预测概率，通过多维度标注确保数据层次丰富性。构建过程注重保持语义连贯性，同时引入可控变量以评估模型鲁棒性。

特点

该数据集显著特点在于其多模型对比架构，集成Qwen与Llama系列多个版本的语言模型输出结果。特征结构包含原始回答、扰动后的生成内容及概率分布，提供细粒度的可信度分析维度。数据字段涵盖字符串类型的问答内容和浮点型的概率值，支持对模型行为的一致性检验。其分层标注体系能够揭示模型在不同干预策略下的响应模式，为可信人工智能研究提供多维观测窗口。

使用方法

研究人员可借助该数据集进行模型忠实度评估，通过对比原始输出与扰动输出的差异分析模型稳定性。使用时应重点关注delta干预字段与对应生成内容的关联性，利用概率分布数据量化模型决策置信度。数据集支持训练集与测试集的划分，适用于监督学习框架下的模型验证。分析过程中可交叉比对不同架构模型的响应行为，从而深入探究语言模型在社会常识推理中的表现特性。

背景与挑战

背景概述

在人工智能伦理与可信机器学习研究领域，faithfulness-social_iqa-debug_1数据集聚焦于社会智能问答系统的忠实性评估问题。该数据集由前沿研究机构基于Social IQa基准构建，通过集成Qwen和Llama系列语言模型的多个变体，系统性地探索模型在社会情境推理中的稳定性与可解释性。其核心研究目标在于揭示语言模型在面临输入扰动时的输出一致性，为构建可靠的社会人工智能系统提供关键数据支撑，对推动可信AI技术的发展具有重要理论价值与实践意义。

当前挑战

该数据集致力于解决社会情境问答中模型忠实性评估的复杂性挑战，包括模型对语义扰动敏感度的量化、偏见注入对推理路径的影响分析，以及多模型输出一致性的比对难题。构建过程中需克服多维度数据对齐的技术障碍，确保不同模型变体在相同扰动条件下的输出可比性；同时面临语义保持性扰动生成的复杂性，需在维持原始问题语义的前提下实现有效的输入变换，并协调多源模型输出数据的标准化存储与验证。

常用场景

经典使用场景

在自然语言处理领域，faithfulness-social_iqa-debug_1数据集主要用于评估模型在社会情境问答任务中的忠实度表现。该数据集通过构建原始问题与扰动后问题的对比框架，系统性地测试模型在随机插入和用户偏见干预下的答案一致性。研究者通过分析模型在原始输入x与修改后输入x_prime上的输出差异，能够深入探究语言模型对语义变化的敏感程度及其推理稳定性。

衍生相关工作

基于该数据集衍生的经典工作包括多模态忠实度评估框架的开发和大语言模型偏见检测系统的构建。研究者利用其提供的扰动对比机制，提出了多种新颖的忠实度度量指标，这些指标已被广泛应用于模型审计和负责任AI研究领域。后续工作还拓展到跨语言忠实度评估和领域自适应忠实度测试等方向。

数据集最近研究