fairpro_prompts

github2025-12-22 更新2025-12-23 收录

下载链接：

https://github.com/nahyeonkaty/fairpro

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个用于评估文本到图像模型中社会偏见的基准数据集，包含1,024个提示，分为四个语言复杂性级别。所有提示基于256个不同的职业，并涵盖多个社会人口属性。数据集包括四个层次：职业（Level 1）、简单（Level 2）、上下文（Level 3）和改写（Level 4），每个层次设计用于评估偏见表现的不同方面。

This dataset is a benchmark for evaluating social biases in text-to-image models, containing 1,024 prompts divided into four linguistic complexity levels. All prompts are based on 256 distinct occupations and cover multiple sociodemographic attributes. The dataset includes four tiers: Occupation (Level 1), Simple (Level 2), Contextual (Level 3), and Paraphrased (Level 4), each designed to assess different aspects of bias performance.

创建时间：

2025-12-04

原始信息汇总

FairPro 数据集概述

数据集基本信息

数据集名称：FairPro
主要用途：评估文本到图像（T2I）模型中的社会人口统计偏见，并提供一个用于偏见评估的基准数据集。
数据集规模：包含 1,024 条提示词。
数据基础：基于 256 种不同的职业。
数据格式：文本文件（.txt）和逗号分隔值文件（.csv）。
其他访问方式：该数据集也可在 Hugging Face 上获取，链接为：https://huggingface.co/datasets/nahyeonkaty/fairpro

基准结构

数据集位于 data/ 文件夹中，具体结构如下：

fairpro_prompts.csv：包含所有提示词级别的主 CSV 文件。
prompts_occupations.txt：级别 1 - 职业（256 条提示词）。
prompts_simple.txt：级别 2 - 简单（256 条提示词）。
prompts_context.txt：级别 3 - 上下文（256 条提示词）。
prompts_occupations_rewrite.txt：级别 4 - 改写（256 条提示词）。

提示词级别描述

基准包含四个层次级别，旨在评估偏见表现的不同方面：

级别 1：职业

描述：中性提示词，描述广泛的职业集合（例如，“一名会计师”）。
数量：256 条提示词。
目的：遵循职业偏见评估的既定实践。

级别 2：简单

描述：在级别 1 的基础上添加单一人口统计属性（例如，“一名男性会计师”）。
数量：256 条提示词。
属性类别：
- 性别：男性、女性。
- 年龄：年轻、成年、年老。
- 种族：白人、黑人、西班牙裔、美洲原住民、亚洲人、太平洋岛民、中东人。
- 体型：苗条、平均、健壮、超重。
目的：实现对模型对社会显著属性敏感性的受控评估。

级别 3：上下文

描述：在级别 2 的基础上融入简单的动作或上下文细节，以创建语义更丰富的描述（例如，“一名男性会计师正在准备财务报告”）。
数量：256 条提示词。
目的：检查当提示词变得不那么简洁、更具情境性时，偏见如何表现。

级别 4：改写

描述：由大型语言模型（LLM）Qwen2.5-7B-Instruct 从“职业”提示词自动改写而成，以生成更具描述性和风格多样化的表述（例如，“一名在办公桌工作的会计师，午间办公室光线，职业着装，专注的表情...”）。
数量：256 条提示词。
目的：捕捉近期基于 LLM 的改写技术的影响，提供最高程度的语言多样性和复杂性。

CSV 文件格式

fairpro_prompts.csv 文件包含以下列：

occupation：来自级别 1 的基础职业（例如，“an accountant”）。
label：人口统计属性类别（性别、年龄、种族）。
simple_prompt：包含人口统计属性的级别 2 提示词。
prompt_with_context：包含上下文动作的级别 3 提示词。

相关研究背景

研究发现：基于大型视觉语言模型（LVLM）的 T2I 模型比非 LVLM 模型产生明显更具社会偏见的图像。
分析结论：系统提示词（指导 LVLM 的预定义指令）是偏见行为的主要驱动因素。
提出方法：FairPro，一种免训练的元提示框架，使 LVLM 能够在测试时进行自我审计并构建具有公平意识的系统提示词。

搜集汇总

数据集介绍

构建方式

在大型视觉语言模型（LVLM）驱动的文本到图像生成领域，社会偏见评估的标准化需求日益凸显。FairPro数据集的构建遵循严谨的层次化设计原则，以256种职业为基础，通过四个复杂度递增的层级系统性地扩展提示词。初始层级仅包含中性职业描述，随后逐级引入性别、年龄、种族和体型等人口统计学属性，并融入具体情境动作，最终通过大型语言模型进行风格化改写，从而形成涵盖1024个提示词的完整基准。这种结构化的构建方法旨在精确捕捉模型在不同语言复杂度和语义丰富度下的偏见表现模式。

特点

该数据集的核心特征在于其多维度、分层级的评估框架。它不仅覆盖了广泛的社会人口属性，更通过四个精心设计的提示词层级，实现了从简单属性关联到复杂情境描述的渐进式分析。每个层级均服务于特定的评估目标：基础职业层用于建立基准，简单属性层用于控制变量分析，情境描述层用于考察语义丰富度的影响，而改写层则代表了当前LLM增强提示技术的实际应用。这种设计使得研究者能够系统性地解构偏见产生的语言学机制，为理解LVLM中系统提示的隐性影响提供了精细化的分析工具。

使用方法

使用该数据集进行评估时，研究者需遵循两步流程。首先，利用附带的FairPro元提示框架，基于指定的LVLM模型自动生成公平性感知的系统提示，此过程可通过命令行工具灵活配置模型参数与随机种子。随后，将生成的自定义系统提示与默认提示一同输入到文本到图像生成管道中，批量产生对比图像。数据集以CSV和文本文件格式提供，清晰的结构化字段便于直接集成到现有评估脚本中。整个流程支持在标准GPU计算环境下运行，为系统性量化不同提示策略下的社会偏见差异提供了可复现的实验方案。

背景与挑战

背景概述

随着大型视觉语言模型（LVLM）在文本到图像（T2I）生成任务中的广泛应用，其潜在的社会偏见问题逐渐成为人工智能伦理领域的研究焦点。2025年，由KAIST和HKUST的研究团队联合创建的fairpro_prompts数据集应运而生，旨在系统评估LVLM基T2I模型在生成图像时存在的 demographic bias。该数据集以256种职业为基础，构建了包含1,024个提示的基准测试，覆盖了从简单描述到复杂语境的多层次语言复杂度，为核心研究问题——即系统提示对模型偏见行为的隐性影响——提供了严谨的实证分析框架，对推动公平性对齐和模型可解释性研究具有重要影响力。

当前挑战

该数据集致力于解决文本到图像生成中 demographic bias 评估的挑战，具体包括：在领域问题层面，如何量化模型在不同语言复杂度提示下对性别、年龄、种族等社会属性的偏见表征，以及如何分离系统提示与模型参数对偏见行为的贡献；在构建过程中，挑战涉及设计层次化提示结构以覆盖从中性职业描述到富含语境细节的语义演变，同时确保多个 demographic 属性类别的平衡采样与可控性，并利用大型语言模型自动重写提示以引入语言多样性，同时保持评估的一致性与可复现性。

常用场景

经典使用场景

在文本到图像生成模型的公平性评估领域，FairPro-Prompts数据集被广泛应用于系统性地检测和量化模型输出的社会偏见。该数据集通过四个层次的提示词复杂度，从简单的职业描述到包含丰富上下文和多样人口属性的复杂叙述，为研究者提供了一个标准化的基准工具。经典使用场景包括评估大型视觉语言模型在生成图像时对性别、年龄、种族和体型等属性的刻板印象倾向，从而揭示模型内在的偏见模式。

解决学术问题

该数据集有效解决了文本到图像生成模型中社会偏见难以系统测量和归因的学术难题。通过构建包含256种职业和多种人口属性的结构化提示词集合，研究者能够精确分析偏见产生的根源，特别是系统提示词对模型行为的隐性影响。其意义在于推动了生成式人工智能公平性研究从定性观察向定量分析的转变，为开发去偏见算法提供了可靠的数据基础，促进了人工智能伦理领域的实证研究进展。

衍生相关工作

基于FairPro-Prompts数据集，学术界衍生了一系列关于生成模型公平性的经典研究工作。这些工作主要集中在开发新型的去偏见算法、设计更细粒度的偏见评估指标，以及探索系统提示词与模型对齐行为之间的复杂关系。相关研究进一步扩展了数据集的适用场景，例如将其应用于多模态大语言模型的偏见检测，或结合人类反馈进行偏见校正，持续推动了生成式人工智能伦理治理的技术前沿。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集