Bias-ai-university-visuals

github2025-11-29 更新2025-12-01 收录

下载链接：

https://github.com/Kauandugi/Bias-ai-university-visuals

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含64张AI生成的图像，由8个场景×2种提示变体（中性/包容性）×4个模型生成。研究了4个文本到图像系统：DALL·E、Midjourney v6、Whisk和NanoBanana Pro。包含完整元数据（模型名称、提示ID和变体、文件路径、时间戳、种子、评估者分数、聚合均值和中位数）、提示数据集（中性和包容性版本）、所有指标和比较的箱线图以及统计测试结果（Mann-Whitney U检验）。

This dataset contains 64 AI-generated images, generated from 8 scenes × 2 prompt variants (neutral/inclusive) × 4 models. Four text-to-image generation systems were investigated: DALL·E, Midjourney v6, Whisk, and NanoBanana Pro. The dataset includes complete metadata (model name, prompt ID and variant, file path, timestamp, seed values, rater scores, aggregated mean and median values), the prompt datasets (neutral and inclusive versions), box plots for all metrics and comparative analyses, as well as the results of the Mann-Whitney U statistical test.

创建时间：

2025-11-29

原始信息汇总

数据集概述

数据集组成

图像数量：64张AI生成图像
生成结构：8个场景 × 2种提示词变体（中性/包容性）× 4个模型
文本到图像系统：
- DALL·E
- Midjourney v6
- Whisk
- NanoBanana Pro

元数据内容

模型名称
提示词ID和变体
文件路径
时间戳
种子值（可用时）
评估者评分（R1和R2）
聚合平均值和中位数

评估框架

定量评估（评分标准）

使用5维多样性评分标准：

种族和民族多样性
性别代表性
文化/背景契合度
身体代表性
视觉质量和连贯性

统计方法

使用中位数代替平均值（非正态分布）
统计比较使用Mann–Whitney U检验

定性分析

评估者笔记使用以下类别进行归纳编码：

欧洲中心面孔
浅肤色主导
缺乏多样性
运动型身体规范
性别不平衡
背景不匹配
拉丁美洲特征
超现实主义风格

可复现性

所有统计分析和箱线图可通过运行以下命令复现： bash python scripts/analysis_mannwhitney.py

附加材料

提示词数据集（中性和包容性版本）
所有指标和比较的箱线图
统计检验结果（Mann–Whitney U）

搜集汇总

数据集介绍

构建方式

在人工智能生成图像日益普及的背景下，Bias-ai-university-visuals数据集通过系统化实验设计构建而成。研究团队选取了八个典型校园场景，针对每个场景分别设计中性提示词和包容性提示词两种变体，并利用DALL·E、Midjourney v6、Whisk和NanoBanana Pro四个主流文本生成图像模型进行图像生成，最终形成包含64组对比样本的完整数据集。每个生成图像均附带完整的元数据记录，包括模型参数、提示词标识、时间戳及随机种子等关键信息，为后续量化分析奠定坚实基础。

特点

该数据集最显著的特征在于其多维度的评估体系设计。除了常规的视觉质量指标外，特别建立了包含种族民族多样性、性别表征、文化语境适配度、身体表征和视觉连贯性五个维度的量化评估框架。每个图像均由两位独立评估者进行双盲评分，并采用中位数统计方法处理非正态分布数据。同时配套提供评估者注释的定性分析编码，包括欧洲中心面孔、浅肤色主导、多样性缺失等语义类别，形成定量与定性相互印证的研究范式。

使用方法

研究者可通过数据集提供的Python分析脚本完整复现统计检验过程。运行analysis_mannwhitney.py脚本即可自动执行曼-惠特尼U检验，生成所有度量指标的箱形图及统计比较结果。数据集采用分层目录结构组织，原始图像与元数据文件相互映射，评估分数以结构化表格形式存储。用户既可基于现有评估框架开展研究，也可利用原始提示词集进行扩展实验，实现生成模型偏差检测的标准化流程。

背景与挑战

背景概述

随着生成式人工智能在视觉内容创作领域的广泛应用，Bias-ai-university-visuals数据集于2024年由跨学科研究团队构建，旨在系统评估文本到图像生成模型在高等教育场景中的多样性表现。该数据集通过对比DALL·E、Midjourney等主流模型的输出，聚焦于揭示AI生成内容在种族表征、性别平衡等社会维度存在的潜在偏差，为数字人文与算法伦理研究提供了关键实证基础。

当前挑战

该数据集致力于解决生成式AI在多元文化表征方面的系统性偏差问题，其核心挑战在于构建标准化评估体系以量化模型输出的社会包容性。数据采集过程中需克服多模型输出对齐、人工标注主观性控制等难题，同时需在有限样本规模下保证统计检验效力，这些因素共同构成了该研究领域的方法论瓶颈。

常用场景

经典使用场景

在人工智能生成内容领域，该数据集被广泛应用于评估文本到图像生成系统的多样性表现。研究者通过对比中性提示与包容性提示生成的图像，系统分析不同模型在种族、性别、身体特征等维度的表征差异，为生成式人工智能的公平性研究提供重要实证基础。

衍生相关工作

基于该数据集的研究催生了多个重要学术方向。包括开发新型偏见检测算法、构建跨文化视觉评估体系，以及提出针对生成模型的去偏见训练方法。这些衍生工作共同推动了负责任人工智能研究范式的演进，为行业标准制定提供了理论依据。

数据集最近研究