Gender-Bias-in-German-LLMs Collection

Name: Gender-Bias-in-German-LLMs Collection
Creator: RWTH Aachen University, Germany
Published: 2025-07-22 21:09:41
License: 暂无描述

arXiv2025-07-22 更新2025-08-14 收录

下载链接：

https://github.com/rwth-i6/Gender-Bias-in-German-LLMs

下载链接

链接失效反馈

官方服务：

资源简介：

本研究开发了五个德语数据集，旨在评估大型语言模型中的性别偏见。这些数据集基于性别偏见的明确概念，并考虑了德语的相关特征。数据集涵盖了问答和开放式文本生成任务，以评估模型是否在生成文本时依赖于性别刻板印象。这些数据集对于理解跨语言的性别偏见具有重要意义，并强调了为不同语言定制评估框架的必要性。

This study develops five German datasets intended to evaluate gender bias in large language models (LLMs). These datasets are grounded in explicit conceptualizations of gender bias and incorporate relevant linguistic features of the German language. They cover question answering and open-ended text generation tasks, aiming to assess whether models rely on gender stereotypes during text generation. These datasets hold significant importance for understanding cross-linguistic gender bias and underscore the necessity of customizing evaluation frameworks for different languages.

提供机构：

RWTH Aachen University, Germany

创建时间：

2025-07-22

搜集汇总

数据集介绍

构建方式

该数据集通过多种方法构建，包括从现有英语数据集的翻译、手动创建以及利用GPT-4o进行少量样本提示生成。具体而言，GerBBQ+数据集基于BBQ数据集翻译而来，并剔除了难以避免性别化语言的模板；SexistStatements数据集则从标注的性别歧视推文中提取核心信息，并通过少量样本提示扩展生成更多样本。所有自动生成或翻译的样本均经过人工验证和后编辑，以确保数据质量。

使用方法

使用该数据集时，可通过不同方法评估模型表现：GerBBQ+采用BBQ偏差评分衡量模型依赖刻板印象的程度；SexistStatements通过模型对性别歧视声明的同意率评估内在偏见；开放生成数据集（如GenderPersona）则分析生成文本中词汇与性别的共现关系。评估时需注意德语语法性别对结果的影响，建议结合定量指标与定性分析。所有数据集均提供标准化元提示以确保生成格式统一。

背景与挑战

背景概述

Gender-Bias-in-German-LLMs Collection数据集由Kristin Gnadt、David Thulke、Simone Kopeinik和Ralf Schlüter等研究人员于2025年7月发布，旨在评估大型语言模型（LLMs）在德语中的性别偏见。该数据集基于成熟的性别偏见概念，包含五个德语数据集，支持多种评估方法。研究团队来自德国亚琛工业大学、AppTek GmbH和奥地利Know Center Research GmbH等机构。该数据集的发布填补了非英语语言性别偏见评估工具的空白，对推动多语言自然语言处理领域的公平性研究具有重要意义。

当前挑战

该数据集面临的挑战主要包括两个方面：1) 领域问题挑战：德语作为高度性别化的语言，存在语法性别与自然性别的复杂对应关系，如职业名词的男性通用形式（generic masculine）可能被误解为性别中立，导致传统英语偏见评估方法难以直接迁移；2) 构建过程挑战：数据创建需克服德语语法性别与语义的歧义性问题，如中性名词可能隐含性别倾向，同时需人工验证合成数据的质量以避免引入新偏见。此外，评估指标需针对德语特点定制，如处理代词解析和职业名词的性别关联等语言特性。

常用场景

经典使用场景

在自然语言处理领域，Gender-Bias-in-German-LLMs Collection数据集被广泛应用于评估德语大型语言模型中的性别偏见。该数据集通过问答任务和开放式文本生成任务，系统地检测模型在职业称谓、人称代词使用等场景中潜在的性别刻板印象。特别是在处理德语这类高度性别化的语言时，数据集能有效捕捉到男性职业术语的模糊解释以及中性名词对性别感知的影响。

解决学术问题

该数据集解决了跨语言性别偏见评估的学术难题，填补了德语语境下系统性偏见测量工具的空白。通过构建基于明确性别偏见概念的五类子集，研究者能够量化分析多语言LLM模型在代词解析、职业关联等任务中表现出的隐性偏见模式。其创新性在于突破了英语中心主义的评估框架，揭示了德语语法性别与自然性别之间的复杂交互机制，为跨文化偏见研究提供了方法论范例。

实际应用

在实际应用中，该数据集被科技公司用于优化德语智能客服系统的响应公平性，帮助教育机构开发去性别偏见的语言教学工具。政府部门借助该数据集评估自动化文书处理系统的合规性，新闻机构则用于检测AI生成内容中的隐性偏见。特别是在德语区招聘平台的简历筛选算法优化中，该数据集能有效识别并减少对非传统性别职业者的歧视性倾向。

数据集最近研究