BanStereoSet

Name: BanStereoSet
Creator: 南佛罗里达大学, 北南大学
Published: 2024-09-18 10:02:30
License: 暂无描述

arXiv2024-09-18 更新2024-09-20 收录

下载链接：

http://arxiv.org/abs/2409.11638v1

下载链接

链接失效反馈

官方服务：

资源简介：

BanStereoSet是一个专门用于评估多语言大语言模型（LLMs）中刻板社会偏见的数据集，特别针对孟加拉语。该数据集由南佛罗里达大学和北南大学合作创建，包含1194个句子，涵盖种族、职业、性别、年龄歧视、美貌、职业美貌、地区、种姓和宗教等9个偏见类别。数据集的创建过程包括从现有数据集（如StereoSet、IndiBias和GenAssocBias）中本地化内容，并使用GPT-4进行翻译和校对。BanStereoSet旨在解决在孟加拉语环境中多语言LLMs的偏见问题，促进更公平的语言技术发展。

提供机构：

南佛罗里达大学, 北南大学

创建时间：

2024-09-18

搜集汇总

数据集介绍

构建方式

BanStereoSet数据集的构建基于多种来源，包括StereoSet、IndiBias和Kamruzzaman等人的研究数据集。通过将这些数据集中的英文内容本地化为孟加拉语，研究人员创建了一个专门用于捕捉孟加拉语社区中普遍存在的偏见的数据集。该数据集包含1,194个句子，涵盖了种族、职业、性别、年龄歧视、美貌、职业美貌、地区、种姓和宗教等9个偏见类别。翻译过程使用了GPT-4模型，并通过少样本学习来提高翻译的准确性。随后，四名母语为孟加拉语且精通英语的标注者对翻译进行了审查和修正，确保了翻译的准确性和文化相关性。

特点

BanStereoSet数据集的一个显著特点是其广泛覆盖了多种偏见类别，超越了传统的性别和宗教偏见，扩展到种族、职业、美貌、年龄歧视、种姓和地区等更广泛的领域。此外，该数据集特别关注孟加拉语社区的文化背景，通过本地化的内容捕捉特定文化环境中的偏见。数据集的构建过程中还特别注意了孟加拉语翻译的独特挑战，如性别代词的缺失和地区特定名称的使用，确保了数据集在语言和文化上的准确性。

使用方法

BanStereoSet数据集主要用于评估多语言大型语言模型（LLMs）在孟加拉语中的社会偏见。研究人员可以使用该数据集通过填充空白任务来测试模型对不同偏见类别的反应，从而量化模型在处理孟加拉语内容时的偏见程度。数据集支持多种提示模板，包括基线模板和两种改写模板，以确保测试的全面性和公正性。通过对比模型在孟加拉语和英语数据集上的表现，研究人员可以进一步探讨模型在不同语言和文化背景下的偏见处理能力，为开发更加公平的语言技术提供指导。

背景与挑战

背景概述

BanStereoSet数据集由南佛罗里达大学和北南大学的研究人员于2024年创建，旨在评估多语言大型语言模型（LLMs）在孟加拉语中的刻板社会偏见。该数据集的构建旨在扩展偏见研究的范围，超越以英语为中心的数据集，通过本地化来自StereoSet、IndiBias和Kamruzzaman等人（2024b）的数据集内容，生成一个专门捕捉孟加拉语社区中普遍存在的偏见的资源。BanStereoSet数据集包含1,194个句子，涵盖9个偏见类别：种族、职业、性别、年龄歧视、美貌、职业美貌、地区、种姓和宗教。该数据集不仅是一个测量多语言LLMs偏见的关键工具，还促进了跨不同社会类别刻板偏见的探索，可能指导在孟加拉语环境中开发更公平的语言技术。

当前挑战

BanStereoSet数据集在构建过程中面临多项挑战。首先，孟加拉语翻译存在独特的语言和区域特征问题，如缺乏性别代词、本地常用名称和区域参考，这增加了准确传达性别细微差别的难度。其次，StereoSet数据集本身存在多个陷阱，如‘无害或无关的刻板印象’、‘错误应用的刻板印象’、‘无效的扰动’、‘不可比较的群体和属性’以及‘非自然主义的文本’，这些陷阱影响了数据集的质量。此外，数据集在某些类别（如地区偏见）的样本量相对较小，可能限制了偏见评估的全面性。最后，尽管数据集涵盖了广泛的偏见类别，但未包括其他重要类别如性取向、社会经济地位或残疾，且主要捕捉显性偏见，可能忽视了更微妙或潜在的偏见。

常用场景

经典使用场景

BanStereoSet数据集的经典使用场景在于评估多语言大型语言模型（LLMs）在孟加拉语中的社会刻板印象偏见。通过提供1,194个涵盖9种偏见类别的句子，该数据集允许研究者量化和分析模型在性别、种族、职业、年龄、外貌、地区、种姓和宗教等方面的偏见程度。这种评估不仅有助于揭示模型在特定文化背景下的偏见表现，还为开发更公平的语言技术提供了重要参考。

衍生相关工作

BanStereoSet数据集的发布催生了一系列相关研究工作，特别是在多语言偏见检测和公平性评估领域。例如，有研究者利用该数据集开发了新的偏见检测算法，以提高模型在孟加拉语环境中的公平性。此外，该数据集还激发了对其他低资源语言偏见研究的兴趣，推动了跨语言偏见评估方法的标准化和普及。这些衍生工作不仅丰富了偏见研究的理论框架，也为实际应用提供了技术支持。

数据集最近研究