Filipino CrowS-Pairs 和 Filipino WinoQueer

Name: Filipino CrowS-Pairs 和 Filipino WinoQueer
Creator: 伯明翰大学计算机科学学院，雅典耀德拉萨大学信息系统与计算机科学系
Published: 2024-12-11 22:43:31
License: 暂无描述

arXiv2024-12-11 更新2024-12-12 收录

下载链接：

https://github.com/gamboalance/filipino_bias_benchmarks

下载链接

链接失效反馈

官方服务：

资源简介：

Filipino CrowS-Pairs 和 Filipino WinoQueer 是用于评估菲律宾语中性别歧视和反同性恋偏见的多语言语言模型基准数据集。该数据集包含7,074条新的挑战对，来源于对英语偏见评估数据集的文化适应过程。数据集的创建过程详细记录了文化适应的挑战和解决方案，旨在为其他低资源语言的类似工作提供指导。该数据集的应用领域主要集中在多语言模型的偏见评估和偏见缓解，特别是在东南亚地区，尤其是菲律宾语的使用环境中。

Filipino CrowS-Pairs and Filipino WinoQueer are multilingual language model benchmark datasets for evaluating gender discrimination and anti-homosexual bias in the Filipino language. This combined dataset contains 7,074 new challenge pairs derived from the cultural adaptation process of English bias evaluation datasets. The dataset creation process thoroughly documents the challenges and solutions encountered during cultural adaptation, aiming to provide guidance for similar work in other low-resource languages. Its main application areas focus on bias evaluation and bias mitigation of multilingual models, especially in Southeast Asian regions, particularly in the context of Filipino language usage.

提供机构：

伯明翰大学计算机科学学院，雅典耀德拉萨大学信息系统与计算机科学系

创建时间：

2024-12-10

搜集汇总

数据集介绍

构建方式

Filipino CrowS-Pairs 和 Filipino WinoQueer 数据集的构建基于对英语偏见评估数据集的文化适应过程。研究团队详细记录了将英语的 CrowS-Pairs 和 WinoQueer 数据集翻译为菲律宾语的过程，并针对语言和文化差异进行了调整。例如，菲律宾语的性别中性特性使得直接翻译带有性别词汇的句子变得困难，因此研究团队采用了在相关名词后添加描述符（如 lalaki 或 babae）的方式来区分性别。此外，针对菲律宾语中对非异性恋身份的不同概念，研究团队选择了符合当地文化的身份标签，如 bakla 和 tomboy，而非直接使用英语中的 LGBTQ+ 术语。通过这些文化适应策略，研究团队成功构建了 7,074 个新的挑战对，形成了 Filipino CrowS-Pairs 和 Filipino WinoQueer 数据集。

特点

Filipino CrowS-Pairs 和 Filipino WinoQueer 数据集的主要特点在于其文化适应性和多样性。首先，这两个数据集填补了菲律宾语环境中对性别和非异性恋偏见评估的空白，特别是 WinoQueer 数据集，它是首个非英语的反同性恋偏见评估基准。其次，数据集的构建过程中充分考虑了菲律宾语的性别中性特性以及当地对非异性恋身份的文化理解，确保了数据集在菲律宾语环境中的适用性。此外，数据集的多样性体现在其涵盖了多种性别和性取向的偏见类型，能够全面评估多语言模型的偏见行为。

使用方法

Filipino CrowS-Pairs 和 Filipino WinoQueer 数据集主要用于评估多语言预训练模型（PLMs）在菲律宾语环境中的性别和非异性恋偏见。研究者可以通过这些数据集对模型进行偏见评估，计算模型在不同偏见类型上的偏见得分。具体而言，研究者可以使用偏见得分指标，该指标通过比较模型在偏见句子和非偏见句子之间的选择倾向，来量化模型的偏见程度。此外，这些数据集还可以用于测试和验证偏见缓解技术的效果，帮助研究者开发更加公平和无偏见的多语言模型。

背景与挑战

背景概述

随着多语言预训练语言模型（PLMs）的快速发展，研究人员逐渐意识到这些模型在处理不同语言时可能携带性别和性取向相关的偏见。为了应对这一问题，Lance Calvin Gamboa和Mark Lee等学者于2024年推出了Filipino CrowS-Pairs和Filipino WinoQueer数据集，旨在评估菲律宾语中多语言模型中的性别歧视和反同性恋偏见。这两个数据集通过文化适应的方式，将英语偏见评估数据集转化为菲律宾语，共包含7,074个新的挑战对，为低资源语言的偏见研究提供了重要工具。该研究不仅填补了菲律宾语偏见评估的空白，还为东南亚地区的多语言模型偏见研究奠定了基础。

当前挑战

Filipino CrowS-Pairs和Filipino WinoQueer数据集的构建面临多重挑战。首先，菲律宾语的性别中性语言特性使得直接翻译英语中的性别相关偏见变得困难，研究人员需要通过文化适应策略来解决这一问题。其次，菲律宾语中对非异性恋身份的概念与英语存在显著差异，这要求在构建数据集时进行细致的文化调整。此外，数据集中包含的一些西方文化特有内容在菲律宾语中难以找到对应表达，导致部分偏见语句无法直接翻译。最后，多语言模型的偏见评估不仅需要考虑语言本身的特性，还需关注模型在不同语言数据上的预训练数据量对偏见学习的影响。

常用场景

经典使用场景

Filipino CrowS-Pairs 和 Filipino WinoQueer 数据集的经典使用场景主要集中在评估多语言预训练语言模型（PLMs）中的性别歧视和反同性恋偏见。通过这些数据集，研究者能够系统性地检测和量化模型在处理菲律宾语文本时所表现出的性别和性取向偏见。这些数据集特别适用于评估那些在东南亚地区广泛使用的多语言模型，尤其是那些在菲律宾语数据上进行预训练的模型。

解决学术问题

Filipino CrowS-Pairs 和 Filipino WinoQueer 数据集解决了多语言模型中性别和性取向偏见的量化问题。这些数据集填补了非英语语言中反同性恋偏见评估的空白，为研究者提供了一个基准，用于评估和缓解多语言模型中的偏见。通过这些数据集，研究者能够更好地理解模型在不同语言和文化背景下的偏见表现，从而推动偏见评估和缓解技术的发展。

衍生相关工作

Filipino CrowS-Pairs 和 Filipino WinoQueer 数据集的发布激发了大量相关研究工作。首先，这些数据集为其他低资源语言的偏见评估提供了模板，推动了类似数据集在其他语言中的开发。其次，研究者利用这些数据集进一步探索了多语言模型在不同语言和文化背景下的偏见表现，提出了多种偏见缓解技术。此外，这些数据集还促进了跨语言偏见评估方法的研究，为全球范围内的偏见评估和缓解工作提供了新的视角。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集