five

Building Bridges: A Dataset for Evaluating Gender-Fair Machine Translation into German

收藏
arXiv2024-06-10 更新2024-06-12 收录
下载链接:
https://github.com/g8a9/building-bridges-gender-fair-german-mt
下载链接
链接失效反馈
官方服务:
资源简介:
本研究介绍了名为‘Building Bridges’的数据集,旨在评估性别公平的英语到德语机器翻译。该数据集由格拉茨大学等机构创建,包含115个名词,涵盖职业和普通名词,用于测试性别中性词汇的翻译。数据集通过增强社区创建的性别公平语言词典,并从百科全书文本和议会演讲中抽样多句测试实例构建。此数据集的应用领域主要集中在解决机器翻译中的性别偏见问题,推动性别公平语言的使用。

This study introduces a dataset named 'Building Bridges' for evaluating gender-fair English-to-German machine translation. Developed by institutions including the University of Graz, this dataset consists of 115 nouns covering both occupational and general terms, designed to test the translation of gender-neutral vocabulary. It is constructed by augmenting community-created gender-fair language lexicons and sampling multi-sentence test instances from encyclopedia texts and parliamentary speeches. The primary applications of this dataset lie in addressing gender bias in machine translation and advancing the adoption of gender-fair language.
提供机构:
格拉茨大学, 奥地利
创建时间:
2024-06-10
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作