five

BigScienceBiasEval/crows_pairs_multilingual

收藏
Hugging Face2024-01-14 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/BigScienceBiasEval/crows_pairs_multilingual
下载链接
链接失效反馈
官方服务:
资源简介:
CrowS-Pairs-fr数据集是一个用于测量掩码语言模型中社会偏见的数据集,特别针对法语环境。该数据集首先将英语语料库中的1,508个句子对翻译成法语,然后通过众包方法收集与法国社会文化环境相关的刻板印象句子。数据集包含210个额外的句子,这些句子通过LanguageARC平台收集,参与者被要求提交表达刻板印象的法语陈述。数据集中的句子可能包含令人不适的内容,并且每个刻板印象句子都配有一个反刻板印象的句子。
提供机构:
BigScienceBiasEval
原始信息汇总

数据集概述

数据集名称

  • Crows-Pairs-fr

数据集开发者

  • Aurélie Névéol, Yoann Dupont, Julien Bezançon, Karën Fort

数据声明作者

  • Aurélie Névéol, Yoann Dupont

数据集描述

  • Curation Rationale: 数据集的法国部分首先将原始英语数据集的1,508对句子翻译成法语。随后,采用众包方法收集与法国社会文化环境相关的额外带有刻板印象的句子,共收集了210句。
  • Language Variety: 使用BCP-47语言标签 fr-FR,描述为“由法国本土人士使用的法语”。
  • Text Characteristics: 数据集包含一系列法语中的冒犯性刻板印象陈述,可能引起不适。这些陈述与反刻板印象陈述配对。

许可证

  • Creative Commons Attribution-ShareAlike 4.0 (CC BY-SA 4.0)

引用信息

  • Névéol A, Dupont Y, Bezançon J, Fort K. French CrowS-Pairs: Extending a challenge dataset for measuring social bias in masked language models to a language other than English. Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics - ACL 2022
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作