five

somosnlp-hackathon-2022/neutral-es

收藏
Hugging Face2022-10-25 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/somosnlp-hackathon-2022/neutral-es
下载链接
链接失效反馈
官方服务:
资源简介:
neutralES数据集是一个专注于西班牙语性别中立化的数据集,包含手动标注的性别化到中立化的西班牙语转换示例。该数据集的目的是训练西班牙语模型,以实现更包容的句子生成。数据集的构建基于西班牙卫生、社会服务和平等部发布的非性别歧视语言使用指南,并通过数据增强技术增加了训练样本。

neutralES数据集是一个专注于西班牙语性别中立化的数据集,包含手动标注的性别化到中立化的西班牙语转换示例。该数据集的目的是训练西班牙语模型,以实现更包容的句子生成。数据集的构建基于西班牙卫生、社会服务和平等部发布的非性别歧视语言使用指南,并通过数据增强技术增加了训练样本。
提供机构:
somosnlp-hackathon-2022
原始信息汇总

数据集概述

名称: neutralES

语言: 西班牙语 (es)

多语言性: 单语

大小: 1K<n<10K

任务类别:

  • 文本到文本生成
  • 翻译

用途: 训练西班牙语模型,用于将性别化文本转换为中性文本,以实现更包容的句子表达。

数据来源

数据集是通过手动创建的,主要参考了西班牙卫生、社会服务和平等部发布的非性别歧视语言使用指南和手册。此外,还应用了数据增强技术以生成最小数量的训练示例。

参考文献

团队成员

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作