VanessaSchenkel/handmade-dataset
收藏Hugging Face2022-08-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/VanessaSchenkel/handmade-dataset
下载链接
链接失效反馈官方服务:
资源简介:
---
annotations_creators:
- found
language:
- en
- pt
language_creators:
- found
license:
- afl-3.0
multilinguality:
- translation
pretty_name: VanessaSchenkel/handmade-dataset
size_categories:
- n<1K
source_datasets:
- original
tags: []
task_categories:
- translation
task_ids: []
---
Dataset with sentences regarding professions, half of the translations are to feminine and half for masculine sentences.
How to use it:
```
from datasets import load_dataset
remote_dataset = load_dataset("VanessaSchenkel/handmade-dataset", field="data")
remote_dataset
```
Output:
```
DatasetDict({
train: Dataset({
features: ['id', 'translation'],
num_rows: 388
})
})
```
Exemple:
```
remote_dataset["train"][5]
```
Output:
```
{'id': '5',
'translation': {'english': 'the postman finished her work .',
'portuguese': 'A carteira terminou seu trabalho .'}}
```
提供机构:
VanessaSchenkel
原始信息汇总
数据集概述
基本信息
- 名称: VanessaSchenkel/handmade-dataset
- 语言: 英语(en)、葡萄牙语(pt)
- 许可证: AFL-3.0
- 多语言性: 翻译
- 数据集大小: 小于1K
- 数据来源: 原始数据
- 任务类别: 翻译
数据集内容
- 描述: 包含关于职业的句子,其中一半翻译为女性用语,一半为男性用语。
数据结构
- 结构: 包含id和translation两个特征。
- 示例:
- ID: 5
- 翻译:
- 英语: the postman finished her work .
- 葡萄牙语: A carteira terminou seu trabalho .
使用方法
-
加载数据集: python from datasets import load_dataset remote_dataset = load_dataset("VanessaSchenkel/handmade-dataset", field="data") remote_dataset
-
输出示例: python DatasetDict({ train: Dataset({ features: [id, translation], num_rows: 388 }) })



