five

VanessaSchenkel/handmade-dataset

收藏
Hugging Face2022-08-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/VanessaSchenkel/handmade-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
--- annotations_creators: - found language: - en - pt language_creators: - found license: - afl-3.0 multilinguality: - translation pretty_name: VanessaSchenkel/handmade-dataset size_categories: - n<1K source_datasets: - original tags: [] task_categories: - translation task_ids: [] --- Dataset with sentences regarding professions, half of the translations are to feminine and half for masculine sentences. How to use it: ``` from datasets import load_dataset remote_dataset = load_dataset("VanessaSchenkel/handmade-dataset", field="data") remote_dataset ``` Output: ``` DatasetDict({ train: Dataset({ features: ['id', 'translation'], num_rows: 388 }) }) ``` Exemple: ``` remote_dataset["train"][5] ``` Output: ``` {'id': '5', 'translation': {'english': 'the postman finished her work .', 'portuguese': 'A carteira terminou seu trabalho .'}} ```
提供机构:
VanessaSchenkel
原始信息汇总

数据集概述

基本信息

  • 名称: VanessaSchenkel/handmade-dataset
  • 语言: 英语(en)、葡萄牙语(pt)
  • 许可证: AFL-3.0
  • 多语言性: 翻译
  • 数据集大小: 小于1K
  • 数据来源: 原始数据
  • 任务类别: 翻译

数据集内容

  • 描述: 包含关于职业的句子,其中一半翻译为女性用语,一半为男性用语。

数据结构

  • 结构: 包含id和translation两个特征。
  • 示例:
    • ID: 5
    • 翻译:
      • 英语: the postman finished her work .
      • 葡萄牙语: A carteira terminou seu trabalho .

使用方法

  • 加载数据集: python from datasets import load_dataset remote_dataset = load_dataset("VanessaSchenkel/handmade-dataset", field="data") remote_dataset

  • 输出示例: python DatasetDict({ train: Dataset({ features: [id, translation], num_rows: 388 }) })

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作