five

DigitalUmuganda/Monolingual_health_dataset

收藏
Hugging Face2023-09-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/DigitalUmuganda/Monolingual_health_dataset
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个关于营养不良的单语数据集,包含Kinyarwanda和英语两种语言,计划通过翻译工具将其转化为平行语料库。数据来源于卢旺达生物医学中心(RBC)和GPT-4生成的数据,分别包含26,390和42,576个句子。

这是一个关于营养不良的单语数据集,包含Kinyarwanda和英语两种语言,计划通过翻译工具将其转化为平行语料库。数据来源于卢旺达生物医学中心(RBC)和GPT-4生成的数据,分别包含26,390和42,576个句子。
提供机构:
DigitalUmuganda
原始信息汇总

单语数据集

数据集描述

这是一个关于营养不良的单语数据集,包含基尼亚卢旺达语和英语,计划通过翻译器转换为平行语料库。

数据来源

  1. 卢旺达生物医学中心(RBC)提供的数据,包含26,390个句子。
  2. 通过GPT-4提示生成的数据,包含42,576个句子。

语言

  • 基尼亚卢旺达语
  • 英语

数据规模

  • 10K<n<100K

许可证

  • CC BY 2.0
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作