DigitalUmuganda/Monolingual_health_dataset
收藏Hugging Face2023-09-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/DigitalUmuganda/Monolingual_health_dataset
下载链接
链接失效反馈官方服务:
资源简介:
这是一个关于营养不良的单语数据集,包含Kinyarwanda和英语两种语言,计划通过翻译工具将其转化为平行语料库。数据来源于卢旺达生物医学中心(RBC)和GPT-4生成的数据,分别包含26,390和42,576个句子。
这是一个关于营养不良的单语数据集,包含Kinyarwanda和英语两种语言,计划通过翻译工具将其转化为平行语料库。数据来源于卢旺达生物医学中心(RBC)和GPT-4生成的数据,分别包含26,390和42,576个句子。
提供机构:
DigitalUmuganda
原始信息汇总
单语数据集
数据集描述
这是一个关于营养不良的单语数据集,包含基尼亚卢旺达语和英语,计划通过翻译器转换为平行语料库。
数据来源
- 卢旺达生物医学中心(RBC)提供的数据,包含26,390个句子。
- 通过GPT-4提示生成的数据,包含42,576个句子。
语言
- 基尼亚卢旺达语
- 英语
数据规模
- 10K<n<100K
许可证
- CC BY 2.0



