ortofasfat/AAAI_Swahili_dataset
收藏Hugging Face2024-02-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ortofasfat/AAAI_Swahili_dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是从英语翻译成斯瓦希里语的Dolly 15k数据集,经过Toloka平台的过滤和处理。它包含了来自不同领域的上下文、响应和指令,为自然语言处理任务提供了丰富的资源,特别是针对斯瓦希里语的任务。数据集以CSV格式提供,包含多个字段,如任务ID、翻译后的上下文、原始上下文、翻译后的响应、原始响应、翻译后的指令、原始指令以及Toloka平台评估的置信度或质量分数。数据集的创建旨在增强斯瓦希里语自然语言处理的资源,提供用于翻译任务、问答系统和其他语言建模任务的强大数据集。
提供机构:
ortofasfat
原始信息汇总
数据集概述
数据集名称
Dolly 15k
数据集内容
- 语言转换:从英语翻译至斯瓦希里语。
- 数据处理:通过Toloka平台进行过滤和处理。
- 数据类型:包含多种上下文、响应和指令。
- 应用领域:适用于自然语言处理任务,特别是关注斯瓦希里语的研究。
数据集特点
- 多样性:涵盖多个领域的文本数据。
- 资源丰富:为斯瓦希里语的自然语言处理提供丰富资源。



