Karzan/en-ku-12k
收藏Hugging Face2024-01-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Karzan/en-ku-12k
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为en-ku-12k,是一个包含约12,900句对的英库双语语料库。句子来源于多种上下文和领域,并由人工翻译从英语翻译成库尔德语。数据集的目的是为机器翻译系统、语言研究和其他涉及英语和库尔德语的NLP任务提供资源。数据集采用平行结构组织,每行代表一个句子对,一列是英语句子,另一列是对应的库尔德语翻译。尽管已尽力确保翻译的准确性,但仍可能存在基于句子上下文的主观性。研究人员和开发人员在使用该数据集时应考虑这一点。
提供机构:
Karzan
原始信息汇总
数据集概述
基本信息
- 许可证: Apache-2.0
- 是否可查看: 是
- 任务类别: 翻译
- 语言:
- Kurdish (ku)
- English (en)
- 美观名称: English to Kurdish dataset
- 标签: ckb
数据集描述
- 名称: en-ku-12k
- 内容: 包含约12,900对句子,由人工从英语翻译至库尔德语。
- 来源: 句子来源于多种情境和领域。
- 结构: 数据集采用平行结构,每行代表一对句子,包含英语句子和对应的库尔德语翻译。
用途
- 为机器翻译系统、语言学研究及其他涉及英语和库尔德语的NLP任务提供资源。
- 特别有助于开发和改进机器翻译模型,增强NLP工具和资源的多样性和包容性。
注意事项
- 尽管已尽力确保翻译的准确性,但某些情况下可能存在基于句子上下文的主观性。使用此数据集的研究人员和开发者应考虑这一点。



