five

Karzan/en-ku-12k

收藏
Hugging Face2024-01-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Karzan/en-ku-12k
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为en-ku-12k,是一个包含约12,900句对的英库双语语料库。句子来源于多种上下文和领域,并由人工翻译从英语翻译成库尔德语。数据集的目的是为机器翻译系统、语言研究和其他涉及英语和库尔德语的NLP任务提供资源。数据集采用平行结构组织,每行代表一个句子对,一列是英语句子,另一列是对应的库尔德语翻译。尽管已尽力确保翻译的准确性,但仍可能存在基于句子上下文的主观性。研究人员和开发人员在使用该数据集时应考虑这一点。
提供机构:
Karzan
原始信息汇总

数据集概述

基本信息

  • 许可证: Apache-2.0
  • 是否可查看: 是
  • 任务类别: 翻译
  • 语言:
    • Kurdish (ku)
    • English (en)
  • 美观名称: English to Kurdish dataset
  • 标签: ckb

数据集描述

  • 名称: en-ku-12k
  • 内容: 包含约12,900对句子,由人工从英语翻译至库尔德语。
  • 来源: 句子来源于多种情境和领域。
  • 结构: 数据集采用平行结构,每行代表一对句子,包含英语句子和对应的库尔德语翻译。

用途

  • 为机器翻译系统、语言学研究及其他涉及英语和库尔德语的NLP任务提供资源。
  • 特别有助于开发和改进机器翻译模型,增强NLP工具和资源的多样性和包容性。

注意事项

  • 尽管已尽力确保翻译的准确性,但某些情况下可能存在基于句子上下文的主观性。使用此数据集的研究人员和开发者应考虑这一点。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作