five

msarmi9/korean-english-multitarget-ted-talks-task

收藏
Hugging Face2022-10-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/msarmi9/korean-english-multitarget-ted-talks-task
下载链接
链接失效反馈
官方服务:
资源简介:
English-Korean Multitarget Ted Talks Task (MTTT)数据集是一个包含英语和韩语平行文本的语料库。这些文本最初是从各种TED演讲中转录成英语,然后由TED翻译人员翻译成韩语。数据集大约包含166k训练、2k验证和2k测试句子对。该数据集主要用于机器翻译任务。
提供机构:
msarmi9
原始信息汇总

数据集概述

数据集名称

  • 名称: English-Korean Multitarget Ted Talks Task (MTTT)

数据集描述

数据集摘要

  • 类型: 平行英语-韩语文本语料库
  • 来源: 文本最初由各种Ted Talks转录为英语,然后由TED翻译者翻译为韩语
  • 规模: 约166k训练句对,2k验证句对,2k测试句对

支持的任务和排行榜

  • 任务: 机器翻译

语言

  • 语言: 英语, 韩语

数据集创建

许可证信息

  • 许可证: Creative Commons BY-NC-ND 4.0
  • 使用条件: 使用时需承认TED的著作权(BY条件),不用于商业目的(NC条件),不创建衍生作品(ND条件)

引用信息

  • 引用格式:

    @misc{duh18multitarget, author = {Kevin Duh}, title = {The Multitarget TED Talks Task}, howpublished = {url{http://www.cs.jhu.edu/~kevinduh/a/multitarget-tedtalks/}}, year = {2018}, }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作