msarmi9/korean-english-multitarget-ted-talks-task
收藏Hugging Face2022-10-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/msarmi9/korean-english-multitarget-ted-talks-task
下载链接
链接失效反馈官方服务:
资源简介:
English-Korean Multitarget Ted Talks Task (MTTT)数据集是一个包含英语和韩语平行文本的语料库。这些文本最初是从各种TED演讲中转录成英语,然后由TED翻译人员翻译成韩语。数据集大约包含166k训练、2k验证和2k测试句子对。该数据集主要用于机器翻译任务。
提供机构:
msarmi9
原始信息汇总
数据集概述
数据集名称
- 名称: English-Korean Multitarget Ted Talks Task (MTTT)
数据集描述
数据集摘要
- 类型: 平行英语-韩语文本语料库
- 来源: 文本最初由各种Ted Talks转录为英语,然后由TED翻译者翻译为韩语
- 规模: 约166k训练句对,2k验证句对,2k测试句对
支持的任务和排行榜
- 任务: 机器翻译
语言
- 语言: 英语, 韩语
数据集创建
许可证信息
- 许可证: Creative Commons BY-NC-ND 4.0
- 使用条件: 使用时需承认TED的著作权(BY条件),不用于商业目的(NC条件),不创建衍生作品(ND条件)
引用信息
-
引用格式:
@misc{duh18multitarget, author = {Kevin Duh}, title = {The Multitarget TED Talks Task}, howpublished = {url{http://www.cs.jhu.edu/~kevinduh/a/multitarget-tedtalks/}}, year = {2018}, }



