zouharvi/wmt-terminology-2023
收藏Hugging Face2024-03-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/zouharvi/wmt-terminology-2023
下载链接
链接失效反馈官方服务:
资源简介:
WMT 2023术语共享任务数据集包含源文本、参考文本、术语以及参与者的提交内容,主要用于机器翻译任务。数据集的语言包括英语、捷克语、中文和德语,并且数据集的大小在1K到10K之间。数据集的来源包括捷克和英语的论文摘要、MuchMore Springer双语语料库以及BWB语料库。
WMT 2023术语共享任务数据集包含源文本、参考文本、术语以及参与者的提交内容,主要用于机器翻译任务。数据集的语言包括英语、捷克语、中文和德语,并且数据集的大小在1K到10K之间。数据集的来源包括捷克和英语的论文摘要、MuchMore Springer双语语料库以及BWB语料库。
提供机构:
zouharvi
原始信息汇总
WMT 2023 Terminology Shared Task Data
数据集概述
- 任务类别: 翻译
- 语言: 英语 (en), 捷克语 (cs), 中文 (zh), 德语 (de)
- 标签: 术语学, WMT
- 名称: WMT 2023 Terminology Shared Task Data
- 大小类别: 1K<n<10K
- 许可证: cc
数据内容
- 包含源文本、参考文本、术语以及参与者提交的内容。
- 仅包含
test分割。
引用信息
@inproceedings{semenov-etal-2023-findings, title = "Findings of the WMT 2023 Shared Task on Machine Translation with Terminologies", author = "Kirill Semenov and Vilém Zouhar and Tom Kocmi and Dongdong Zhang and Wangchunshu Zhou and Yuchen Eleanor Jiang" booktitle = "Proceedings of the Eight Conference on Machine Translation (WMT)", month = dec, year = "2023", publisher = "Association for Computational Linguistics", }
数据来源
- 捷克语和英语的ÚFAL论文摘要: 由Rudolf Rosa和Vilém Zouhar提供。
- MuchMore Springer Bilingual Corpus
- BWB Corpus: 由Yuchen Eleanor Jiang等人提供。
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



