five

zouharvi/wmt-terminology-2023

收藏
Hugging Face2024-03-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/zouharvi/wmt-terminology-2023
下载链接
链接失效反馈
官方服务:
资源简介:
WMT 2023术语共享任务数据集包含源文本、参考文本、术语以及参与者的提交内容,主要用于机器翻译任务。数据集的语言包括英语、捷克语、中文和德语,并且数据集的大小在1K到10K之间。数据集的来源包括捷克和英语的论文摘要、MuchMore Springer双语语料库以及BWB语料库。

WMT 2023术语共享任务数据集包含源文本、参考文本、术语以及参与者的提交内容,主要用于机器翻译任务。数据集的语言包括英语、捷克语、中文和德语,并且数据集的大小在1K到10K之间。数据集的来源包括捷克和英语的论文摘要、MuchMore Springer双语语料库以及BWB语料库。
提供机构:
zouharvi
原始信息汇总

WMT 2023 Terminology Shared Task Data

数据集概述

  • 任务类别: 翻译
  • 语言: 英语 (en), 捷克语 (cs), 中文 (zh), 德语 (de)
  • 标签: 术语学, WMT
  • 名称: WMT 2023 Terminology Shared Task Data
  • 大小类别: 1K<n<10K
  • 许可证: cc

数据内容

  • 包含源文本、参考文本、术语以及参与者提交的内容。
  • 仅包含 test 分割。

引用信息

@inproceedings{semenov-etal-2023-findings, title = "Findings of the WMT 2023 Shared Task on Machine Translation with Terminologies", author = "Kirill Semenov and Vilém Zouhar and Tom Kocmi and Dongdong Zhang and Wangchunshu Zhou and Yuchen Eleanor Jiang" booktitle = "Proceedings of the Eight Conference on Machine Translation (WMT)", month = dec, year = "2023", publisher = "Association for Computational Linguistics", }

数据来源

  • 捷克语和英语的ÚFAL论文摘要: 由Rudolf Rosa和Vilém Zouhar提供。
  • MuchMore Springer Bilingual Corpus
  • BWB Corpus: 由Yuchen Eleanor Jiang等人提供。
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作