rbawden/DiscEvalMT
收藏Dataset Card for DiscEvalMT
Dataset Details
- 名称: DiscEvalMT
- 描述: 用于英语到法语机器翻译评估的对比测试集,涵盖两种话语现象:回指和词汇选择(连贯/衔接)。
- 语言: 英语到法语
- 许可证: CC-BY-SA-4.0
- 创建者: Rachel Bawden, Rico Sennrich, Alexandra Birch, Barry Haddow
数据集来源
- 仓库: https://github.com/rbawden/discourse-mt-test-sets/tree/master
- 论文: Bawden et al., 2018. Evaluating Discourse Phenomena in Neural Machine Translation
用途
- 目的: 用于测试机器翻译模型在翻译过程中使用先前语言上下文(前一句)的能力。
- 结构: 每个示例块包含一个前源句子和两个可能的翻译,伴随上下文,用于区分两个可能的翻译。每个实例包含一个正确翻译和一个对比翻译。
- 评估: 模型应根据提供的上下文对每个翻译进行排序,并评估其将正确翻译排在对比翻译之上的准确性。
使用限制
- 方向限制: 仅适用于从英语到法语的翻译,不适用于相反方向。
- 补充用途: 作为全局评估质量指标的补充。
数据集结构
- 分割: 每个分割(回指和词汇选择)包含200个实例。
- 实例格式: 每个实例包含以下字段:
split: 分割类型(回指或词汇选择)ex_num: 示例编号type: 类型context_src: 前源句子current_src: 当前源句子context_trg: 前目标句子current_trg: 当前目标句子contrastive_context_trg: 对比前目标句子contrastive_current_trg: 对比当前目标句子correct_or_semicorrect: 正确或半正确标记
数据集创建
- 数据来源: 手工创建的示例,旨在自然、多样。
- 数据收集和处理: 由第一作者(母语为英国英语,双语法语)手动创建,并由法语母语者检查。
- 敏感信息: 数据集中不包含个人或敏感信息。
引用
-
BibTeX:
@inproceedings{bawden-etal-2018-evaluating, title = "Evaluating Discourse Phenomena in Neural Machine Translation", author = "Bawden, Rachel and Sennrich, Rico and Birch, Alexandra and Haddow, Barry", booktitle = {{Proceedings of the 2018 Conference of the North {A}merican Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long Papers)}}, month = jun, year = "2018", address = "New Orleans, Louisiana", publisher = "Association for Computational Linguistics", url = "https://www.aclweb.org/anthology/N18-1118", doi = "10.18653/v1/N18-1118", pages = "1304--1313" }
-
APA:
Bawden, R., Sennrich, R., Birch, A., & Haddow, B. (2018). Evaluating Discourse Phenomena in Neural Machine Translation. In Proceedings of the 2018 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long Papers) (pp. 1304–1313). Association for Computational Linguistics.




