WMT 2020 Sentence-Level Direct Assessment dataset

DataCite Commons2024-12-16 更新2025-04-16 收录

下载链接：

https://service.tib.eu/ldmservice/dataset/caaec288-31f3-4709-8a55-17cc22310ad0

下载链接

链接失效反馈

官方服务：

资源简介：

The dataset used in the competition for Sentence-Level Direct Assessment shared task is composed of data extracted from Wikipedia for six language pairs, consisting of high-resource languages English-German (En-De) and English-Chinese (En-Zh), medium-resource languages Romanian-English (Ro-En) and Estonian-English (Et-En), and low-resource languages Sinhala-English (Si-En) and Nepalese-English (Ne-En), as well as a Russian-English (Ru-En) dataset which combines articles from Wikipedia and Reddit.

提供机构：

TIB

创建时间：

2024-12-16

5,000+

优质数据集

54 个

任务类型

进入经典数据集