muibk/wmt21_metrics_task
收藏Hugging Face2022-07-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/muibk/wmt21_metrics_task
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含二十种语言对的翻译任务,涵盖了从孟加拉语-印地语到祖鲁语-科萨语等多种语言组合。数据集的创建者包括专家生成、机器生成和自然发现的语言数据。数据集的多语言性表现为翻译任务,适用于大规模的翻译模型训练和评估。然而,数据集的详细描述、支持的具体任务、数据集的结构、创建过程、使用考虑等信息均未提供。
提供机构:
muibk
原始信息汇总
数据集概述
数据集描述
数据集总结
- 名称: WMT21 Metrics Shared Task
- 语言: 包含20种语言对,如Bengali-Hindi (
bn-hi), Czech-English (cs-en), German-English (de-en) 等。 - 许可证: 未知
- 多语言性: 翻译
- 大小: 100K<n<1M
支持的任务和排行榜
- [信息缺失]
语言
- 数据集包含以下语言对:
- Bengali-Hindi (
bn-hi) - Czech-English (
cs-en) - German-English (
de-en) - German-French (
de-fr) - English-Czech (
en-cs) - English-German (
en-de) - English-Hausa (
en-ha) - English-Icelandic (
en-is) - English-Japanese (
en-ja) - English-Russian (
en-ru) - English-Chinese (
en-zh) - French-German (
fr-de) - Hausa-English (
ha-en) - Hindi-Bengali (
hi-bn) - Icelandic-English (
is-en) - Japanese-English (
ja-en) - Russian-English (
ru-en) - Xhosa-Zulu (
xh-zu) - Chinese-English (
zh-en) - Zulu-Xhosa (
zu-xh)
- Bengali-Hindi (
数据集结构
数据实例
- [信息缺失]
数据字段
- [信息缺失]
数据分割
- [信息缺失]
数据集创建
数据选择理由
- [信息缺失]
源数据
- [信息缺失]
注释
- 创建者: 专家生成
- 语言创建者: 发现, 机器生成, 专家生成
- [信息缺失]
个人和敏感信息
- [信息缺失]
使用数据注意事项
数据集的社会影响
- [信息缺失]
讨论偏见
- [信息缺失]
其他已知限制
- [信息缺失]
附加信息
数据集管理员
- [信息缺失]
许可信息
- [信息缺失]
引用信息
- [信息缺失]
贡献
- 感谢 @github-username 添加此数据集。



