XTREME (Cross-Lingual Transfer Evaluation of Multilingual Encoders)
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/XTREME
下载链接
链接失效反馈官方服务:
资源简介:
引入了多语言编码器的跨语言迁移评估 (XTREME) 基准,以鼓励对多语言迁移学习进行更多研究。 XTREME 涵盖了跨越 12 个语言家族的 40 种类型不同的语言,并包括 9 个需要推理不同级别的语法或语义的任务。选择 XTREME 中的语言是为了最大限度地提高语言多样性、现有任务的覆盖范围以及训练数据的可用性。选择 XTREME 中的语言是为了最大限度地提高语言多样性、现有任务的覆盖范围以及训练数据的可用性。其中有许多未被充分研究的语言,例如德拉威语泰米尔语(在印度南部、斯里兰卡和新加坡使用)、泰卢固语和马拉雅拉姆语(主要在印度南部使用),以及尼日尔-刚果语斯瓦希里语和约鲁巴语在非洲。
提供机构:
OpenDataLab
创建时间:
2022-08-19



