five

XGLUE

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/XGLUE
下载链接
链接失效反馈
官方服务:
资源简介:
"XGLUE 是一个新的基准数据集,用于评估跨语言预训练模型在跨语言自然语言理解和生成方面的性能。对于从事 XTREME 工作的人,我们建议您将结果提交给 XGLUE同样,特别是对于 XGLUE 独特的任务,因为 (1) XGLUE 包括来自现实世界场景的任务(新闻分类、查询-广告匹配、网页排名和 QA 匹配),所有这些数据集都是由人工生成和标记的, (2) XGLUE 提供了两个跨语言文本生成任务。XGLUE 由 11 个任务组成,跨越 19 种语言。对于每个任务,训练数据只有英文。这意味着要在 XGLUE 上取得成功,一个模型必须具有很强的零样本跨语言迁移能力,才能从特定任务的英文数据中学习,并将所学的东西迁移到其他语言中。相比于它的并发工作 XTREME,XGLUE 有两个特点:第一,它包括跨语言李ngual NLU 和跨语言 NLG 任务同时进行;其次,除了包含 5 个现有的跨语言任务(即 NER、POS、MLQA、PAWS-X 和 XNLI)外,XGLUE 还从 Bing 场景中选择了 6 个新任务,包括新闻分类(NC)、查询广告匹配(QADSM) 、网页排名 (WPR)、QA 匹配 (QAM)、问题生成 (QG) 和新闻标题生成 (NTG)。这种语言、任务和任务来源的多样性为量化跨语言自然语言理解和生成的预训练模型的质量提供了一个全面的基准。”
提供机构:
OpenDataLab
创建时间:
2022-04-29
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作