five

MTG

收藏
arXiv2022-06-10 更新2024-07-30 收录
下载链接:
https://github.com/zide05/MTG
下载链接
链接失效反馈
官方服务:
资源简介:
MTG是一个用于训练和评估多语言文本生成的新基准套件。它是首个提出的多语言多向文本生成数据集,拥有最大的人工标注数据(400k)。它包含四个生成任务(故事生成、问题生成、标题生成和文本摘要),涵盖五种语言(英语、德语、法语、西班牙语和中文)。多向设置使模型能够在不同语言和任务之间测试知识转移能力。

MTG is a novel benchmark suite for training and evaluating multilingual text generation. It is the first proposed multilingual multi-directional text generation dataset, featuring the largest manually annotated dataset (400k). It covers four generation tasks: story generation, question generation, title generation, and text summarization, across five languages including English, German, French, Spanish, and Chinese. The multi-directional setup enables models to test their knowledge transfer capabilities between different languages and tasks.
创建时间:
2021-08-13
原始信息汇总

MTG数据集

概述

MTG数据集是为论文《MTG: A Benchmarking Suite for Multilingual Text Generation》提供的代码和数据。

下载链接

数据集可以从以下链接下载: 下载链接

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作