MTG
收藏arXiv2022-06-10 更新2024-07-30 收录
下载链接:
https://github.com/zide05/MTG
下载链接
链接失效反馈官方服务:
资源简介:
MTG是一个用于训练和评估多语言文本生成的新基准套件。它是首个提出的多语言多向文本生成数据集,拥有最大的人工标注数据(400k)。它包含四个生成任务(故事生成、问题生成、标题生成和文本摘要),涵盖五种语言(英语、德语、法语、西班牙语和中文)。多向设置使模型能够在不同语言和任务之间测试知识转移能力。
MTG is a novel benchmark suite for training and evaluating multilingual text generation. It is the first proposed multilingual multi-directional text generation dataset, featuring the largest manually annotated dataset (400k). It covers four generation tasks: story generation, question generation, title generation, and text summarization, across five languages including English, German, French, Spanish, and Chinese. The multi-directional setup enables models to test their knowledge transfer capabilities between different languages and tasks.
创建时间:
2021-08-13
原始信息汇总
MTG数据集
概述
MTG数据集是为论文《MTG: A Benchmarking Suite for Multilingual Text Generation》提供的代码和数据。
下载链接
数据集可以从以下链接下载: 下载链接



