BanglaNLG
收藏arXiv2023-02-12 更新2024-06-21 收录
下载链接:
https://github.com/csebuetnlp/BanglaNLG
下载链接
链接失效反馈官方服务:
资源简介:
BanglaNLG是一个针对孟加拉语自然语言生成(NLG)的综合基准,由孟加拉工程技术大学开发。该数据集包含六个具有挑战性的条件文本生成任务,特别引入了对话生成的新数据集。数据集大小为27.5 GB,涵盖广泛的领域,旨在评估和提升孟加拉语NLG模型的性能。BanglaNLG的应用领域包括机器翻译、文本摘要、问答、对话生成、新闻标题生成和跨语言摘要,旨在解决孟加拉语在NLG领域的代表性不足问题。
提供机构:
孟加拉工程技术大学
创建时间:
2022-05-23
搜集汇总
数据集介绍

背景与挑战
背景概述
BanglaNLG是一个用于评估孟加拉语自然语言生成(NLG)的基准数据集,包含六个下游任务,如机器翻译和问答,并引入了新的对话生成数据。它基于27.5GB的孟加拉语语料库预训练了BanglaT5模型,旨在支持低资源语言的NLG研究。
以上内容由遇见数据集搜集并总结生成



