five

BanglaNLG

收藏
arXiv2023-02-12 更新2024-06-21 收录
下载链接:
https://github.com/csebuetnlp/BanglaNLG
下载链接
链接失效反馈
官方服务:
资源简介:
BanglaNLG是一个针对孟加拉语自然语言生成(NLG)的综合基准,由孟加拉工程技术大学开发。该数据集包含六个具有挑战性的条件文本生成任务,特别引入了对话生成的新数据集。数据集大小为27.5 GB,涵盖广泛的领域,旨在评估和提升孟加拉语NLG模型的性能。BanglaNLG的应用领域包括机器翻译、文本摘要、问答、对话生成、新闻标题生成和跨语言摘要,旨在解决孟加拉语在NLG领域的代表性不足问题。
提供机构:
孟加拉工程技术大学
创建时间:
2022-05-23
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
BanglaNLG是一个用于评估孟加拉语自然语言生成(NLG)的基准数据集,包含六个下游任务,如机器翻译和问答,并引入了新的对话生成数据。它基于27.5GB的孟加拉语语料库预训练了BanglaT5模型,旨在支持低资源语言的NLG研究。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作