pn-summary
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/pn-summary
下载链接
链接失效反馈官方服务:
资源简介:
Pn-summary 是波斯语抽象文本摘要的数据集。一个结构良好的波斯语摘要数据集由 93,207 条记录组成。它是为抽象/提取任务准备的(例如英语的 cnn_dailymail)。它还可以用于其他范围,例如文本生成、标题生成和新闻类别分类。此外,我们在新模型和技术上测试了这个数据集。_x000D_
mT5:预训练的编码器-解码器模型_x000D_
BERT2BERT:利用 ParsBERT 模型作为编码器-解码器架构。
提供机构:
OpenDataLab
创建时间:
2022-06-07
搜集汇总
数据集介绍

背景与挑战
背景概述
pn-summary是一个波斯语抽象文本摘要数据集,包含93,207条记录,适用于摘要生成、文本生成和新闻分类等任务。该数据集已用于测试mT5和BERT2BERT等模型,由昆士兰科技大学等机构于2020年发布。
以上内容由遇见数据集搜集并总结生成



