five

LCSTS

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/LCSTS
下载链接
链接失效反馈
官方服务:
资源简介:
自动文本摘要被广泛认为是一个高度困难的问题,部分原因是缺乏大型文本摘要数据集。由于构建大规模全文摘要的巨大挑战,我们介绍了从中国微博网站新浪微博构建的大规模中文短文本摘要数据集。该语料库包含超过 200 万条真实的中文短文本,每个文本的作者都给出了简短的摘要。我们还手动标记了 10,666 个简短摘要及其相应短文本的相关性。在语料库的基础上,我们引入循环神经网络进行摘要生成并取得了可喜的结果,这不仅表明了所提出的语料库对短文本摘要研究的有用性,而且为该主题的进一步研究提供了基线。
提供机构:
OpenDataLab
创建时间:
2022-08-16
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作