BookSum
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/BookSum
下载链接
链接失效反馈官方服务:
资源简介:
BookSum 是用于长篇叙事摘要的数据集集合。该数据集涵盖了来自文学领域的源文档,例如小说、戏剧和故事,并包括高度抽象的人工书面摘要,其难度越来越高,分为三个粒度级别:段落级、章节级和书籍级。该数据集的领域和结构对摘要系统提出了一系列独特的挑战,其中包括:处理非常长的文档、非平凡的因果和时间依赖性以及丰富的话语结构。 BookSum 包含 142,753 段、12,293 章和 436 本书的摘要。
提供机构:
OpenDataLab
创建时间:
2022-08-16



