mattpscott/airoboros-summarization
收藏Hugging Face2023-09-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mattpscott/airoboros-summarization
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是Booksum数据集的改编和清理版本,旨在提高LLM在摘要生成方面的能力。数据集经过了一系列的清理和格式化处理,包括去除不良格式、多余的引号和换行符,以及图片引用。此外,数据集还添加了指令格式,要求Airoboros仅使用上下文中的知识,并请求特定的字数。BookSum数据集是一个用于长篇叙事摘要的数据集,涵盖了文学作品领域,如小说、戏剧和故事,并包括高度抽象的人工编写的摘要,涵盖三个难度递增的粒度级别:段落、章节和书籍级别。该数据集的特点和挑战包括处理长文档、非平凡的因果和时间依赖关系,以及丰富的语篇结构。
提供机构:
mattpscott
原始信息汇总
数据集概述
- 数据集名称: Booksum
- 数据集版本: 改编及清洗版
- 适用平台: Airoboros
- 贡献者: Jon Durbin
- 贡献者链接: huggingface



