shahules786/Multi-chapter-summaries
收藏Hugging Face2023-08-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/shahules786/Multi-chapter-summaries
下载链接
链接失效反馈官方服务:
资源简介:
Multi-chapter summaries数据集基于BOOKSUM数据集,旨在通过将同一本书的多个章节合并为一个更大的上下文长度,来微调具有较长上下文长度(8k+)的模型。数据集的上下文由多个章节组成,提示要求对其中一个章节进行摘要,相应的章节摘要可以在`summary`列中找到。
Multi-chapter summaries数据集基于BOOKSUM数据集,旨在通过将同一本书的多个章节合并为一个更大的上下文长度,来微调具有较长上下文长度(8k+)的模型。数据集的上下文由多个章节组成,提示要求对其中一个章节进行摘要,相应的章节摘要可以在`summary`列中找到。
提供机构:
shahules786
原始信息汇总
数据集概述
来源与目的
- 来源: 该数据集源自BOOKSUM。
- 目的: 利用BOOKSUM数据集对模型进行微调,以处理更长的上下文长度(超过8000个token)。
数据结构
- 上下文构成: 数据集中的上下文由同一本书中的多个章节组合而成,以形成更长的上下文长度。
- 内容描述: 每个提示请求一个章节的摘要,该章节的摘要信息存储在
summary列中。
特征描述
- 上下文长度: 上下文的长度大约为8000个token。



