five

shahules786/Multi-chapter-summaries

收藏
Hugging Face2023-08-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/shahules786/Multi-chapter-summaries
下载链接
链接失效反馈
官方服务:
资源简介:
Multi-chapter summaries数据集基于BOOKSUM数据集,旨在通过将同一本书的多个章节合并为一个更大的上下文长度,来微调具有较长上下文长度(8k+)的模型。数据集的上下文由多个章节组成,提示要求对其中一个章节进行摘要,相应的章节摘要可以在`summary`列中找到。

Multi-chapter summaries数据集基于BOOKSUM数据集,旨在通过将同一本书的多个章节合并为一个更大的上下文长度,来微调具有较长上下文长度(8k+)的模型。数据集的上下文由多个章节组成,提示要求对其中一个章节进行摘要,相应的章节摘要可以在`summary`列中找到。
提供机构:
shahules786
原始信息汇总

数据集概述

来源与目的

  • 来源: 该数据集源自BOOKSUM
  • 目的: 利用BOOKSUM数据集对模型进行微调,以处理更长的上下文长度(超过8000个token)。

数据结构

  • 上下文构成: 数据集中的上下文由同一本书中的多个章节组合而成,以形成更长的上下文长度。
  • 内容描述: 每个提示请求一个章节的摘要,该章节的摘要信息存储在summary列中。

特征描述

  • 上下文长度: 上下文的长度大约为8000个token。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作