pszemraj/booksum-1024-output
收藏Hugging Face2023-11-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/pszemraj/booksum-1024-output
下载链接
链接失效反馈官方服务:
资源简介:
该数据集来源于kmfoda/booksum,使用BSD-3-Clause许可证。数据集的任务类别包括摘要生成和文本到文本生成,大小类别为1K到10K之间。数据集的目标是明确限制最大输出长度,以防止生成部分摘要。
This dataset is sourced from kmfoda/booksum and licensed under the BSD-3-Clause license. Its task categories include summarization and text-to-text generation, with a dataset size ranging between 1K and 10K samples. The core objective of this dataset is to explicitly restrict the maximum output length, thereby preventing the generation of partial summaries.
提供机构:
pszemraj
原始信息汇总
数据集概述
数据集名称
- 名称: booksum
数据集来源
- 来源: kmfoda/booksum
许可证
- 许可证: BSD-3-Clause
训练与评估配置
- 配置: pszemraj--booksum_1024
- 任务: 摘要生成
- 任务ID: summarization
- 评估分割: test
- 列映射:
- chapter: text
- summary_text: target
任务类别
- 摘要生成
- 文本到文本生成
数据集大小
- 大小范围: 1K<n<10K
目标
- 目标: 明确限制最大输出长度,以防止生成不完整的摘要。



