five

pszemraj/booksum-1024-output

收藏
Hugging Face2023-11-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/pszemraj/booksum-1024-output
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集来源于kmfoda/booksum,使用BSD-3-Clause许可证。数据集的任务类别包括摘要生成和文本到文本生成,大小类别为1K到10K之间。数据集的目标是明确限制最大输出长度,以防止生成部分摘要。

This dataset is sourced from kmfoda/booksum and licensed under the BSD-3-Clause license. Its task categories include summarization and text-to-text generation, with a dataset size ranging between 1K and 10K samples. The core objective of this dataset is to explicitly restrict the maximum output length, thereby preventing the generation of partial summaries.
提供机构:
pszemraj
原始信息汇总

数据集概述

数据集名称

  • 名称: booksum

数据集来源

  • 来源: kmfoda/booksum

许可证

  • 许可证: BSD-3-Clause

训练与评估配置

  • 配置: pszemraj--booksum_1024
  • 任务: 摘要生成
  • 任务ID: summarization
  • 评估分割: test
  • 列映射:
    • chapter: text
    • summary_text: target

任务类别

  • 摘要生成
  • 文本到文本生成

数据集大小

  • 大小范围: 1K<n<10K

目标

  • 目标: 明确限制最大输出长度,以防止生成不完整的摘要。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作