five

sanps/GutenbergFictionSummary

收藏
Hugging Face2024-01-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/sanps/GutenbergFictionSummary
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含从gutenberg.org获取的带有小说标签且至少有25次下载的英文书籍文本,这些文本被分割成段落。原始数据集为sanps/GutenbergFiction,并使用cognitivecomputations/dolphin-2.6-mistral-7b模型进行了摘要处理。

该数据集包含从gutenberg.org获取的带有小说标签且至少有25次下载的英文书籍文本,这些文本被分割成段落。原始数据集为sanps/GutenbergFiction,并使用cognitivecomputations/dolphin-2.6-mistral-7b模型进行了摘要处理。
提供机构:
sanps
原始信息汇总

数据集概述

数据特征

  • file_id: 字符串类型
  • text_sub_id: 64位整数类型
  • text: 字符串类型
  • tokens: 64位整数类型
  • generated_text: 字符串类型

数据划分

  • train: 包含393,386个样本,总大小为1,845,974,229字节

数据集大小

  • 下载大小: 1,156,726,889字节
  • 数据集大小: 1,845,974,229字节

配置

  • config_name: default
  • data_files:
    • split: train
    • path: data/train-*

许可证

  • license: MIT

语言

  • language: 英语

数据集名称

  • pretty_name: Gutenberg Fiction Books + Summaries

原始数据集

  • Original dataset: sanps/GutenbergFiction

数据处理

  • Summarization: cognitivecomputations/dolphin-2.6-mistral-7b
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作