sanps/GutenbergFictionSummary
收藏Hugging Face2024-01-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/sanps/GutenbergFictionSummary
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含从gutenberg.org获取的带有小说标签且至少有25次下载的英文书籍文本,这些文本被分割成段落。原始数据集为sanps/GutenbergFiction,并使用cognitivecomputations/dolphin-2.6-mistral-7b模型进行了摘要处理。
该数据集包含从gutenberg.org获取的带有小说标签且至少有25次下载的英文书籍文本,这些文本被分割成段落。原始数据集为sanps/GutenbergFiction,并使用cognitivecomputations/dolphin-2.6-mistral-7b模型进行了摘要处理。
提供机构:
sanps
原始信息汇总
数据集概述
数据特征
- file_id: 字符串类型
- text_sub_id: 64位整数类型
- text: 字符串类型
- tokens: 64位整数类型
- generated_text: 字符串类型
数据划分
- train: 包含393,386个样本,总大小为1,845,974,229字节
数据集大小
- 下载大小: 1,156,726,889字节
- 数据集大小: 1,845,974,229字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
许可证
- license: MIT
语言
- language: 英语
数据集名称
- pretty_name: Gutenberg Fiction Books + Summaries
原始数据集
- Original dataset: sanps/GutenbergFiction
数据处理
- Summarization: cognitivecomputations/dolphin-2.6-mistral-7b
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



