pranjal01/Text-summarizer-dataset
收藏Hugging Face2023-10-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/pranjal01/Text-summarizer-dataset
下载链接
链接失效反馈官方服务:
资源简介:
---
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
dataset_info:
features:
- name: News
dtype: string
- name: Summary
dtype: string
- name: Title
dtype: string
splits:
- name: train
num_bytes: 1130675.7886497064
num_examples: 408
- name: test
num_bytes: 285440.21135029354
num_examples: 103
download_size: 887190
dataset_size: 1416116
license: apache-2.0
task_categories:
- text-generation
language:
- en
---
# Dataset Card for "Text-summarizer-dataset"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
---
数据集配置:
- 配置名称:default
数据文件:
- 拆分子集:训练集(train),文件路径:data/train-*
- 拆分子集:测试集(test),文件路径:data/test-*
数据集信息:
数据特征:
- 字段名:News,数据类型:字符串(string)
- 字段名:Summary,数据类型:字符串(string)
- 字段名:Title,数据类型:字符串(string)
数据拆分:
- 拆分名称:训练集(train),占用字节数:1130675.7886497064,样本数量:408
- 拆分名称:测试集(test),占用字节数:285440.21135029354,样本数量:103
下载总大小:887190
数据集总大小:1416116
许可证:Apache-2.0
任务类别:文本生成(text-generation)
语言:英语(en)
---
# “文本摘要数据集(Text-summarizer-dataset)”数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
pranjal01
原始信息汇总
数据集概述
数据集配置
- 配置名称: default
- 数据文件:
- 训练集 (train): data/train-*
- 测试集 (test): data/test-*
- 数据文件:
数据集信息
- 特征:
- News: 字符串类型
- Summary: 字符串类型
- Title: 字符串类型
- 数据分割:
- 训练集 (train):
- 字节数: 1130675.7886497064
- 样本数: 408
- 测试集 (test):
- 字节数: 285440.21135029354
- 样本数: 103
- 训练集 (train):
- 下载大小: 887190 字节
- 数据集大小: 1416116 字节
- 许可证: apache-2.0
- 任务类别:
- 文本生成
- 语言:
- 英语



