CohleM/CNN_small
收藏Hugging Face2023-04-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CohleM/CNN_small
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: article
dtype: string
- name: highlights
dtype: string
- name: id
dtype: string
splits:
- name: train
num_bytes: 161497336.8
num_examples: 40000
- name: test
num_bytes: 40374334.2
num_examples: 10000
download_size: 128544758
dataset_size: 201871671.0
---
# Dataset Card for "CNN_small"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
---
数据集信息(dataset_info):
特征:
- 名称:文章(article),数据类型:字符串(string)
- 名称:摘要要点(highlights),数据类型:字符串(string)
- 名称:编号(id),数据类型:字符串(string)
数据划分:
- 名称:训练集(train),字节占用量:161497336.8,样本数:40000
- 名称:测试集(test),字节占用量:40374334.2,样本数:10000
下载大小:128544758
数据集总大小:201871671.0
---
# “CNN_small”数据集卡片(Dataset Card)
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
CohleM
原始信息汇总
数据集概述
数据集名称
CNN_small
数据集特征
- article:数据类型为字符串。
- highlights:数据类型为字符串。
- id:数据类型为字符串。
数据集划分
- 训练集 (train):包含40000个样本,总大小为161497336.8字节。
- 测试集 (test):包含10000个样本,总大小为40374334.2字节。
数据集大小
- 下载大小:128544758字节。
- 数据集总大小:201871671.0字节。



