gigant/arxiv_summarization
收藏Hugging Face2024-05-02 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/gigant/arxiv_summarization
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: article
dtype: string
- name: abstract
dtype: string
- name: id
dtype: string
splits:
- name: train
num_bytes: 7204556062
num_examples: 203037
- name: validation
num_bytes: 218891000
num_examples: 6436
- name: test
num_bytes: 219294367
num_examples: 6440
download_size: 1367106572
dataset_size: 7642741429
---
# Dataset Card for "arxiv_summarization"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
# 数据集信息
## 特征
- 特征名:article(学术文章),数据类型:字符串
- 特征名:abstract(摘要),数据类型:字符串
- 特征名:id(样本ID),数据类型:字符串
## 数据集划分
- 划分名称:训练集(train),字节数:7204556062,样本数量:203037
- 划分名称:验证集(validation),字节数:218891000,样本数量:6436
- 划分名称:测试集(test),字节数:219294367,样本数量:6440
下载大小:1367106572,数据集总大小:7642741429
---
# 「arxiv_summarization」数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
gigant
原始信息汇总
数据集概述
数据集名称
- 名称: arxiv_summarization
数据集特征
- 特征1: article
- 数据类型: string
- 特征2: abstract
- 数据类型: string
- 特征3: id
- 数据类型: string
数据集划分
- 训练集
- 示例数量: 203037
- 数据大小: 7204556062 字节
- 验证集
- 示例数量: 6436
- 数据大小: 218891000 字节
- 测试集
- 示例数量: 6440
- 数据大小: 219294367 字节
数据集大小
- 下载大小: 1367106572 字节
- 总数据大小: 7642741429 字节



