atulxop/LenStackedArXivSumm
收藏Hugging Face2024-02-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/atulxop/LenStackedArXivSumm
下载链接
链接失效反馈官方服务:
资源简介:
---
license: apache-2.0
dataset_info:
features:
- name: text
dtype: string
- name: summary
dtype: string
splits:
- name: train
num_bytes: 13958356.96885592
num_examples: 11258
- name: test
num_bytes: 1939142.8583487882
num_examples: 1564
- name: validation
num_bytes: 3490209.1727952934
num_examples: 2815
download_size: 10951439
dataset_size: 19387709.0
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
- split: validation
path: data/validation-*
---
许可证:Apache 2.0许可证
数据集信息(dataset_info):
特征(features):
- 字段名:text(文本),数据类型:string(字符串)
- 字段名:summary(摘要),数据类型:string(字符串)
数据拆分(splits):
- 拆分名称:train(训练集),字节占用量:13958356.96885592,样本数量:11258
- 拆分名称:test(测试集),字节占用量:1939142.8583487882,样本数量:1564
- 拆分名称:validation(验证集),字节占用量:3490209.1727952934,样本数量:2815
下载大小:10951439,数据集总大小:19387709.0
配置项(configs):
- 配置名称:default(默认配置),数据文件:
- 拆分:train(训练集),文件路径:data/train-*
- 拆分:test(测试集),文件路径:data/test-*
- 拆分:validation(验证集),文件路径:data/validation-*
提供机构:
atulxop
原始信息汇总
数据集概述
许可证
- Apache 2.0
数据集信息
特征
- text: 数据类型为字符串
- summary: 数据类型为字符串
数据分割
- train:
- 字节数: 13958356.96885592
- 样本数: 11258
- test:
- 字节数: 1939142.8583487882
- 样本数: 1564
- validation:
- 字节数: 3490209.1727952934
- 样本数: 2815
数据大小
- 下载大小: 10951439 字节
- 数据集大小: 19387709.0 字节
配置
- default:
- 数据文件路径:
- train: data/train-*
- test: data/test-*
- validation: data/validation-*
- 数据文件路径:



