BroDeadlines/TEST.NEW.PART_SUMMERIZE.raptor.edu_tdt_data
收藏Hugging Face2024-06-24 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/BroDeadlines/TEST.NEW.PART_SUMMERIZE.raptor.edu_tdt_data
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,如summaries、level、cluster、doc_ids、level_id、easy_shards和hard_shards。数据集被分割为TEST.medium_tdt_raptor、TEST.medium_tdt_raptor_vi和TEST.medium_tdt_proposition_raptor_vi,每个分割都有对应的字节数和示例数。数据集的下载大小为6714882字节,总大小为156478316字节。数据文件路径分别为data/TEST.medium_tdt_raptor-*、data/TEST.medium_tdt_raptor_vi-*和data/TEST.medium_tdt_proposition_raptor_vi-*。
The dataset includes multiple features such as summaries, level, cluster, doc_ids, level_id, easy_shards, and hard_shards. The dataset is split into TEST.medium_tdt_raptor, TEST.medium_tdt_raptor_vi, and TEST.medium_tdt_proposition_raptor_vi, each with corresponding byte sizes and example counts. The download size of the dataset is 6714882 bytes, and the total size is 156478316 bytes. The data file paths are data/TEST.medium_tdt_raptor-*, data/TEST.medium_tdt_raptor_vi-*, and data/TEST.medium_tdt_proposition_raptor_vi-*.
提供机构:
BroDeadlines
原始信息汇总
数据集概述
数据特征
- summaries: 字符串类型
- level: 64位整数类型
- cluster: 64位浮点数类型
- doc_ids: 字符串类型
- level_id: 字符串类型
- easy_shards: 64位整数类型
- hard_shards: 64位整数类型
数据分割
- TEST.medium_tdt_raptor:
- 字节数: 2,695,967
- 样本数: 332
- TEST.medium_tdt_raptor_vi:
- 字节数: 1,579,823
- 样本数: 277
- TEST.medium_tdt_proposition_raptor_vi:
- 字节数: 152,202,526
- 样本数: 278
数据集大小
- 下载大小: 6,714,882 字节
- 数据集总大小: 156,478,316 字节
配置
- 配置名称: default
- 数据文件路径:
- TEST.medium_tdt_raptor: data/TEST.medium_tdt_raptor-*
- TEST.medium_tdt_raptor_vi: data/TEST.medium_tdt_raptor_vi-*
- TEST.medium_tdt_proposition_raptor_vi: data/TEST.medium_tdt_proposition_raptor_vi-*
- 数据文件路径:



