five

BroDeadlines/TEST.NEW.PART_SUMMERIZE.raptor.edu_tdt_data

收藏
Hugging Face2024-06-24 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/BroDeadlines/TEST.NEW.PART_SUMMERIZE.raptor.edu_tdt_data
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个特征,如summaries、level、cluster、doc_ids、level_id、easy_shards和hard_shards。数据集被分割为TEST.medium_tdt_raptor、TEST.medium_tdt_raptor_vi和TEST.medium_tdt_proposition_raptor_vi,每个分割都有对应的字节数和示例数。数据集的下载大小为6714882字节,总大小为156478316字节。数据文件路径分别为data/TEST.medium_tdt_raptor-*、data/TEST.medium_tdt_raptor_vi-*和data/TEST.medium_tdt_proposition_raptor_vi-*。

The dataset includes multiple features such as summaries, level, cluster, doc_ids, level_id, easy_shards, and hard_shards. The dataset is split into TEST.medium_tdt_raptor, TEST.medium_tdt_raptor_vi, and TEST.medium_tdt_proposition_raptor_vi, each with corresponding byte sizes and example counts. The download size of the dataset is 6714882 bytes, and the total size is 156478316 bytes. The data file paths are data/TEST.medium_tdt_raptor-*, data/TEST.medium_tdt_raptor_vi-*, and data/TEST.medium_tdt_proposition_raptor_vi-*.
提供机构:
BroDeadlines
原始信息汇总

数据集概述

数据特征

  • summaries: 字符串类型
  • level: 64位整数类型
  • cluster: 64位浮点数类型
  • doc_ids: 字符串类型
  • level_id: 字符串类型
  • easy_shards: 64位整数类型
  • hard_shards: 64位整数类型

数据分割

  • TEST.medium_tdt_raptor:
    • 字节数: 2,695,967
    • 样本数: 332
  • TEST.medium_tdt_raptor_vi:
    • 字节数: 1,579,823
    • 样本数: 277
  • TEST.medium_tdt_proposition_raptor_vi:
    • 字节数: 152,202,526
    • 样本数: 278

数据集大小

  • 下载大小: 6,714,882 字节
  • 数据集总大小: 156,478,316 字节

配置

  • 配置名称: default
    • 数据文件路径:
      • TEST.medium_tdt_raptor: data/TEST.medium_tdt_raptor-*
      • TEST.medium_tdt_raptor_vi: data/TEST.medium_tdt_raptor_vi-*
      • TEST.medium_tdt_proposition_raptor_vi: data/TEST.medium_tdt_proposition_raptor_vi-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作