five

Team-PIXEL/PIXELSum_uk_wiki_for_TA

收藏
Hugging Face2024-01-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Team-PIXEL/PIXELSum_uk_wiki_for_TA
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: apache-2.0 dataset_info: features: - name: text struct: - name: bytes dtype: binary - name: path dtype: 'null' - name: target dtype: string - name: num_text_patches dtype: int64 splits: - name: train num_bytes: 40401004873 num_examples: 3968117 download_size: 38963135270 dataset_size: 40401004873 configs: - config_name: default data_files: - split: train path: data/train-* ---

许可证:Apache-2.0 数据集信息: 特征: - 名称:text,为结构体,包含以下子字段: - 子字段名:bytes,数据类型(dtype):二进制(binary) - 子字段名:path,数据类型:空值(null) - 名称:target,数据类型:字符串 - 名称:num_text_patches,数据类型:64位整型 数据集划分: - 名称:train,总字节数:40401004873,样本数量:3968117 下载大小:38963135270 数据集总大小:40401004873 配置项: - 配置名称:默认,数据文件: - 数据集划分:train,路径:data/train-*
提供机构:
Team-PIXEL
原始信息汇总

数据集概述

许可证

  • Apache 2.0

数据集信息

  • 特征

    • text
      • bytes: 二进制数据类型
      • path: 空值数据类型
    • target: 字符串数据类型
    • num_text_patches: 64位整数数据类型
  • 分割

    • train
      • 字节数: 40401004873
      • 样本数: 3968117

数据大小

  • 下载大小: 38963135270
  • 数据集大小: 40401004873

配置

  • default
    • 数据文件:
      • 分割: train
      • 路径: data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作