Team-PIXEL/PIXELSum_hi_wiki_for_TA
收藏Hugging Face2024-01-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Team-PIXEL/PIXELSum_hi_wiki_for_TA
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含文本、目标和文本补丁数量三个主要特征。文本特征包括字节和路径,路径字段为空。目标字段为字符串类型,文本补丁数量为整数类型。数据集被划分为训练集,训练集包含449,818个示例,总大小为4,716,213,002字节。数据集的下载大小为4,483,128,555字节。
该数据集包含文本、目标和文本补丁数量三个主要特征。文本特征包括字节和路径,路径字段为空。目标字段为字符串类型,文本补丁数量为整数类型。数据集被划分为训练集,训练集包含449,818个示例,总大小为4,716,213,002字节。数据集的下载大小为4,483,128,555字节。
提供机构:
Team-PIXEL
原始信息汇总
数据集概述
许可证
- Apache 2.0
数据集信息
-
特征
- text
- bytes: 二进制类型
- path: 空类型
- target: 字符串类型
- num_text_patches: 64位整数类型
- text
-
拆分
- train
- 字节数: 4716213002
- 样本数: 449818
- train
数据大小
- 下载大小: 4483128555
- 数据集大小: 4716213002
配置
- default
- 数据文件
- train
- 路径: data/train-*
- train
- 数据文件



