taufiqdp/all-ds-merge
收藏Hugging Face2024-04-15 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/taufiqdp/all-ds-merge
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: text
dtype: string
splits:
- name: bug
num_bytes: 2431162
num_examples: 91989
- name: tet
num_bytes: 158964126
num_examples: 61536
- name: bjn
num_bytes: 228724518
num_examples: 3224113
- name: nia
num_bytes: 5438716
num_examples: 23247
- name: iba
num_bytes: 30771459
num_examples: 7638
- name: ban
num_bytes: 187115581
num_examples: 2371978
- name: ace
num_bytes: 350221696
num_examples: 5125521
- name: jv
num_bytes: 2956623097
num_examples: 32730253
- name: sxn
num_bytes: 1726275
num_examples: 197
- name: sda
num_bytes: 1672175
num_examples: 317
- name: ms
num_bytes: 508597890
num_examples: 7011280
- name: su
num_bytes: 2219105780
num_examples: 23905284
- name: bew
num_bytes: 8497952
num_examples: 2677
- name: mad
num_bytes: 2973647
num_examples: 509
- name: mrw
num_bytes: 280773
num_examples: 29
- name: mkn
num_bytes: 2658620
num_examples: 402
- name: min
num_bytes: 195617702
num_examples: 4813353
- name: map_bms
num_bytes: 4236776
num_examples: 83216
- name: gor
num_bytes: 6653764
num_examples: 124928
- name: mak
num_bytes: 3919184
num_examples: 555
download_size: 4489501662
dataset_size: 6876230893
configs:
- config_name: default
data_files:
- split: bug
path: data/bug-*
- split: tet
path: data/tet-*
- split: bjn
path: data/bjn-*
- split: nia
path: data/nia-*
- split: iba
path: data/iba-*
- split: ban
path: data/ban-*
- split: ace
path: data/ace-*
- split: jv
path: data/jv-*
- split: sxn
path: data/sxn-*
- split: sda
path: data/sda-*
- split: ms
path: data/ms-*
- split: su
path: data/su-*
- split: bew
path: data/bew-*
- split: mad
path: data/mad-*
- split: mrw
path: data/mrw-*
- split: mkn
path: data/mkn-*
- split: min
path: data/min-*
- split: map_bms
path: data/map_bms-*
- split: gor
path: data/gor-*
- split: mak
path: data/mak-*
---
数据集信息:
特征字段:
- 字段名:text,数据类型:字符串
划分集:
- 划分名称:bug,字节数:2431162,样本数:91989
- 划分名称:tet,字节数:158964126,样本数:61536
- 划分名称:bjn,字节数:228724518,样本数:3224113
- 划分名称:nia,字节数:5438716,样本数:23247
- 划分名称:iba,字节数:30771459,样本数:7638
- 划分名称:ban,字节数:187115581,样本数:2371978
- 划分名称:ace,字节数:350221696,样本数:5125521
- 划分名称:jv,字节数:2956623097,样本数:32730253
- 划分名称:sxn,字节数:1726275,样本数:197
- 划分名称:sda,字节数:1672175,样本数:317
- 划分名称:ms,字节数:508597890,样本数:7011280
- 划分名称:su,字节数:2219105780,样本数:23905284
- 划分名称:bew,字节数:8497952,样本数:2677
- 划分名称:mad,字节数:2973647,样本数:509
- 划分名称:mrw,字节数:280773,样本数:29
- 划分名称:mkn,字节数:2658620,样本数:402
- 划分名称:min,字节数:195617702,样本数:4813353
- 划分名称:map_bms,字节数:4236776,样本数:83216
- 划分名称:gor,字节数:6653764,样本数:124928
- 划分名称:mak,字节数:3919184,样本数:555
下载大小:4489501662
数据集总大小:6876230893
配置项:
- 配置名称:default
数据文件:
- 划分:bug,路径:data/bug-*
- 划分:tet,路径:data/tet-*
- 划分:bjn,路径:data/bjn-*
- 划分:nia,路径:data/nia-*
- 划分:iba,路径:data/iba-*
- 划分:ban,路径:data/ban-*
- 划分:ace,路径:data/ace-*
- 划分:jv,路径:data/jv-*
- 划分:sxn,路径:data/sxn-*
- 划分:sda,路径:data/sda-*
- 划分:ms,路径:data/ms-*
- 划分:su,路径:data/su-*
- 划分:bew,路径:data/bew-*
- 划分:mad,路径:data/mad-*
- 划分:mrw,路径:data/mrw-*
- 划分:mkn,路径:data/mkn-*
- 划分:min,路径:data/min-*
- 划分:map_bms,路径:data/map_bms-*
- 划分:gor,路径:data/gor-*
- 划分:mak,路径:data/mak-*
提供机构:
taufiqdp
原始信息汇总
数据集概述
数据集特征
- 名称: text
- 数据类型: string
数据集分割
- 名称: bug
- 字节数: 2431162
- 示例数: 91989
- 名称: tet
- 字节数: 158964126
- 示例数: 61536
- 名称: bjn
- 字节数: 228724518
- 示例数: 3224113
- 名称: nia
- 字节数: 5438716
- 示例数: 23247
- 名称: iba
- 字节数: 30771459
- 示例数: 7638
- 名称: ban
- 字节数: 187115581
- 示例数: 2371978
- 名称: ace
- 字节数: 350221696
- 示例数: 5125521
- 名称: jv
- 字节数: 2956623097
- 示例数: 32730253
- 名称: sxn
- 字节数: 1726275
- 示例数: 197
- 名称: sda
- 字节数: 1672175
- 示例数: 317
- 名称: ms
- 字节数: 508597890
- 示例数: 7011280
- 名称: su
- 字节数: 2219105780
- 示例数: 23905284
- 名称: bew
- 字节数: 8497952
- 示例数: 2677
- 名称: mad
- 字节数: 2973647
- 示例数: 509
- 名称: mrw
- 字节数: 280773
- 示例数: 29
- 名称: mkn
- 字节数: 2658620
- 示例数: 402
- 名称: min
- 字节数: 195617702
- 示例数: 4813353
- 名称: map_bms
- 字节数: 4236776
- 示例数: 83216
- 名称: gor
- 字节数: 6653764
- 示例数: 124928
- 名称: mak
- 字节数: 3919184
- 示例数: 555
数据集大小
- 下载大小: 4489501662
- 数据集大小: 6876230893



