five

taufiqdp/all-ds-merge

收藏
Hugging Face2024-04-15 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/taufiqdp/all-ds-merge
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: text dtype: string splits: - name: bug num_bytes: 2431162 num_examples: 91989 - name: tet num_bytes: 158964126 num_examples: 61536 - name: bjn num_bytes: 228724518 num_examples: 3224113 - name: nia num_bytes: 5438716 num_examples: 23247 - name: iba num_bytes: 30771459 num_examples: 7638 - name: ban num_bytes: 187115581 num_examples: 2371978 - name: ace num_bytes: 350221696 num_examples: 5125521 - name: jv num_bytes: 2956623097 num_examples: 32730253 - name: sxn num_bytes: 1726275 num_examples: 197 - name: sda num_bytes: 1672175 num_examples: 317 - name: ms num_bytes: 508597890 num_examples: 7011280 - name: su num_bytes: 2219105780 num_examples: 23905284 - name: bew num_bytes: 8497952 num_examples: 2677 - name: mad num_bytes: 2973647 num_examples: 509 - name: mrw num_bytes: 280773 num_examples: 29 - name: mkn num_bytes: 2658620 num_examples: 402 - name: min num_bytes: 195617702 num_examples: 4813353 - name: map_bms num_bytes: 4236776 num_examples: 83216 - name: gor num_bytes: 6653764 num_examples: 124928 - name: mak num_bytes: 3919184 num_examples: 555 download_size: 4489501662 dataset_size: 6876230893 configs: - config_name: default data_files: - split: bug path: data/bug-* - split: tet path: data/tet-* - split: bjn path: data/bjn-* - split: nia path: data/nia-* - split: iba path: data/iba-* - split: ban path: data/ban-* - split: ace path: data/ace-* - split: jv path: data/jv-* - split: sxn path: data/sxn-* - split: sda path: data/sda-* - split: ms path: data/ms-* - split: su path: data/su-* - split: bew path: data/bew-* - split: mad path: data/mad-* - split: mrw path: data/mrw-* - split: mkn path: data/mkn-* - split: min path: data/min-* - split: map_bms path: data/map_bms-* - split: gor path: data/gor-* - split: mak path: data/mak-* ---

数据集信息: 特征字段: - 字段名:text,数据类型:字符串 划分集: - 划分名称:bug,字节数:2431162,样本数:91989 - 划分名称:tet,字节数:158964126,样本数:61536 - 划分名称:bjn,字节数:228724518,样本数:3224113 - 划分名称:nia,字节数:5438716,样本数:23247 - 划分名称:iba,字节数:30771459,样本数:7638 - 划分名称:ban,字节数:187115581,样本数:2371978 - 划分名称:ace,字节数:350221696,样本数:5125521 - 划分名称:jv,字节数:2956623097,样本数:32730253 - 划分名称:sxn,字节数:1726275,样本数:197 - 划分名称:sda,字节数:1672175,样本数:317 - 划分名称:ms,字节数:508597890,样本数:7011280 - 划分名称:su,字节数:2219105780,样本数:23905284 - 划分名称:bew,字节数:8497952,样本数:2677 - 划分名称:mad,字节数:2973647,样本数:509 - 划分名称:mrw,字节数:280773,样本数:29 - 划分名称:mkn,字节数:2658620,样本数:402 - 划分名称:min,字节数:195617702,样本数:4813353 - 划分名称:map_bms,字节数:4236776,样本数:83216 - 划分名称:gor,字节数:6653764,样本数:124928 - 划分名称:mak,字节数:3919184,样本数:555 下载大小:4489501662 数据集总大小:6876230893 配置项: - 配置名称:default 数据文件: - 划分:bug,路径:data/bug-* - 划分:tet,路径:data/tet-* - 划分:bjn,路径:data/bjn-* - 划分:nia,路径:data/nia-* - 划分:iba,路径:data/iba-* - 划分:ban,路径:data/ban-* - 划分:ace,路径:data/ace-* - 划分:jv,路径:data/jv-* - 划分:sxn,路径:data/sxn-* - 划分:sda,路径:data/sda-* - 划分:ms,路径:data/ms-* - 划分:su,路径:data/su-* - 划分:bew,路径:data/bew-* - 划分:mad,路径:data/mad-* - 划分:mrw,路径:data/mrw-* - 划分:mkn,路径:data/mkn-* - 划分:min,路径:data/min-* - 划分:map_bms,路径:data/map_bms-* - 划分:gor,路径:data/gor-* - 划分:mak,路径:data/mak-*
提供机构:
taufiqdp
原始信息汇总

数据集概述

数据集特征

  • 名称: text
  • 数据类型: string

数据集分割

  • 名称: bug
    • 字节数: 2431162
    • 示例数: 91989
  • 名称: tet
    • 字节数: 158964126
    • 示例数: 61536
  • 名称: bjn
    • 字节数: 228724518
    • 示例数: 3224113
  • 名称: nia
    • 字节数: 5438716
    • 示例数: 23247
  • 名称: iba
    • 字节数: 30771459
    • 示例数: 7638
  • 名称: ban
    • 字节数: 187115581
    • 示例数: 2371978
  • 名称: ace
    • 字节数: 350221696
    • 示例数: 5125521
  • 名称: jv
    • 字节数: 2956623097
    • 示例数: 32730253
  • 名称: sxn
    • 字节数: 1726275
    • 示例数: 197
  • 名称: sda
    • 字节数: 1672175
    • 示例数: 317
  • 名称: ms
    • 字节数: 508597890
    • 示例数: 7011280
  • 名称: su
    • 字节数: 2219105780
    • 示例数: 23905284
  • 名称: bew
    • 字节数: 8497952
    • 示例数: 2677
  • 名称: mad
    • 字节数: 2973647
    • 示例数: 509
  • 名称: mrw
    • 字节数: 280773
    • 示例数: 29
  • 名称: mkn
    • 字节数: 2658620
    • 示例数: 402
  • 名称: min
    • 字节数: 195617702
    • 示例数: 4813353
  • 名称: map_bms
    • 字节数: 4236776
    • 示例数: 83216
  • 名称: gor
    • 字节数: 6653764
    • 示例数: 124928
  • 名称: mak
    • 字节数: 3919184
    • 示例数: 555

数据集大小

  • 下载大小: 4489501662
  • 数据集大小: 6876230893
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作