five

Saibo-creator/mutated_dyck3

收藏
Hugging Face2024-05-18 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Saibo-creator/mutated_dyck3
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: string dtype: string - name: max_depths struct: - name: () dtype: int64 - name: '[]' dtype: int64 - name: '{}' dtype: int64 - name: longest_dependency dtype: int64 - name: valid dtype: bool - name: modification_place dtype: int64 - name: modification_type dtype: string - name: modification_origin_symbol dtype: string - name: modification_new_symbol dtype: string - name: id dtype: int64 splits: - name: train num_bytes: 24881943 num_examples: 100000 - name: test num_bytes: 2481307 num_examples: 10000 - name: validation num_bytes: 2481307 num_examples: 10000 download_size: 5017278 dataset_size: 29844557 configs: - config_name: default data_files: - split: train path: data/train-* - split: test path: data/test-* - split: validation path: data/validation-* ---

数据集信息: 特征: - 字段:name,数据类型:string - 字段:max_depths,为结构体类型,包含以下子字段: - 子字段:(),数据类型:int64 - 子字段:[],数据类型:int64 - 子字段:{},数据类型:int64 - 字段:longest_dependency,数据类型:int64 - 字段:valid,数据类型:bool - 字段:modification_place,数据类型:int64 - 字段:modification_type,数据类型:string - 字段:modification_origin_symbol,数据类型:string - 字段:modification_new_symbol,数据类型:string - 字段:id,数据类型:int64 数据拆分: - 拆分名称:train,占用字节数:24881943,样本量:100000 - 拆分名称:test,占用字节数:2481307,样本量:10000 - 拆分名称:validation,占用字节数:2481307,样本量:10000 下载大小:5017278,总数据集占用大小:29844557 配置: - 配置名称:default,数据文件路径: - 拆分train:data/train-* - 拆分test:data/test-* - 拆分validation:data/validation-*
提供机构:
Saibo-creator
原始信息汇总

数据集概述

数据集特征

  • name (字符串)
  • max_depths (结构化数据)
    • () (整数64位)
    • [] (整数64位)
    • {} (整数64位)
  • longest_dependency (整数64位)
  • valid (布尔值)
  • modification_place (整数64位)
  • modification_type (字符串)
  • modification_origin_symbol (字符串)
  • modification_new_symbol (字符串)
  • id (整数64位)

数据集分割

  • train
    • 数据量: 24881943 字节
    • 示例数: 100000
  • test
    • 数据量: 2481307 字节
    • 示例数: 10000
  • validation
    • 数据量: 2481307 字节
    • 示例数: 10000

数据集大小

  • 下载大小: 5017278 字节
  • 数据集大小: 29844557 字节

配置文件

  • config_name: default
    • train: data/train-*
    • test: data/test-*
    • validation: data/validation-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作