abbassix/ComNumPlus
收藏Hugging Face2024-01-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/abbassix/ComNumPlus
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: original
dtype: string
- name: label
dtype: int64
- name: char
dtype: string
- name: sci_10E
dtype: string
- name: sci_10E_char
dtype: string
- name: original_oom
dtype: string
- name: 2d
dtype: string
- name: 2d6
dtype: string
- name: 2d_oomv1
dtype: string
- name: 2d_oomv2
dtype: string
- name: pn6
dtype: string
- name: pn
dtype: string
- name: 2d_psn
dtype: string
splits:
- name: train
num_bytes: 53136731
num_examples: 80000
- name: test
num_bytes: 7489772
num_examples: 10000
- name: validation
num_bytes: 13280830
num_examples: 20000
download_size: 27430551
dataset_size: 73907333
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
- split: validation
path: data/validation-*
---
提供机构:
abbassix
原始信息汇总
数据集信息
特征
- original: 数据类型为字符串
- label: 数据类型为int64
- char: 数据类型为字符串
- sci_10E: 数据类型为字符串
- sci_10E_char: 数据类型为字符串
- original_oom: 数据类型为字符串
- 2d: 数据类型为字符串
- 2d6: 数据类型为字符串
- 2d_oomv1: 数据类型为字符串
- 2d_oomv2: 数据类型为字符串
- pn6: 数据类型为字符串
- pn: 数据类型为字符串
- 2d_psn: 数据类型为字符串
数据分割
- train: 字节数为53136731,样本数为80000
- test: 字节数为7489772,样本数为10000
- validation: 字节数为13280830,样本数为20000
数据大小
- 下载大小: 27430551字节
- 数据集大小: 73907333字节
配置
- config_name: default
- 数据文件:
- train: 路径为data/train-*
- test: 路径为data/test-*
- validation: 路径为data/validation-*
- 数据文件:



