minoruskore/numbers
收藏Hugging Face2023-09-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/minoruskore/numbers
下载链接
链接失效反馈官方服务:
资源简介:
---
license: other
configs:
- config_name: default
data_files:
- split: train1kk
path: data/train1kk-*
- split: test1kk
path: data/test1kk-*
- split: train10kk
path: data/train10kk-*
- split: test10kk
path: data/test10kk-*
- split: train100k
path: data/train100k-*
- split: test100k
path: data/test100k-*
dataset_info:
features:
- name: number
dtype: int64
- name: text
dtype: string
splits:
- name: train1kk
num_bytes: 51110729
num_examples: 800000
- name: test1kk
num_bytes: 12780276
num_examples: 200000
- name: train10kk
num_bytes: 604734899
num_examples: 8000000
- name: test10kk
num_bytes: 151175106
num_examples: 2000000
- name: train100k
num_bytes: 4170428
num_examples: 80000
- name: test100k
num_bytes: 1040577
num_examples: 20000
download_size: 193519290
dataset_size: 825012015
---
提供机构:
minoruskore
原始信息汇总
数据集概述
许可证
- 许可证类型:其他
配置
- 默认配置
- 数据文件路径:
- 训练集(train1kk):
data/train1kk-* - 测试集(test1kk):
data/test1kk-* - 训练集(train10kk):
data/train10kk-* - 测试集(test10kk):
data/test10kk-* - 训练集(train100k):
data/train100k-* - 测试集(test100k):
data/test100k-*
- 训练集(train1kk):
- 数据文件路径:
数据集信息
-
特征:
- 名称:number
- 数据类型:int64
- 名称:text
- 数据类型:string
- 名称:number
-
数据分割:
- 训练集(train1kk)
- 字节数:51110729
- 样本数:800000
- 测试集(test1kk)
- 字节数:12780276
- 样本数:200000
- 训练集(train10kk)
- 字节数:604734899
- 样本数:8000000
- 测试集(test10kk)
- 字节数:151175106
- 样本数:2000000
- 训练集(train100k)
- 字节数:4170428
- 样本数:80000
- 测试集(test100k)
- 字节数:1040577
- 样本数:20000
- 训练集(train1kk)
-
数据集大小:
- 下载大小:193519290 字节
- 数据集大小:825012015 字节



