lalok/gyeongsan_address_ko_8k_tensor
收藏Hugging Face2024-07-17 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/lalok/gyeongsan_address_ko_8k_tensor
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含输入特征和标签两个主要字段。输入特征是一个浮点数序列,标签是一个整数序列。数据集分为训练集、测试集和验证集,分别包含710600、88826和88825个样本。训练集的大小为682538501664字节,测试集为85318258584字节,验证集为85317320976字节。总下载大小为141053449505字节,数据集总大小为853174081224字节。数据文件路径分别为data/train-*、data/test-*和data/valid-*。
The dataset contains two main fields: input features and labels. The input features are a sequence of float32 values, and the labels are a sequence of int64 values. The dataset is divided into training, test, and validation sets, containing 710600, 88826, and 88825 samples respectively. The training set size is 682538501664 bytes, the test set is 85318258584 bytes, and the validation set is 85317320976 bytes. The total download size is 141053449505 bytes, and the total dataset size is 853174081224 bytes. The data file paths are data/train-*, data/test-*, and data/valid-*.
提供机构:
lalok
原始信息汇总
数据集概述
数据集特征
- input_features: 序列类型,数据类型为float32。
- labels: 序列类型,数据类型为int64。
数据集划分
- train: 包含710600个样本,占用682538501664字节。
- test: 包含88826个样本,占用85318258584字节。
- valid: 包含88825个样本,占用85317320976字节。
数据集大小
- 下载大小: 141053449505字节。
- 总数据集大小: 853174081224字节。
配置信息
- config_name: default
- data_files:
- train: 路径为
data/train-*。 - test: 路径为
data/test-*。 - valid: 路径为
data/valid-*。
- train: 路径为
- data_files:



