patrikgerard/combined_uk_ru_dataset_v4
收藏Hugging Face2024-07-12 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/patrikgerard/combined_uk_ru_dataset_v4
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,包括唯一标识符(unique_id)、输入内容(input)、分类标签(classification)、原始数据集来源(original_dataset)以及索引级别(__index_level_0__)。数据集分为训练集和测试集,训练集包含15570个样本,测试集包含1730个样本。数据集的下载大小为8385626字节,总大小为17699020字节。数据文件路径分别为data/train-*和data/test-*。
The dataset includes several features: unique_id, input, classification, original_dataset, and __index_level_0__. It is divided into a training set with 15,570 samples and a test set with 1,730 samples. The download size of the dataset is 8,385,626 bytes, and the total size is 17,699,020 bytes. The data files are located at data/train-* and data/test-*.
提供机构:
patrikgerard
原始信息汇总
数据集概述
数据集信息
特征
- unique_id: 数据类型为
string - input: 数据类型为
string - classification: 数据类型为
string - original_dataset: 数据类型为
string - index_level_0: 数据类型为
int64
数据分割
- train:
- 字节数: 15941730
- 样本数: 15570
- test:
- 字节数: 1757290
- 样本数: 1730
数据集大小
- 下载大小: 8385626 字节
- 数据集总大小: 17699020 字节
配置
- config_name: default
- data_files:
- train: 路径为
data/train-* - test: 路径为
data/test-*
- train: 路径为
- data_files:



