patrikgerard/combined_uk_ru_dataset
收藏Hugging Face2024-07-12 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/patrikgerard/combined_uk_ru_dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含19222个训练样本,每个样本具有唯一标识符(unique_id)、输入文本(input)、分类标签(classification)和原始数据集来源(original_dataset)四个特征字段。数据集总大小为19512233字节,下载大小为8874858字节。数据集的训练分割存储在路径为data/train-*的文件中。
This dataset contains 19222 training samples, each with four feature fields: unique identifier (unique_id), input text (input), classification label (classification), and original dataset source (original_dataset). The total size of the dataset is 19512233 bytes, with a download size of 8874858 bytes. The training split of the dataset is stored in files with the path data/train-*.
提供机构:
patrikgerard
原始信息汇总
数据集概述
数据集信息
-
特征:
unique_id: 数据类型为stringinput: 数据类型为stringclassification: 数据类型为stringoriginal_dataset: 数据类型为string
-
分割:
train:- 字节数: 19512233
- 样本数: 19222
-
下载大小: 8874858 字节
-
数据集大小: 19512233 字节
配置
- 配置名称:
default- 数据文件:
train: 路径为data/train-*
- 数据文件:



