five

patrikgerard/combined_uk_ru_dataset_v4

收藏
Hugging Face2024-07-12 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/patrikgerard/combined_uk_ru_dataset_v4
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个特征,包括唯一标识符(unique_id)、输入内容(input)、分类标签(classification)、原始数据集来源(original_dataset)以及索引级别(__index_level_0__)。数据集分为训练集和测试集,训练集包含15570个样本,测试集包含1730个样本。数据集的下载大小为8385626字节,总大小为17699020字节。数据文件路径分别为data/train-*和data/test-*。

The dataset includes several features: unique_id, input, classification, original_dataset, and __index_level_0__. It is divided into a training set with 15,570 samples and a test set with 1,730 samples. The download size of the dataset is 8,385,626 bytes, and the total size is 17,699,020 bytes. The data files are located at data/train-* and data/test-*.
提供机构:
patrikgerard
原始信息汇总

数据集概述

数据集信息

特征

  • unique_id: 数据类型为 string
  • input: 数据类型为 string
  • classification: 数据类型为 string
  • original_dataset: 数据类型为 string
  • index_level_0: 数据类型为 int64

数据分割

  • train:
    • 字节数: 15941730
    • 样本数: 15570
  • test:
    • 字节数: 1757290
    • 样本数: 1730

数据集大小

  • 下载大小: 8385626 字节
  • 数据集总大小: 17699020 字节

配置

  • config_name: default
    • data_files:
      • train: 路径为 data/train-*
      • test: 路径为 data/test-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作