five

kristmh/high_vs_random

收藏
Hugging Face2023-12-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/kristmh/high_vs_random
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含三个配置文件:default。每个配置文件包含三个数据文件:test、train和validate。数据集的特征包括:Unnamed: 0(int64类型)、text_clean(string类型)、labels(int64类型)和__index_level_0__(int64类型)。每个分割的数据量和样本数量也被提供。数据集的总下载大小和数据集大小也已知。

The dataset includes three configurations: default. Each configuration contains three data files: test, train, and validate. The dataset features include: Unnamed: 0 (int64 type), text_clean (string type), labels (int64 type), and __index_level_0__ (int64 type). The data size and number of examples for each split are also provided. The total download size and dataset size are known.
提供机构:
kristmh
原始信息汇总

数据集概述

配置信息

  • 默认配置
    • 数据文件
      • 测试集:路径为 data/test-*
      • 训练集:路径为 data/train-*
      • 验证集:路径为 data/validate-*

数据集信息

  • 特征

    • 名称Unnamed: 0,数据类型:int64
    • 名称text_clean,数据类型:string
    • 名称labels,数据类型:int64
    • 名称__index_level_0__,数据类型:int64
  • 分割

    • 测试集
      • 字节数:35090618
      • 样本数:42053
    • 训练集
      • 字节数:284101969
      • 样本数:336420
    • 验证集
      • 字节数:36222999
      • 样本数:42052
  • 下载大小:175883924

  • 数据集大小:355415586

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作