five

thienhtt20/balanced_dataset

收藏
Hugging Face2024-07-17 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/thienhtt20/balanced_dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个特征,包括id、label、claim、document、input_ids、attention_mask和__index_level_0__。数据集分为训练集和测试集,训练集包含153144个样本,测试集包含38287个样本。数据集的下载大小为166569373字节,总大小为450796779.0字节。

The dataset contains multiple features including id, label, claim, document, input_ids, attention_mask, and __index_level_0__. The dataset is divided into a training set and a test set, with 153144 and 38287 samples respectively. The download size of the dataset is 166569373 bytes, and the total size is 450796779.0 bytes.
提供机构:
thienhtt20
原始信息汇总

数据集概述

基本信息

关键词

  • 100K - 1M
  • parquet
  • Tabular
  • Text
  • Datasets
  • pandas
  • Croissant
  • 🇺🇸 Region: US

数据集结构

  • 分布:

  • 记录集:

    • 类型: cr:RecordSet

    • 名称: default

    • 描述: thienhtt20/balanced_dataset - default 子集

      • 2 个分割: train, test
      • 2 个跳过的列: input_ids, attention_mask
    • 字段:

      • 类型: cr:Field

      • 名称: default/id

      • 描述: HF Mirror parquet 文件中的 id 列。

      • 数据类型: sc:Integer

      • 来源:

        • 文件集: parquet-files-for-config-default
        • 提取:
          • : id
      • 类型: cr:Field

      • 名称: default/label

      • 描述: HF Mirror parquet 文件中的 label 列。

      • 数据类型: sc:Integer

      • 来源:

        • 文件集: parquet-files-for-config-default
        • 提取:
          • : label
      • 类型: cr:Field

      • 名称: default/claim

      • 描述: HF Mirror parquet 文件中的 claim 列。

      • 数据类型: sc:Text

      • 来源:

        • 文件集: parquet-files-for-config-default
        • 提取:
          • : claim
      • 类型: cr:Field

      • 名称: default/document

      • 描述: HF Mirror parquet 文件中的 document 列。

      • 数据类型: sc:Text

      • 来源:

        • 文件集: parquet-files-for-config-default
        • 提取:
          • : document
      • 类型: cr:Field

      • 名称: default/index_level_0

      • 描述: HF Mirror parquet 文件中的 index_level_0 列。

      • 数据类型: sc:Integer

      • 来源:

        • 文件集: parquet-files-for-config-default
        • 提取:
          • : index_level_0

符合标准

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作