five

BrianPaolo/merge_small_wed_v2

收藏
Hugging Face2024-07-17 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/BrianPaolo/merge_small_wed_v2
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个特征列,如分类类型、文件类型、银行名称、交易代码、解释、主要分类、次要分类、三级分类、三级ID、项目名称、项目描述、账户类型、状态、主要分类代码和ID等。数据集被分割为训练集、测试集和验证集,每个分割的大小和样本数量也被详细列出。

This dataset includes multiple feature columns such as Classification Type, File Type, Bank Name, Transaction Codes, Explanation, Primary Classification, Secondary Classification, Tertiary Classification, Tertiary ID, Item Name, Item Description, Account Type, State, Primary Classification Code, and ID. The dataset is divided into training, test, and validation sets, with the size and number of samples for each split detailed.
提供机构:
BrianPaolo
原始信息汇总

数据集概述

特征信息

  • Classification_Type: 字符串类型
  • File_Type: 字符串类型
  • Bank_Name: 字符串类型
  • Transaction_Codes: 字符串类型
  • Explanation: 字符串类型
  • Primary_Classification: 字符串类型
  • Secondary_Classification: 字符串类型
  • Tertiary_Classification: 字符串类型
  • Tertiary_ID: 浮点数类型
  • Item_Name: 字符串类型
  • Item_Description: 字符串类型
  • Account_Type: 字符串类型
  • State: 字符串类型
  • Primary_Classification_Code: 字符串类型
  • id: 整数类型

数据分割

  • 训练集 (train):
    • 样本数: 495
    • 字节数: 99792
  • 测试集 (test):
    • 样本数: 94
    • 字节数: 18794
  • 验证集 (validation):
    • 样本数: 90
    • 字节数: 18098

数据集大小

  • 下载大小: 65602 字节
  • 数据集总大小: 136684 字节

配置信息

  • 配置名称: default
    • 数据文件路径:
      • 训练集: data/train-*
      • 测试集: data/test-*
      • 验证集: data/validation-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作