BrianPaolo/invoice_testing_12
收藏Hugging Face2024-07-12 更新2024-07-13 收录
下载链接:
https://hf-mirror.com/datasets/BrianPaolo/invoice_testing_12
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,包括文件类型、主要分类、次要分类、三级ID、三级分类、项目名称和项目描述。数据集被分为训练集、测试集和验证集,每个部分都有相应的字节数和示例数。数据集的下载大小为60601字节,实际大小为132339字节。
The dataset includes multiple features such as File Type, Primary Classification, Secondary Classification, Tertiary ID, Tertiary Classification, Item Name, and Item Description. The dataset is divided into train, test, and validation splits, each with specified byte sizes and example counts. The download size of the dataset is 60601 bytes, and the actual size is 132339 bytes.
提供机构:
BrianPaolo
原始信息汇总
数据集概述
特征信息
- File_Type: 文件类型,数据类型为字符串。
- Primary_Classification: 主要分类,数据类型为字符串。
- Secondary_Classification: 次要分类,数据类型为字符串。
- Tertiary_ID: 三级ID,数据类型为整数(int64)。
- Tertiary_Classification: 三级分类,数据类型为字符串。
- Item_Name: 项目名称,数据类型为字符串。
- Item_Description: 项目描述,数据类型为字符串。
数据分割
- train: 训练集,包含520个样本,大小为91444字节。
- test: 测试集,包含117个样本,大小为20843字节。
- validation: 验证集,包含115个样本,大小为20052字节。
数据集大小
- 下载大小: 60601字节。
- 数据集总大小: 132339字节。
配置信息
- default: 默认配置
- train: 数据路径为
data/train-*。 - test: 数据路径为
data/test-*。 - validation: 数据路径为
data/validation-*。
- train: 数据路径为
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



