five

Kanzoet97/Katro

收藏
Hugging Face2025-12-13 更新2025-12-20 收录
下载链接:
https://hf-mirror.com/datasets/Kanzoet97/Katro
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含500个经过注释和处理的发票文档,用于Donut ML模型的微调。注释和数据准备任务由Katana ML团队完成。数据集包含三个分割:训练集(425个样本)、测试集(26个样本)和验证集(50个样本)。数据集的特征包括图像和真实标签(ground_truth),任务类别为特征提取,语言为英语,许可证为MIT。原始数据集信息来源于Mendeley Data。

This dataset contains 500 invoice documents annotated and processed to be ready for Donut ML model fine-tuning. Annotation and data preparation task was done by Katana ML team. The dataset includes three splits: train (425 examples), test (26 examples), and validation (50 examples). The features of the dataset include image and ground_truth, the task category is feature-extraction, the language is English, and the license is MIT. Original dataset info is from Mendeley Data.
提供机构:
Kanzoet97
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作