OCR智能记账提取账单数据集
收藏魔搭社区2025-12-01 更新2025-05-31 收录
下载链接:
https://modelscope.cn/datasets/JasonWJC/SmartBookkeeping_OCRExtracts
下载链接
链接失效反馈官方服务:
资源简介:
## 概述 \n 该数据集旨在帮助大型语言模型(如Qwen系列)进行智能记账任务的微调。数据来源于日常消费账单的OCR识别结果,目标是从OCR文本中准确提取关键的账单信息。
## Overview
This dataset is designed to assist the fine-tuning of large language models (e.g., the Qwen series) for intelligent bookkeeping tasks. The data is sourced from OCR recognition results of daily consumption bills, with the goal of accurately extracting key billing information from OCR text.
提供机构:
maas
创建时间:
2025-05-25
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集旨在微调大语言模型,使其能够从日常消费账单的OCR识别文本中,自动提取金额、交易时间、商品说明等关键结构化信息。数据采用JSONL格式,模拟了多轮对话的指令微调结构,适用于提升个人或小微企业智能记账的效率和准确性。
以上内容由遇见数据集搜集并总结生成



