five

1,000张日语发票采集数据

收藏
国家数据集管理服务平台2026-04-28 更新2026-04-29 收录
下载链接:
https://www.ndsms.cn/dataRetrieval/datasetDetail/?id=1ef556be75857771221a2aa918ad79c7
下载链接
链接失效反馈
官方服务:
资源简介:
1,000张日语发票采集数据。数据包含基础编辑500张,专业编辑500张。数据多样性包括不同发票内容、不同编辑类型、多种发票格式。发票上的公司名字、地址、姓名、传真号、电话等敏感信息均进行了虚拟化编辑,非真实信息。数据可用于日语发票检测、识别、端到端OCR等任务。

This dataset consists of 1,000 collected Japanese invoice samples, including 500 basic-edited samples and 500 professionally-edited samples. The data features diversity in terms of invoice contents, editing types and invoice formats. All sensitive information on the invoices, such as company names, addresses, contact persons, fax numbers and phone numbers, has been virtualized and does not correspond to real entities. This dataset can be used for tasks including Japanese invoice detection, recognition and end-to-end OCR.
提供机构:
数据堂(北京)科技股份有限公司
创建时间:
2026-04-28
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集包含1000张日语发票图像,由500张基础编辑和500张专业编辑构成,涵盖了不同的发票内容、编辑类型和格式,所有敏感信息均已进行虚拟化处理。它适用于日语发票检测、识别以及端到端OCR等人工智能任务。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务