five

5,147张日语手写体OCR数据【数据堂】

收藏
OpenDataLab2024-05-31 更新2024-06-01 收录
下载链接:
https://opendatalab.org.cn/shujutang/shujutang1296
下载链接
链接失效反馈
官方服务:
资源简介:
5,147张日语手写体OCR数据。文字载体为A4纸、横格纸、方格纸等。采集设备为手机,采集角度为平视视角。该数据内容涵盖日语作文、诗歌、散文、新闻、故事等领域。在标注方面,标注行级文本的四边形框,行级文本转写。本套数据可用于日语手写体OCR任务

This dataset comprises 5,147 samples of Japanese handwritten text for optical character recognition (OCR) tasks. The text is written on various paper types including A4 paper, lined paper, and grid paper. The data was collected using mobile phones with an eye-level shooting perspective. The covered content spans diverse domains such as Japanese compositions, poems, prose, news articles, and stories. For annotations, quadrilateral bounding boxes for line-level text and line-level text transcriptions are provided. This dataset can be utilized for Japanese handwritten OCR-related tasks.
提供机构:
shujutang
创建时间:
2024-05-31
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集包含5,147张日语手写体OCR数据,涵盖日语作文、诗歌、散文、新闻等多种内容,标注内容包括行级四边形标注和行级内容转写。数据采集自普通纸张(如A4纸、横格纸等),使用手机设备平视拍摄,图像格式为.jpg,标注文档格式为.json。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务