101人4,538张日语手写体OCR数据
收藏数据堂2024-05-23 收录
下载链接:
https://www.datatang.com/dataset/1087
下载链接
链接失效反馈官方服务:
资源简介:
101人4,538张日语手写体OCR数据文字载体为A4纸。该数据内容涵盖社会民生、娱乐、旅游、体育赛事、电影、作曲等领域。在标注方面,对文本进行字符级矩形框标注、字符级内容转写和行级矩形框标注、行级内容转写。本套数据可用于日语手写体OCR任务。
This dataset consists of 4,538 Japanese handwritten text samples collected from 101 individuals, with all samples taking A4 paper as the physical carrier. The content of the samples covers multiple fields including social livelihood, entertainment, tourism, sports events, movies, music composition and other related areas. For annotation, character-level bounding box annotation, character-level content transcription, line-level bounding box annotation and line-level content transcription are provided for the text in the samples. This dataset can be utilized for Japanese handwritten OCR tasks.
提供机构:
数据堂
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含4,538张由101人书写的日语手写体图像,载体为A4纸,内容涵盖社会民生、娱乐等多个领域。标注包括字符级和行级的矩形框标注及内容转写,准确率不低于97%,适用于日语手写体OCR任务。
以上内容由遇见数据集搜集并总结生成



