5,711张韩语手写体OCR数据【数据堂】
收藏OpenDataLab2024-05-31 更新2024-06-01 收录
下载链接:
https://opendatalab.org.cn/shujutang/shujutang1297
下载链接
链接失效反馈官方服务:
资源简介:
5,711张韩语手写体OCR数据。文字载体为A4纸、横格纸、方格纸等。采集设备为手机,采集角度为平视视角。该数据内容涵盖韩语作文、诗歌、散文、新闻、故事等领域。在标注方面,标注行级文本的四边形框,行级文本转写。本套数据可用于韩语手写体OCR任务
5,711 Korean handwritten text samples for OCR applications. The text carriers include A4 paper, ruled paper, grid paper, and other common paper types. The data was collected via mobile phones with an eye-level shooting perspective. The dataset covers diverse content categories such as Korean compositions, poems, prose, news reports, and stories. For annotation, quadrilateral bounding boxes are provided for each line-level text, along with the corresponding text transcriptions. This dataset can be utilized for Korean handwritten text OCR tasks.
提供机构:
shujutang
创建时间:
2024-05-31
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含5,711张韩语手写体图像,采集自韩国人群,使用手机在平视角度拍摄,内容涵盖韩语作文、诗歌、散文等。标注包括行级四边形框和文本转写,数据格式为.jpg和.json,适用于韩语手写体OCR任务,但需企业合作购买商业使用。
以上内容由遇见数据集搜集并总结生成



