five

262人5,162张繁体字(中国台湾)手写体OCR数据

收藏
数据堂2024-05-23 收录
下载链接:
https://www.datatang.com/dataset/1190
下载链接
链接失效反馈
官方服务:
资源简介:
262人5,162张繁体字(中国台湾)手写体OCR数据,标注行级文本的四边形框,行级文本转写。本套数据可用于繁体字OCR任务。

A handwritten Traditional Chinese (Taiwan, China) OCR dataset consisting of 5,162 samples collected from 262 individuals. The dataset provides quadrilateral bounding boxes for line-level text regions and corresponding line-level text transcriptions. This dataset can be used for Traditional Chinese OCR tasks.
提供机构:
数据堂
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集包含262人提供的5,162张繁体字(中国台湾)手写体图像,采集自A4纸、方格纸等多种环境,使用手机平视拍摄,图像格式为.jpg,标注格式为.json。数据内容涵盖小说、诗歌、新闻领域,标注包括行级四边形框和文本转写,检测框和转写精度均不低于97%,适用于繁体字OCR任务训练。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务