262人5,162张繁体字(中国台湾)手写体OCR数据【数据堂】
收藏OpenDataLab2024-05-30 更新2024-06-01 收录
下载链接:
https://opendatalab.org.cn/shujutang/shujutang1190
下载链接
链接失效反馈官方服务:
资源简介:
262人5,162张繁体字(中国台湾)手写体OCR数据,标注行级文本的四边形框,行级文本转写。本套数据可用于繁体字OCR任务
An OCR dataset containing 5,162 handwritten traditional Chinese (Taiwan, China) samples collected from 262 individuals, with quadrilateral bounding box annotations for line-level text and corresponding line-level text transcriptions. This dataset can be used for traditional Chinese OCR tasks.
提供机构:
shujutang
创建时间:
2024-05-30
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含5,162张繁体字(中国台湾)手写体图像,由262人提供,标注内容包括行级文本的四边形框和行级文本转写,适用于繁体字OCR任务。数据采集环境多样,标注准确率高,检测框和文本转写精度均不低于97%。
以上内容由遇见数据集搜集并总结生成



