five

LULab/myOCR

收藏
Hugging Face2024-12-20 更新2025-04-19 收录
下载链接:
https://hf-mirror.com/datasets/LULab/myOCR
下载链接
链接失效反馈
官方服务:
资源简介:
myOCR是针对缅甸语(又称缅甸语)的光学字符识别(OCR)数据集。数据集中的文本数据已经按单词进行了分割,并使用下划线作为分隔符。数据集包含行级别的文本图像,适用于OCR研究。图像和对应的文本标签存储在一个压缩文件夹中,格式为图片文件路径和文本标签用制表符分隔。此数据集可用于光学字符识别的研究和开发,特别是针对资源匮乏的语言处理。

myOCR is an Optical Character Recognition (OCR) corpus for the Myanmar language (Burmese). The text data in the dataset are word-segmented using underscores as delimiters. The dataset includes line-level text images suitable for OCR research, stored in a zipped folder with image file paths and text labels separated by tabs. This dataset can be used for research and development in optical character recognition, especially for low-resource language processing.
提供机构:
LULab
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作