GaborMadarasz/ocr_silver
收藏Hugging Face2024-01-14 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/GaborMadarasz/ocr_silver
下载链接
链接失效反馈官方服务:
资源简介:
这是一个小型数据集,包含来自同一文本的句子。源列是通过tesseract 5.0进行OCR处理的,目标列是从epub文件中提取的。此外,没有应用人工标注。
这是一个小型数据集,包含来自同一文本的句子。源列是通过tesseract 5.0进行OCR处理的,目标列是从epub文件中提取的。此外,没有应用人工标注。
提供机构:
GaborMadarasz
原始信息汇总
数据集概述
许可证
- Apache 2.0
任务类别
- 翻译
语言
- 匈牙利语
数据规模
- 10K<n<100K
数据来源
- 源列:通过Tesseract 5.0进行OCR处理
- 目标列:从epub文件中提取
注释情况
- 未应用人工标注



