slone/bak_ocr_error_correction_2022
收藏Hugging Face2023-06-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/slone/bak_ocr_error_correction_2022
下载链接
链接失效反馈官方服务:
资源简介:
2022年OCR错误校正后备数据集
2022年OCR错误校正后备数据集
提供机构:
slone
原始信息汇总
数据集概述
数据集名称
- 名称:bak_ocr_error_correction_2022
数据集特征
- raw_text:字符串类型
- fixed_text:字符串类型
- idx:整数类型(int64)
数据集分割
- 训练集:
- 示例数量:14085
- 字节数:5373886
- 验证集:
- 示例数量:4611
- 字节数:1764601
- 测试集:
- 示例数量:4696
- 字节数:1756060
数据集大小
- 下载大小:4842082字节
- 数据集总大小:8894547字节



