five

多本古籍图片及对应ocr数据

收藏
郑州数据交易中心2025-12-01 收录
下载链接:
https://market.zzbdex.com/product/dataSet/1958823960689336320
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集含多本古籍高清图片及对应 OCR 数据。图片高分辨率呈现古籍原貌,包括纸张纹理、墨迹、批注等细节与版式结构;OCR 数据经校对优化,精准识别正文、注释及异体字等,标注关键信息,实现图文对应,为古籍研究、传播提供数字化支撑。

This dataset includes high-resolution images of multiple ancient books and their corresponding OCR data. The images present the original appearance of the ancient books in high resolution, covering details such as paper texture, ink marks, annotations, as well as the layout structure. The OCR data has been proofread and optimized, accurately identifying main texts, annotations, variant Chinese characters and other relevant content, labeling key information to achieve image-text correspondence, thus providing digital support for the research and dissemination of ancient books.
提供机构:
中算(河南)数字科技有限公司
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集包含多本古籍的高清扫描图像及其校对优化的OCR数据,图像完整保留原貌细节,OCR数据精准识别文本内容,为古籍数字化研究提供图文对应的基础资源。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务