five

2024年-2025年出版行业教辅图书印刷通用ocr识别标注数据集

收藏
杭州数据产权登记平台2025-11-12 收录
下载链接:
https://property.hzdex.cn/certificate/property/145?registrationType=INITIAL
下载链接
链接失效反馈
资源简介:
该数据为杭州练链科技有限公司书链业务系统生产过程中产生,采用数据自动分类分析技术进行初步筛选,再配合人工标注生成而成。数据为教辅图书各种题型的印刷通用ocr识别标注数据,涵盖功能形态(PDF文件结构化处理)、用途(智能批改与学情分析)、业务场景(小初教育辅助、题型全面有区分度)等。数据集的核心价值在于其真实场景下的海量、多维度、结构化特性,可以作为核心训练数据驱动AI教育大模型的研发,可支撑AI批改算法训练、教育质量评估及个性化学习推荐,辅助教育研究者进行宏观的学业质量评估与教学难点洞察。
提供机构:
杭州练链科技有限公司
创建时间:
2025-11-11
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作