文本识别数据集
收藏江苏数据交易所2026-01-30 收录
下载链接:
https://exchange.jsdataex.com/trade-home/#/project/tradingMarket/productDetail?productId=4270
下载链接
链接失效反馈官方服务:
资源简介:
本文本识别数据集专注于复杂场景下的文字信息提取,为大模型文本训练提供精准支撑。数据集包含多种图像,每张图像提供文本标注,包含转录内容与精确的文本行定位框。数据格式标准,内容丰富,为开发与优化文字检测、识别算法提供坚实基础,广泛应用于文档数字化、自动驾驶路牌理解、智能信息处理等领域。
提供机构:
青宇数智(西宁)科技有限公司
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集专注于复杂场景下的文字信息提取,旨在为大模型文本训练提供精准支撑。它包含多种图像,每张图像都提供包含转录内容和精确文本行定位框的标注,数据格式标准且内容丰富。该数据集为文字检测与识别算法的开发和优化奠定基础,广泛应用于文档数字化、自动驾驶路牌理解及智能信息处理等领域。
以上内容由遇见数据集搜集并总结生成



