five

ICDAR 2015 Competition HTRtS: Handwritten Text Recognition on the tranScriptorium Dataset Rerelease

收藏
NIAID Data Ecosystem2026-03-11 收录
下载链接:
https://zenodo.org/record/1136293
下载链接
链接失效反馈
官方服务:
资源简介:
A new release of the dataset used in the ICDAR 2015 HTR competition in which all Page XML files are based on the same 2013-07-15 schema. It only contains page level images, Page XML files for train and test (including the ground truth transcripts for the test and train batch 1) and plain text files for train batch 2 that have the page level ground truth transcripts. The original version of this dataset can be found at http://doi.org/10.5281/zenodo.248733

本数据集为ICDAR 2015手写文本识别(Handwritten Text Recognition, HTR)竞赛所用数据集的更新版本,其所有Page XML文件均基于统一的2013-07-15版Schema。该数据集仅包含页面级图像、训练集与测试集对应的Page XML文件(涵盖测试集及训练批次1的真实标注转录文本),以及用于训练批次2的纯文本文件,该文件包含页面级真实标注转录文本。本数据集的原始版本可通过链接 http://doi.org/10.5281/zenodo.248733 获取。
创建时间:
2020-01-24
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作