five

dh-unibe/transkribus-exports-127147-raw-xml

收藏
Hugging Face2026-01-15 更新2026-02-07 收录
下载链接:
https://hf-mirror.com/datasets/dh-unibe/transkribus-exports-127147-raw-xml
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为transkribus-exports-127147-raw-xml,是通过Transkribus PageXML数据使用pagexml-hf转换器创建的。数据集包含121个样本,分布在1个分割(train)中。数据集的特性包括image(图像)、xml_content(XML内容)、filename(文件名)和project_name(项目名称)。数据以parquet格式组织,并按分割和项目名称进行分片。数据集主要用于图像到文本的转换、手写文本识别(HTR)、文本转录等任务。

This dataset is named transkribus-exports-127147-raw-xml and was created using the pagexml-hf converter from Transkribus PageXML data. The dataset contains 121 samples across 1 split (train). The features of the dataset include image, xml_content, filename, and project_name. The data is organized in parquet format and sharded by split and project name. The dataset is primarily used for tasks such as image-to-text conversion, handwritten text recognition (HTR), and text transcription.
提供机构:
dh-unibe
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作