Nayana-cognitivelab/Nayana-OCR-in-14k-v1-arxiv

Name: Nayana-cognitivelab/Nayana-OCR-in-14k-v1-arxiv
Creator: Nayana-cognitivelab
Published: 2024-11-08 21:57:14
License: 暂无描述

Hugging Face2024-11-08 更新2024-12-14 收录

下载链接：

https://hf-mirror.com/datasets/Nayana-cognitivelab/Nayana-OCR-in-14k-v1-arxiv

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含多种印度语言（如孟加拉语、古吉拉特语、印地语等）的图像和文本数据。每个语言配置的数据集包含图像、原始图像、边界框、翻译文本、英文文本、文本类型、应用的填充和文本统计等特征。数据集主要用于训练，每个配置的训练集包含大量示例和相应的字节大小。

This dataset contains image and text data for multiple Indian languages (such as Bengali, Gujarati, Hindi, etc.). Each language configuration in the dataset includes features such as images, original images, bounding boxes, translated text, English text, text type, applied padding, and text statistics. The dataset is primarily used for training, with each configurations training set containing a large number of examples and corresponding byte sizes.

提供机构：

Nayana-cognitivelab