Ransaka/sinhala_synthetic_ocr
收藏Hugging Face2023-12-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Ransaka/sinhala_synthetic_ocr
下载链接
链接失效反馈官方服务:
资源简介:
Sinahala OCR数据集是一个包含图像和文本的数据集,主要用于图像到文本的任务。数据集的特征包括图像和文本,其中图像的数据类型为image,文本的数据类型为string。数据集只有一个训练集(train),包含100个样本,总大小为6653244字节。数据集的任务类别为image-to-text,语言为僧伽罗语(si),数据集规模小于1K。
Sinahala OCR数据集是一个包含图像和文本的数据集,主要用于图像到文本的任务。数据集的特征包括图像和文本,其中图像的数据类型为image,文本的数据类型为string。数据集只有一个训练集(train),包含100个样本,总大小为6653244字节。数据集的任务类别为image-to-text,语言为僧伽罗语(si),数据集规模小于1K。
提供机构:
Ransaka
原始信息汇总
数据集概述
数据集信息
- 特征:
image: 图像数据text: 字符串数据
- 分割:
train: 训练集- 字节数: 6653244
- 样本数: 100
- 下载大小: 6642993 字节
- 数据集大小: 6653244 字节
配置
- 配置名称: default
- 数据文件:
train: 训练集- 路径:
data/train-*
- 路径:
任务类别
image-to-text: 图像到文本
语言
si: 僧伽罗语
数据集名称
- 名称: Sinahala OCR Dataset
数据集大小类别
n<1K: 样本数小于1千



