ai-forever/school_notebooks_RU
收藏Hugging Face2023-02-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ai-forever/school_notebooks_RU
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含俄语手写笔记的学校笔记本图像。数据集的标注提供了用于训练检测和OCR模型的端到端标注,以及用于从页面读取文本的端到端模型。标注格式采用COCO格式,`annotation.json`文件包含`categories`、`images`和`annotations`三个字典,分别用于存储类别信息、图像描述和标注信息。
提供机构:
ai-forever
原始信息汇总
School Notebooks Dataset
概述
该数据集包含学校笔记本上的手写俄文笔记的图像。数据集的标注支持训练检测和光学字符识别(OCR)模型,以及一个端到端的模型用于从页面读取文本。
语言
- 俄文
许可证
- MIT
任务类别
- 图像分割
- 目标检测
标签
- 光学字符识别
- 文本检测
- OCR
标注格式
标注采用COCO格式,主要包含以下几个部分:
annotation["categories"]:包含类别信息的字典列表,包括类别名称和索引。annotation["images"]:描述图像信息的字典列表,每个字典包含:file_name:图像文件名。id:图像ID。
annotation["annotations"]:包含标注信息的字典列表,每个字典描述数据集中的一个多边形,包含以下字段:image_id:多边形所在图像的索引。category_id:多边形的类别索引。attributes:包含额外标注信息的字典,其中translation子字典包含文本的翻译。segmentation:多边形的坐标,一个数字列表,代表坐标对x和y。



