five

ai-forever/school_notebooks_RU

收藏
Hugging Face2023-02-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ai-forever/school_notebooks_RU
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含俄语手写笔记的学校笔记本图像。数据集的标注提供了用于训练检测和OCR模型的端到端标注,以及用于从页面读取文本的端到端模型。标注格式采用COCO格式,`annotation.json`文件包含`categories`、`images`和`annotations`三个字典,分别用于存储类别信息、图像描述和标注信息。
提供机构:
ai-forever
原始信息汇总

School Notebooks Dataset

概述

该数据集包含学校笔记本上的手写俄文笔记的图像。数据集的标注支持训练检测和光学字符识别(OCR)模型,以及一个端到端的模型用于从页面读取文本。

语言

  • 俄文

许可证

  • MIT

任务类别

  • 图像分割
  • 目标检测

标签

  • 光学字符识别
  • 文本检测
  • OCR

标注格式

标注采用COCO格式,主要包含以下几个部分:

  • annotation["categories"]:包含类别信息的字典列表,包括类别名称和索引。
  • annotation["images"]:描述图像信息的字典列表,每个字典包含:
    • file_name:图像文件名。
    • id:图像ID。
  • annotation["annotations"]:包含标注信息的字典列表,每个字典描述数据集中的一个多边形,包含以下字段:
    • image_id:多边形所在图像的索引。
    • category_id:多边形的类别索引。
    • attributes:包含额外标注信息的字典,其中translation子字典包含文本的翻译。
    • segmentation:多边形的坐标,一个数字列表,代表坐标对x和y。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作