five

报纸和杂志图像分割数据集

收藏
帕依提提2024-03-04 收录
下载链接:
https://www.payititi.com/opendatasets/show-26168.html
下载链接
链接失效反馈
官方服务:
资源简介:
Creators: Aleksey Vilkin and Ilia Safonov, NRNU MEPhI, Moscow, Russia, Date: 2012 Data Set Information: 该数据集用于文本、图片和背景区域文档分类区域的机器学习算法的训练和验证。它包含101张俄文报纸和杂志的扫描图像。大多数图像的分辨率为300 dpi,大小为A4,约为2400x3500像素。对于所有图像,手动创建基于地面真实像素的遮罩。地面真相面具的命名类似于带有后缀的原始图像?。有三类:文本区、图片区、背景。遮罩上颜色为255、0、0(rgb,红色)的像素对应于图片区域,颜色为0、0、255(rgb,蓝色)的像素对应于文本区域,所有其他像素对应于背景。具有不同颜色背景的图像位于数据集中。 Attribute Information: There are three classes: text area, picture area, background. Pixels on the mask with color 255, 0, 0 (rgb, red color) correspond to picture area, pixels with color 0, 0, 255 (rgb, blue color) correspond to text area, all other pixels correspond to background. Relevant Papers: A. M. Vilkin, I. V. Safonov, M. A. Egorova. Algorithm for segmentation of documents based on texture features // Pattern Recognition and Image Analysis March 2013, Volume 23, Issue 1, pp 153-159 Citation Request: A. M. Vilkin, I. V. Safonov, M. A. Egorova. Algorithm for segmentation of documents based on texture features // Pattern Recognition and Image Analysis March 2013, Volume 23, Issue 1, pp 153-159

创建者:阿列克谢·维尔金(Aleksey Vilkin)与伊利亚·萨福诺夫(Ilia Safonov),隶属于俄罗斯莫斯科国家研究型大学MEPhI(NRNU MEPhI),数据集发布于2012年。 数据集信息:本数据集可用于文本、图像与背景区域的文档分类机器学习算法的训练与验证。其包含101张俄文报纸及杂志的扫描图像,绝大多数图像分辨率为300 dpi,尺寸为A4规格,像素大小约为2400×3500。所有图像均配有手动标注的真值(ground truth)像素掩码,掩码文件名与原始图像名称类似,仅附加后缀“?”。数据集共包含三类区域:文本区、图像区与背景。掩码中RGB颜色为(255, 0, 0)(红色)的像素对应图像区,RGB颜色为(0, 0, 255)(蓝色)的像素对应文本区,其余像素均对应背景。数据集中的图像带有不同样式的背景。 属性信息:本数据集共包含三类标注类别:文本区、图像区与背景。掩码中RGB颜色为(255, 0, 0)(红色)的像素对应图像区,RGB颜色为(0, 0, 255)(蓝色)的像素对应文本区,其余像素均对应背景。 相关论文:A. M. 维尔金、I. V. 萨福诺夫、M. A. 叶戈罗娃. 基于纹理特征的文档分割算法 // 《模式识别与图像分析》,2013年3月,第23卷第1期,第153-159页 引用请求:A. M. 维尔金、I. V. 萨福诺夫、M. A. 叶戈罗娃. 基于纹理特征的文档分割算法 // 《模式识别与图像分析》,2013年3月,第23卷第1期,第153-159页
提供机构:
帕依提提
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个包含101张俄文报纸和杂志扫描图像的图像分割数据集,每张图像配有手动标注的文本、图片和背景区域遮罩,适用于文档分类区域的机器学习算法训练和验证。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务