five

ICDAR 2013|文档分析数据集|文本识别数据集

收藏
OpenDataLab2025-04-05 更新2024-05-09 收录
文档分析
文本识别
下载链接:
https://opendatalab.org.cn/OpenDataLab/ICDAR_2013
下载链接
链接失效反馈
资源简介:
ICDAR 2013数据集由229训练图像和233测试图像组成,并提供word级注释。它是用于评估近水平文本检测的标准基准数据集。ICDAR 2013数据集专注于从born-digital图片中提取文本内容,例如在线和通过电子邮件使用的图片 (born-digital图片是为在线传输而创建的媒体文件)。ICDAR 2013数据集包括462照片,包括训练集的229和测试集的233。文本本地化,文本分割和单词识别都是与从出生数字图片中提取文本有关的挑战。
提供机构:
OpenDataLab
创建时间:
2022-08-16
AI搜集汇总
数据集介绍
main_image_url
构建方式
ICDAR 2013数据集的构建基于国际文档分析与识别会议(ICDAR)的竞赛需求,旨在评估文本检测和识别算法的性能。该数据集由来自不同语言和书写风格的文档图像组成,涵盖了多种复杂场景,如自然场景中的文本、手写文本和印刷文本。数据集的构建过程包括图像采集、文本标注和数据清洗,确保了数据的高质量和多样性。
特点
ICDAR 2013数据集以其高度的多样性和复杂性著称,包含了多种语言和书写风格的文本,适用于评估算法在不同环境下的鲁棒性。此外,数据集的标注精细,提供了文本边界框和字符级别的标注信息,有助于算法的精确训练和评估。数据集的规模适中,既保证了算法的训练效率,又提供了足够的挑战性。
使用方法
ICDAR 2013数据集主要用于文本检测和识别算法的训练和评估。研究者可以通过加载数据集中的图像和标注信息,进行模型的训练和验证。数据集的标注信息可以用于监督学习,帮助算法学习文本的位置和内容。此外,数据集还可以用于算法的性能比较和基准测试,通过与其他算法的结果对比,评估算法的优劣。
背景与挑战
背景概述
ICDAR 2013数据集,作为国际文档分析与识别会议(ICDAR)的一部分,于2013年由全球顶尖的文档分析研究团队共同创建。该数据集聚焦于场景文本识别,旨在推动自然场景中文字检测与识别技术的发展。其核心研究问题是如何在复杂背景和多变光照条件下,准确识别并提取图像中的文本信息。ICDAR 2013的发布,极大地促进了计算机视觉与自然语言处理领域的交叉研究,为后续的文本识别算法提供了标准化的测试基准。
当前挑战
ICDAR 2013数据集在构建过程中面临诸多挑战。首先,场景文本的多样性,包括字体、颜色、大小和方向的差异,增加了识别的复杂性。其次,自然场景中的光照变化、遮挡和背景噪声,进一步提升了文本检测的难度。此外,数据集的标注工作需要高度专业化的知识,确保每个文本实例的准确性和一致性。这些挑战不仅影响了数据集的质量,也对后续算法的设计和优化提出了更高的要求。
发展历史
创建时间与更新
ICDAR 2013数据集于2013年创建,作为国际文档分析与识别会议(ICDAR)的一部分,该数据集在文本识别和文档分析领域具有重要意义。
重要里程碑
ICDAR 2013数据集的发布标志着文本识别技术进入了一个新的阶段。该数据集包含了多种语言和复杂背景下的文本图像,极大地推动了文本识别算法的发展。其挑战性任务如文本定位和识别,促使研究者开发出更高效和准确的算法。此外,ICDAR 2013还引入了多方向文本识别任务,进一步扩展了文本识别技术的应用范围。
当前发展情况
当前,ICDAR 2013数据集仍然是文本识别和文档分析领域的重要基准。尽管后续有更多先进的数据集发布,ICDAR 2013因其历史地位和广泛应用,依然在学术研究和工业应用中占据重要位置。它不仅为新算法提供了测试平台,还促进了跨领域的技术交流与合作。通过不断的技术进步和数据集的扩展,ICDAR 2013继续为文本识别技术的创新和发展提供坚实的基础。
发展历程
  • ICDAR 2013数据集首次发表,作为第十三届国际文档分析与识别会议(ICDAR)的一部分,该数据集主要用于文本检测和识别任务。
    2013年
  • ICDAR 2013数据集首次应用于学术研究,成为文本检测和识别领域的重要基准数据集之一。
    2014年
  • 随着深度学习技术的发展,ICDAR 2013数据集被广泛用于训练和评估文本检测与识别模型,推动了相关技术的进步。
    2015年
  • ICDAR 2013数据集在多个国际竞赛中被用作标准测试集,进一步提升了其在学术界和工业界的影响力。
    2017年
  • ICDAR 2013数据集的相关研究成果被广泛应用于实际场景,如自动化文档处理和智能识别系统。
    2019年
常用场景
经典使用场景
在自然场景文本识别领域,ICDAR 2013数据集以其丰富的图像样本和多样化的文本实例,成为评估和比较不同文本识别算法性能的经典基准。该数据集包含了从复杂背景中提取的文本图像,涵盖了多种字体、大小和方向,为研究者提供了一个全面且具有挑战性的测试平台。
解决学术问题
ICDAR 2013数据集解决了自然场景文本识别中的关键学术问题,如文本检测的准确性、识别算法的鲁棒性以及多语言文本的处理能力。通过提供高质量的标注数据,该数据集促进了算法在复杂环境下的性能提升,推动了文本识别技术的发展,并为后续研究提供了重要的参考依据。
衍生相关工作
基于ICDAR 2013数据集,许多后续研究工作得以展开,包括改进的文本检测算法、增强的识别模型以及多模态文本处理技术。这些工作不仅提升了文本识别的准确性和效率,还推动了相关领域的技术进步,形成了丰富的研究成果和应用案例。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Google Scholar

Google Scholar是一个学术搜索引擎,旨在检索学术文献、论文、书籍、摘要和文章等。它涵盖了广泛的学科领域,包括自然科学、社会科学、艺术和人文学科。用户可以通过关键词搜索、作者姓名、出版物名称等方式查找相关学术资源。

scholar.google.com 收录

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

UniProt

UniProt(Universal Protein Resource)是全球公认的蛋白质序列与功能信息权威数据库,由欧洲生物信息学研究所(EBI)、瑞士生物信息学研究所(SIB)和美国蛋白质信息资源中心(PIR)联合运营。该数据库以其广度和深度兼备的蛋白质信息资源闻名,整合了实验验证的高质量数据与大规模预测的自动注释内容,涵盖从分子序列、结构到功能的全面信息。UniProt核心包括注释详尽的UniProtKB知识库(分为人工校验的Swiss-Prot和自动生成的TrEMBL),以及支持高效序列聚类分析的UniRef和全局蛋白质序列归档的UniParc。其卓越的数据质量和多样化的检索工具,为基础研究和药物研发提供了无可替代的支持,成为生物学研究中不可或缺的资源。

www.uniprot.org 收录

WideIRSTD Dataset

WideIRSTD数据集包含七个公开数据集:SIRST-V2、IRSTD-1K、IRDST、NUDT-SIRST、NUDT-SIRST-Sea、NUDT-MIRSDT、Anti-UAV,以及由国防科技大学团队开发的数据集,包括模拟陆基和太空基数据,以及真实手动标注的太空基数据。数据集包含具有各种目标形状(如点目标、斑点目标、扩展目标)、波长(如近红外、短波红外和热红外)、图像分辨率(如256、512、1024、3200等)的图像,以及不同的成像系统(如陆基、空基和太空基成像系统)。

github 收录

TCIA

TCIA(The Cancer Imaging Archive)是一个公开的癌症影像数据集,包含多种癌症类型的医学影像数据,如CT、MRI、PET等。这些数据通常与临床和病理信息相结合,用于癌症研究和临床试验。

www.cancerimagingarchive.net 收录