Total-Text-Dataset

github2019-05-09 更新2024-05-31 收录

下载链接：

https://github.com/Skilled-Coder/Total-Text-Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

Total-Text数据集是ICDAR 2017的一部分，包含1555张图像，具有三种不同的文本方向：水平、多向和曲线，是独一无二的。

The Total-Text dataset, part of ICDAR 2017, comprises 1555 images featuring three distinct text orientations: horizontal, multi-directional, and curved, making it uniquely comprehensive.

创建时间：

2019-01-16

原始信息汇总

数据集概述

数据集名称

Total-Text-Dataset

发布日期

2017年10月27日

数据集更新历史

2018年11月26日：添加了表排名参考。
2018年8月24日：新增了标注工具文件夹。
2018年5月15日：增加了.txt格式的groundtruth。
2018年5月14日：新增了Do not care候选过滤功能。
2018年4月3日：增加了像素级groundtruth。
2017年11月4日：增加了文本级groundtruth。

数据集特点

包含1555张图像。
支持三种不同的文本方向：水平、多向和曲线。

数据集应用

用于文本检测研究。

数据集性能评估

检测性能：列出了多种方法的精确度、召回率和F-measure。
端到端识别性能：提供了无字典和全字典情况下的识别率。

引用信息

@inproceedings{CK2017, author = {Chee Kheng Ch’ng and Chee Seng Chan}, title = {Total-Text: A Comprehensive Dataset for Scene Text Detection and Recognition}, booktitle = {14th IAPR International Conference on Document Analysis and Recognition {ICDAR}}, pages = {935--942}, year = {2017}, doi = {10.1109/ICDAR.2017.157}, }

联系方式

对于数据集的反馈和建议，可通过电子邮件联系作者：
- chngcheekheng at gmail.com
- cs.chan at um.edu.my

许可证和版权

本项目基于BSD-3许可证开放源代码，仅限学术用途使用。
版权所有：2018年，马来亚大学计算机科学与信息技术学院图像与信号处理中心。

搜集汇总

数据集介绍

构建方式

Total-Text-Dataset是一款致力于推动文本检测研究发展的数据集。该数据集的构建汇集了1555张图片，覆盖了横排、多角度及曲线三种不同的文本方向，以提供更为全面的研究资源。

特点

该数据集的特点在于其全面性与独特性，不仅包含了多种文本方向的图片，还提供了像素级和文本级的基准数据，以及一个用于辅助标注的工具。Total-Text-Dataset的构建旨在为场景文本检测与识别领域的研究提供更为丰富和挑战性的数据。

使用方法

用户可以通过访问数据集的GitHub页面来获取数据集及相关工具。数据集遵循BSD-3开源协议，可供学术研究自由使用。在使用时，用户应遵循数据集的使用规范，并在研究成果中引用数据集的相关信息。

背景与挑战

背景概述

Total-Text-Dataset是一款为了推动文本检测研究而问世的综合数据集，由Chee Kheng Ch’ng和Chee Seng Chan于2017年发布。该数据集以其全面性超越了当时现有的文本数据集，包含1555张图片，涵盖了水平、多方向和曲线三种不同的文本方向，为场景文本检测与识别领域的研究提供了重要资源。Total-Text-Dataset的构建，不仅丰富了文本检测的数据类型，也为相关算法的评估和比较提供了统一标准，对学术界产生了深远影响。

当前挑战

在研究背景方面，Total-Text-Dataset旨在解决场景文本检测与识别中的多样化挑战，如不同文本方向、字体大小和光照条件的识别。构建过程中的挑战主要包括：确保数据的多样性和均衡性，以及精确标注文本边界和方向。在算法性能评估上，数据集提供了详细的评价协议，如DetEval，但不同方法的性能表现各异，仍存在提升空间，尤其是在复杂场景和多样文本形式下的检测与识别准确度。

常用场景

经典使用场景

Total-Text-Dataset作为一个全面的场景文本检测和识别数据集，其经典的使用场景主要集中于文本检测与识别任务。研究者们利用该数据集，对图像中的水平、多方向及曲线文本进行定位和识别，以提升算法对不同文本排列方式的处理能力。

解决学术问题

该数据集解决了场景文本检测和识别领域中的多个学术问题，如文本方向多样性、遮挡、低分辨率等，为算法提供了丰富的训练样本，有助于提升模型的鲁棒性和准确性，推动相关研究的深入发展。

衍生相关工作

基于Total-Text-Dataset，研究者们衍生出了多项经典工作，如MSR、FTSN、TextSnake等，这些工作不仅提升了场景文本检测和识别的算法性能，同时也推动了数据集构建和评估方法的进步。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集