Total-Text

github2021-08-08 更新2024-05-31 收录

下载链接：

https://github.com/YoungminBaek/Total-Text-Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

Total-Text是一个基于英文曲线文本的数据集，包含多种文本方向，如水平、多向和曲线文本，用于文本检测和识别的研究。

Total-Text is a dataset based on curved English text, encompassing various text orientations such as horizontal, multi-directional, and curved text, designed for research in text detection and recognition.

创建时间：

2019-08-09

原始信息汇总

数据集概述

名称: Total-Text-Dataset

发布日期: 2017年10月27日

更新历史:

2019年5月30日
2019年4月2日
2019年3月31日
2019年3月14日
2018年11月26日
2018年8月24日
2018年5月15日
2018年5月14日
2018年4月3日
2017年11月4日

数据集特点:

包含1555张图像，涵盖三种文本方向：水平、多方向和曲线。
提供像素级和文本级标注。
支持Do not care候选过滤功能。

相关数据集:

SCUT-CTW1500: 包含中英文文本行数据集。
ArT (Arbitrary-Shaped Text dataset): Total-Text和SCUT-CTW1500是其训练集的一部分。

重要公告

Total-Text的测试集图像应从ArT数据集中移除，以保持未来基准测试的有效性。

表排名

提供多种文本检测方法的精度(P)、召回率(R)和F分数(F)的比较。
使用DetEval评估协议，包括默认设置和新提议设置。

端到端识别

提供无词典和全词典条件下的识别准确率。

引用信息

@article{CK2019, author = {Chee Kheng Ch’ng and Chee Seng Chan and Chenglin Liu}, title = {Total-Text: Towards Orientation Robustness in Scene Text Detection}, journal = {IJDAR}, year = {2019}, }

@inproceedings{CK2017, author = {Chee Kheng Ch’ng and Chee Seng Chan}, title = {Total-Text: A Comprehensive Dataset for Scene Text Detection and Recognition}, booktitle = {14th IAPR International Conference on Document Analysis and Recognition {ICDAR}}, pages = {935--942}, year = {2017}, doi = {10.1109/ICDAR.2017.157}, }

反馈与联系方式

欢迎对数据集提出建议和意见，可通过电子邮件联系作者。

搜集汇总

数据集介绍

构建方式

Total-Text数据集是一个专为场景文本检测与识别研究设计的综合性数据集，其构建过程涵盖了多种文本方向的图像采集与标注。该数据集包含1555张图像，涵盖了水平、多方向和曲线文本等多种文本方向，旨在为文本检测算法提供更具挑战性的测试环境。数据集的标注工作通过像素级和文本级的真值标注完成，确保了数据的精确性和多样性。此外，数据集还提供了多种格式的标注文件，包括文本文件和像素级标注，以便于不同研究需求的使用。

特点

Total-Text数据集的主要特点在于其多样化的文本方向，尤其是曲线文本的广泛覆盖，这在现有的文本数据集中较为罕见。数据集的图像来源广泛，涵盖了自然场景中的多种复杂文本布局，能够有效测试文本检测算法在不同场景下的鲁棒性。此外，数据集还提供了详细的评估协议和工具，如DetEval评估脚本，支持多种评估指标的计算，便于研究人员进行算法性能的对比与分析。

使用方法

Total-Text数据集的使用方法较为灵活，研究人员可以通过GitHub获取数据集的图像和标注文件。数据集提供了多种格式的标注文件，包括文本级和像素级标注，便于不同研究需求的使用。评估时，可以使用提供的DetEval脚本进行性能评估，支持多种评估指标的计算。此外，数据集还提供了与ArT数据集的兼容性说明，研究人员可以根据需要选择是否移除ArT数据集中的测试集图像，以确保评估的公平性。

背景与挑战

背景概述

Total-Text数据集由马来西亚大学的Chee Kheng Ch’ng和Chee Seng Chan等人于2017年首次发布，旨在解决场景文本检测中的多方向文本识别问题。该数据集包含1555张图像，涵盖了水平、多方向和曲线文本等多种文本方向，极大地丰富了场景文本检测的研究内容。Total-Text的发布填补了现有数据集在曲线文本检测方面的空白，推动了文本检测算法在复杂场景中的应用。该数据集在ICDAR 2017会议上首次亮相，并迅速成为文本检测领域的重要基准之一。

当前挑战

Total-Text数据集面临的挑战主要体现在两个方面。首先，曲线文本的检测与识别是当前文本检测领域的一大难题，尤其是在复杂背景和多样化的文本布局下，算法的鲁棒性和准确性面临严峻考验。其次，数据集的构建过程中，标注曲线文本的边界和方向信息极为复杂，需要高精度的标注工具和大量的人工干预，这增加了数据集的构建难度。此外，随着ArT等更大规模数据集的推出，如何在保持Total-Text独立性的同时，避免数据泄露和评估偏差，也成为研究社区需要共同面对的挑战。

常用场景

经典使用场景

Total-Text数据集在场景文本检测领域具有广泛的应用，尤其是在处理多方向、曲线文本的检测任务中表现突出。该数据集包含了1555张图像，涵盖了水平、多方向和曲线文本等多种文本方向，为研究人员提供了一个全面的测试平台。通过该数据集，研究者能够评估和优化文本检测算法在不同文本方向下的性能，尤其是在复杂背景和多样文本形状的场景中。

衍生相关工作

Total-Text数据集催生了许多经典的文本检测算法和研究工作。例如，基于该数据集的TextSnake、CRAFT和PSENet等算法在曲线文本检测任务中取得了显著进展。此外，该数据集还被用于ICDAR 2019的Arbitrary-Shaped Text挑战赛，进一步推动了任意形状文本检测技术的发展。这些衍生工作不仅提升了文本检测的精度，还为后续研究提供了宝贵的参考。

数据集最近研究