Total-Text-Dataset

github2020-07-29 更新2024-05-31 收录

下载链接：

https://github.com/janetwise/Total-Text-Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

Total Text数据集包含1555张图像，具有三种不同的文本方向：水平、多向和曲线，是一种独特的数据集。

The Total Text dataset comprises 1555 images featuring three distinct text orientations: horizontal, multi-directional, and curved, making it a unique dataset.

创建时间：

2020-07-29

原始信息汇总

数据集概述

数据集名称

Total-Text-Dataset

数据集更新历史

2020年4月29日：更新检测排行榜，突出显示E2E方法。
2020年3月19日：更新测试集的新groundtruth。
2019年9月8日：提供新的训练groundtruth。
2019年9月7日：更新引导标注工具箱。
2019年9月7日：更新baseline。
2019年8月1日：扩展版本，新增baseline和标注工具，被IJDAR接受。
2019年5月30日：关于Total-Text与ArT数据集的重要公告。
2019年4月2日：更新排名表，对比默认与提出的DetEval。
2019年3月31日：更新DetEval.py，支持Python3。
2019年3月14日：更新排名表，包含评估协议信息。
2018年11月26日：包含排名表供参考。
2018年8月24日：新增引导标注工具箱文件夹。
2018年5月15日：添加.txt格式的groundtruth。
2018年5月14日：新增功能，支持Do not care候选过滤。
2018年4月3日：添加像素级groundtruth。
2017年11月4日：添加文本级groundtruth。
2017年10月27日：数据集发布。

数据集特点

类型：基于单词级别的英文曲线文本数据集。
推荐相关数据集：推荐参考SCUT-CTW1500，包含英文和中文的文本行数据集。
相关挑战：与SCUT-CTW1500共同扩展为RRC-ArT，在ICDAR2019上举办，旨在促进任意形状文本阅读任务的创新。

重要公告

测试集图像处理：为保持Total-Text数据集未来基准的有效性，应从ArT数据集中移除Total-Text的测试集图像及其对应ID。

检测排行榜

评估指标：Precision (P), Recall (R), F-score (F)。
基准分数：基于Poly-FRCNN-3，得分P=78.0, R=68.0, F=73.0。
方法比较：列出了多种方法的P, R, F得分及发表地点。

端到端识别排行榜

评估指标：None（无词典）和Full（全词典）的识别准确率。
方法比较：列出了多种方法的识别准确率、FPS及发表地点。

搜集汇总

数据集介绍

构建方式

Total-Text-Dataset是一个专注于英文曲线文本检测的数据集，其构建过程结合了多种先进的图像标注工具和技术。数据集的标注工作通过Guided Annotation工具箱进行，确保了标注的精确性和一致性。数据集包含了像素级和文本级的标注信息，涵盖了多种复杂的文本形状和布局。此外，数据集的构建还参考了多个基准模型和评估协议，以确保其在文本检测领域的广泛适用性和可靠性。

特点

Total-Text-Dataset以其丰富的曲线文本样本和多样化的文本布局而著称。数据集中的文本实例不仅包括常见的水平文本，还涵盖了曲线、倾斜、旋转等多种复杂形状的文本。每个文本实例都提供了详细的像素级和文本级标注，便于研究人员进行精确的文本检测和识别任务。此外，数据集还提供了多种评估协议和基准模型，帮助用户更好地理解和比较不同算法的性能。

使用方法

Total-Text-Dataset的使用方法相对灵活，用户可以通过GitHub页面获取数据集的详细信息和下载链接。数据集提供了多种格式的标注文件，包括文本文件和像素级标注文件，便于用户根据需求进行数据处理。用户可以使用提供的基线模型进行文本检测和识别任务的实验，并通过数据集中的评估协议对算法性能进行量化分析。此外，数据集还支持与其他相关数据集（如SCUT-CTW1500）的联合使用，以扩展研究范围。

背景与挑战

背景概述

Total-Text-Dataset是由香港中文大学的研究团队于2017年10月发布的一个专注于曲线文本检测的数据集。该数据集旨在解决自然场景中任意形状文本的检测与识别问题，特别是在复杂背景下的曲线文本识别。Total-Text-Dataset的发布填补了当时文本检测领域在曲线文本数据上的空白，推动了文本检测与识别技术的发展。该数据集不仅为学术界提供了标准化的评测基准，还在国际文档分析与识别会议（ICDAR）等顶级会议上引发了广泛关注，成为该领域的重要研究工具之一。

当前挑战

Total-Text-Dataset面临的挑战主要集中在两个方面。首先，曲线文本的多样性和复杂性使得检测与识别任务极具挑战性，尤其是在文本形状不规则、背景复杂或光照条件不佳的情况下。其次，数据集的构建过程中，标注曲线文本的边界和内容需要极高的精度，这对标注工具和标注人员的专业性提出了严格要求。此外，随着数据集规模的扩大和标注标准的更新，如何保持数据的一致性和公平性也成为了一个重要的挑战。这些挑战不仅推动了数据集的持续优化，也促进了相关算法的创新与改进。

常用场景

经典使用场景

Total-Text-Dataset 是一个专注于曲线文本检测与识别的数据集，广泛应用于自然场景文本检测领域。其经典使用场景包括对任意形状文本的检测与识别，尤其是在复杂背景下的曲线文本识别任务中表现出色。该数据集通过提供高质量的标注数据，帮助研究人员开发和评估先进的文本检测与识别算法。

实际应用

在实际应用中，Total-Text-Dataset 被广泛用于开发智能文档分析系统、自动驾驶中的路标识别、以及增强现实中的文本识别功能。例如，在自动驾驶领域，该数据集帮助开发出能够准确识别弯曲路标和广告牌的算法，提升了车辆的环境感知能力。

衍生相关工作

Total-Text-Dataset 催生了许多经典的研究工作，如基于多边形回归的文本检测方法（Poly-FRCNN-3）和端到端的文本识别框架（如 TextDragon 和 ABCNet）。这些工作不仅在该数据集上取得了显著成果，还推动了整个文本检测与识别领域的发展，尤其是在处理任意形状文本方面。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集