CTW1500

Name: CTW1500
Creator: 华南理工大学电子信息工程学院
Published: 2017-12-06 21:02:43
License: 暂无描述

arXiv2017-12-06 更新2024-06-21 收录

下载链接：

https://github.com/Yuliang-Liu/Curve-Text-Detector

下载链接

链接失效反馈

官方服务：

资源简介：

CTW1500数据集是由华南理工大学电子信息工程学院创建的一个新型曲线文本数据集，专注于提升自然场景中曲线文本的检测能力。该数据集包含1500张图像，总计超过10000个文本标注，每张图像至少包含一个曲线文本。数据来源多样，包括互联网、图像库及手机拍摄等，涵盖多种语言和文本方向。创建过程中，研究团队采用了14点多边形标注方法，有效减少了人工标注的工作量。CTW1500数据集的应用领域主要集中在曲线文本检测，旨在解决现有数据集中曲线文本标注不足的问题，推动曲线文本检测技术的发展。

CTW1500 dataset is a novel curved text dataset created by the School of Electronic and Information Engineering, South China University of Technology, which focuses on enhancing the detection performance of curved text in natural scenes. It consists of 1500 images with a total of over 10,000 text annotations, and each image contains at least one curved text instance. The dataset has diverse sources, including the Internet, image libraries, mobile phone photography and so on, covering multiple languages and text orientations. During the dataset construction, the research team adopted a 14-point polygonal annotation method, which effectively reduced the workload of manual annotation. The CTW1500 dataset is mainly applied to curved text detection, aiming to address the shortage of curved text annotations in existing datasets and promote the development of curved text detection technologies.

提供机构：

华南理工大学电子信息工程学院

创建时间：

2017-12-06

搜集汇总

数据集介绍

构建方式

CTW1500数据集的构建方式独具匠心，通过从互联网、图像库如Google Open-Image以及手机摄像头采集的自然场景图像中，精心挑选出1500张包含曲线文本的图片。这些图片经过人工标注，形成了超过10,000个文本注释，其中至少每张图片包含一个曲线文本。为了确保标注的准确性和效率，研究团队采用了14点多边形标注法，这种方法不仅能够精确地捕捉曲线文本的轮廓，还能有效减少标注过程中的主观干扰。

特点

CTW1500数据集的显著特点在于其专注于曲线文本的检测，填补了当前数据集中曲线文本样本稀缺的空白。该数据集不仅包含了多种语言的文本，还涵盖了室内外、数字生成、模糊、透视畸变等多种场景，极大地丰富了数据集的多样性。此外，数据集的标注方式采用14点多边形，这种标注方法相较于传统的矩形或四边形标注，更能准确地描述曲线文本的复杂形态，为曲线文本检测算法的研究提供了高质量的训练数据。

使用方法

CTW1500数据集的使用方法灵活多样，适用于各种基于深度学习的曲线文本检测算法。研究者可以通过该数据集进行模型的训练和验证，利用其丰富的标注信息提升算法的检测精度。具体使用时，可以将数据集分为训练集和测试集，分别用于模型的训练和性能评估。此外，数据集还提供了详细的标注工具和标注指南，方便研究者进行自定义标注和数据扩充，进一步推动曲线文本检测技术的发展。

背景与挑战

背景概述

在场景文本检测领域，近年来取得了显著进展，检测方式从轴对齐矩形发展到旋转矩形，进而演变为四边形。然而，现有数据集中曲线文本的样本极少，这在诸如招牌、产品名称等场景图像中广泛存在。为应对这一挑战，华南理工大学的Yuliang Liu、Lianwen Jin等研究人员于2017年构建了CTW1500数据集，该数据集包含1500张图像中的10,751个文本标注，其中至少每张图像包含一个曲线文本。基于此数据集，研究团队提出了一种基于多边形的曲线文本检测器（CTD），能够直接检测曲线文本，无需经验组合。CTW1500数据集的创建不仅填补了曲线文本检测的空白，还推动了场景文本检测技术的发展，特别是在复杂文本区域的精确检测方面。

当前挑战

CTW1500数据集面临的挑战主要集中在两个方面：一是曲线文本检测的复杂性，由于曲线文本的形状多变，传统的四点定位方法难以有效处理，导致检测精度受限；二是数据集构建过程中的标注难题，曲线文本的标注需要更高的精度和更多的时间，相较于矩形或四边形标注，曲线文本的标注时间增加了约三倍。此外，现有的检测方法在处理曲线文本时表现不佳，主要原因是现有数据集中曲线文本样本稀缺，且许多曲线文本被不理想地标注为矩形。这些挑战不仅影响了检测算法的性能，也限制了其在实际应用中的广泛使用。

常用场景

经典使用场景

CTW1500数据集在场景文本检测领域中具有经典的使用场景，主要用于检测自然图像中的曲线文本。由于当前大多数数据集主要包含水平或旋转矩形文本，CTW1500通过提供大量曲线文本标注，填补了这一空白。研究者可以利用该数据集训练和评估针对曲线文本的检测算法，从而推动场景文本检测技术的发展。

衍生相关工作

基于CTW1500数据集，研究者们开发了多种针对曲线文本检测的算法，如CTD（Curve Text Detector）和TLOC（Transverse and Longitudinal Offset Connection）。这些方法不仅在CTW1500数据集上表现优异，还被广泛应用于其他场景文本检测任务中。此外，CTW1500的标注方法和数据结构也为其他曲线文本数据集的构建提供了参考，推动了整个领域的发展。

数据集最近研究