Total-Text-Dataset

github2019-09-09 更新2024-05-31 收录

下载链接：

https://github.com/xhappy/Total-Text-Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

Total-Text是一个基于英文曲线文本的数据集，包含多种文本方向：水平、多向和曲线。该数据集是ICDAR 2017的一部分，用于促进对任意形状文本阅读任务的研究。

Total-Text is an English curved text-based dataset that includes various text orientations: horizontal, multi-directional, and curved. This dataset is part of ICDAR 2017 and is used to promote research on arbitrary shape text reading tasks.

创建时间：

2019-09-09

原始信息汇总

数据集概述

名称: Total-Text-Dataset

发布日期: 2017年10月27日

更新历史:

2019年5月30日: 重要公告，Total-Text与ArT数据集的关系。
2019年4月2日: 更新排名表，使用默认与建议的DetEval。
2019年3月31日: 更快的DetEval.py版本，支持Python3。
2019年3月14日: 更新排名表，包含评估协议信息。
2018年11月26日: 包含排名表供参考。
2018年8月24日: 新增注释工具文件夹。
2018年5月15日: 添加.txt格式的groundtruth。
2018年5月14日: 新增功能，支持Do not care候选过滤。
2018年4月3日: 添加像素级groundtruth。
2017年11月4日: 添加文本级groundtruth。

数据集特点:

包含1555张图像。
支持三种文本方向：水平、多向和曲线。
是首个包含曲线文本的数据集。

重要公告:

Total-Text和SCUT-CTW1500现已成为ArT数据集的训练集部分。
为保持Total-Text数据集的基准测试有效性，应从ArT数据集中移除Total-Text的测试集图像。

引用信息:

@article{CK2019, author = {Chee Kheng Ch’ng and Chee Seng Chan and Chenglin Liu}, title = {Total-Text: Towards Orientation Robustness in Scene Text Detection}, journal = {IJDAR}, year = {2019}, }

@inproceedings{CK2017, author = {Chee Kheng Ch’ng and Chee Seng Chan}, title = {Total-Text: A Comprehensive Dataset for Scene Text Detection and Recognition}, booktitle = {14th IAPR International Conference on Document Analysis and Recognition {ICDAR}}, pages = {935--942}, year = {2017}, doi = {10.1109/ICDAR.2017.157}, }

反馈与联系:

欢迎对该数据集提出建议和意见。
联系作者：chngcheekheng at gmail.com 或 cs.chan at um.edu.my。

许可证与版权:

开源许可证：BSD-3。
版权所有：2017-2019，University of Malaya的图像与信号处理中心。

搜集汇总

数据集介绍

构建方式

Total-Text-Dataset是一个为了促进文本检测研究而构建的全面性数据集，包含了1555张图像，涵盖了水平、多方向和曲线三种不同的文本方向。数据集的构建注重于文本检测的取向稳健性，提供了丰富的标注信息，包括像素级和文本级的地面真实数据，以及一种用于筛选不相关候选者的机制，从而为研究者在场景文本检测领域提供了全面而深入的训练和测试资源。

使用方法

使用Total-Text-Dataset时，研究者可以根据自己的需要选择合适的评估标准，如Pascal VOC IoU度量或提出的DetEval评估。数据集提供了Python脚本和注释工具，方便研究者进行数据的加载、标注和评估。此外，数据集的使用需要遵守BSD-3开源协议，仅限于学术目的。对于数据集的使用和结果的发布，研究者应遵循相应的规范和公平性原则。

背景与挑战

背景概述

Total-Text-Dataset是一款专注于英文曲线文本的数据集，发布于2017年，由Chee Kheng Ch’ng、Chee Seng Chan和Chenglin Liu等研究人员创建。该数据集的宗旨在于推动场景文本检测研究中的方向稳健性，包含了1555张图片，文本方向涵盖水平、多方向和曲线三种类型。Total-Text-Dataset在学术界引起了广泛关注，为场景文本检测和识别领域提供了全面的数据支持，对相关技术的发展产生了重要影响。

当前挑战

在研究领域问题方面，Total-Text-Dataset解决了英文曲线文本检测的难题，对提高文本检测算法的方向稳健性提出了挑战。构建过程中，研究人员面临了多项挑战，包括如何准确标注曲线文本的像素级和文本级地面真相、如何处理不同方向和形状的文本，以及如何确保在扩展数据集ArT中保留Total-Text-Dataset的有效性，避免测试集图片的泄露。这些挑战推动了场景文本检测技术的创新与发展。

常用场景

经典使用场景

Total-Text-Dataset作为一个单词级别的英文曲线文本数据集，其经典使用场景主要集中于文本检测领域，尤其是针对不规则形状文本的检测任务。研究者可以利用该数据集训练和评估各类文本检测模型，以实现对图像中任意形状英文文本的准确识别和定位。

解决学术问题

该数据集解决了传统文本检测研究中对规则形状文本的过度依赖问题，提供了包含水平、多方向和曲线三种不同文本方向的丰富样本，有助于提升模型在复杂场景下的鲁棒性。此外，Total-Text-Dataset的引入促进了文本检测领域的研究进展，使得学术研究能够更加全面地探索和解决实际问题。

实际应用

在实际应用中，Total-Text-Dataset可以被用于开发智能OCR系统，提升系统对复杂场景文本的识别能力，如街景图像中的广告牌文字识别、文档图像中的手写体识别等。这些应用场景对于提高信息自动提取的效率和准确性具有重要意义。

数据集最近研究