Total-Text
收藏github2021-08-08 更新2024-05-31 收录
下载链接:
https://github.com/YoungminBaek/Total-Text-Dataset
下载链接
链接失效反馈官方服务:
资源简介:
Total-Text是一个基于英文曲线文本的数据集,包含多种文本方向,如水平、多向和曲线文本,用于文本检测和识别的研究。
Total-Text is a dataset based on curved English text, encompassing various text orientations such as horizontal, multi-directional, and curved text, designed for research in text detection and recognition.
创建时间:
2019-08-09
原始信息汇总
数据集概述
名称: Total-Text-Dataset
发布日期: 2017年10月27日
更新历史:
- 2019年5月30日
- 2019年4月2日
- 2019年3月31日
- 2019年3月14日
- 2018年11月26日
- 2018年8月24日
- 2018年5月15日
- 2018年5月14日
- 2018年4月3日
- 2017年11月4日
数据集特点:
- 包含1555张图像,涵盖三种文本方向:水平、多方向和曲线。
- 提供像素级和文本级标注。
- 支持Do not care候选过滤功能。
相关数据集:
- SCUT-CTW1500: 包含中英文文本行数据集。
- ArT (Arbitrary-Shaped Text dataset): Total-Text和SCUT-CTW1500是其训练集的一部分。
重要公告
- Total-Text的测试集图像应从ArT数据集中移除,以保持未来基准测试的有效性。
表排名
- 提供多种文本检测方法的精度(P)、召回率(R)和F分数(F)的比较。
- 使用DetEval评估协议,包括默认设置和新提议设置。
端到端识别
- 提供无词典和全词典条件下的识别准确率。
引用信息
@article{CK2019, author = {Chee Kheng Ch’ng and Chee Seng Chan and Chenglin Liu}, title = {Total-Text: Towards Orientation Robustness in Scene Text Detection}, journal = {IJDAR}, year = {2019}, }
@inproceedings{CK2017, author = {Chee Kheng Ch’ng and Chee Seng Chan}, title = {Total-Text: A Comprehensive Dataset for Scene Text Detection and Recognition}, booktitle = {14th IAPR International Conference on Document Analysis and Recognition {ICDAR}}, pages = {935--942}, year = {2017}, doi = {10.1109/ICDAR.2017.157}, }
反馈与联系方式
- 欢迎对数据集提出建议和意见,可通过电子邮件联系作者。
搜集汇总
数据集介绍

构建方式
Total-Text数据集是一个专为场景文本检测与识别研究设计的综合性数据集,其构建过程涵盖了多种文本方向的图像采集与标注。该数据集包含1555张图像,涵盖了水平、多方向和曲线文本等多种文本方向,旨在为文本检测算法提供更具挑战性的测试环境。数据集的标注工作通过像素级和文本级的真值标注完成,确保了数据的精确性和多样性。此外,数据集还提供了多种格式的标注文件,包括文本文件和像素级标注,以便于不同研究需求的使用。
特点
Total-Text数据集的主要特点在于其多样化的文本方向,尤其是曲线文本的广泛覆盖,这在现有的文本数据集中较为罕见。数据集的图像来源广泛,涵盖了自然场景中的多种复杂文本布局,能够有效测试文本检测算法在不同场景下的鲁棒性。此外,数据集还提供了详细的评估协议和工具,如DetEval评估脚本,支持多种评估指标的计算,便于研究人员进行算法性能的对比与分析。
使用方法
Total-Text数据集的使用方法较为灵活,研究人员可以通过GitHub获取数据集的图像和标注文件。数据集提供了多种格式的标注文件,包括文本级和像素级标注,便于不同研究需求的使用。评估时,可以使用提供的DetEval脚本进行性能评估,支持多种评估指标的计算。此外,数据集还提供了与ArT数据集的兼容性说明,研究人员可以根据需要选择是否移除ArT数据集中的测试集图像,以确保评估的公平性。
背景与挑战
背景概述
Total-Text数据集由马来西亚大学的Chee Kheng Ch’ng和Chee Seng Chan等人于2017年首次发布,旨在解决场景文本检测中的多方向文本识别问题。该数据集包含1555张图像,涵盖了水平、多方向和曲线文本等多种文本方向,极大地丰富了场景文本检测的研究内容。Total-Text的发布填补了现有数据集在曲线文本检测方面的空白,推动了文本检测算法在复杂场景中的应用。该数据集在ICDAR 2017会议上首次亮相,并迅速成为文本检测领域的重要基准之一。
当前挑战
Total-Text数据集面临的挑战主要体现在两个方面。首先,曲线文本的检测与识别是当前文本检测领域的一大难题,尤其是在复杂背景和多样化的文本布局下,算法的鲁棒性和准确性面临严峻考验。其次,数据集的构建过程中,标注曲线文本的边界和方向信息极为复杂,需要高精度的标注工具和大量的人工干预,这增加了数据集的构建难度。此外,随着ArT等更大规模数据集的推出,如何在保持Total-Text独立性的同时,避免数据泄露和评估偏差,也成为研究社区需要共同面对的挑战。
常用场景
经典使用场景
Total-Text数据集在场景文本检测领域具有广泛的应用,尤其是在处理多方向、曲线文本的检测任务中表现突出。该数据集包含了1555张图像,涵盖了水平、多方向和曲线文本等多种文本方向,为研究人员提供了一个全面的测试平台。通过该数据集,研究者能够评估和优化文本检测算法在不同文本方向下的性能,尤其是在复杂背景和多样文本形状的场景中。
衍生相关工作
Total-Text数据集催生了许多经典的文本检测算法和研究工作。例如,基于该数据集的TextSnake、CRAFT和PSENet等算法在曲线文本检测任务中取得了显著进展。此外,该数据集还被用于ICDAR 2019的Arbitrary-Shaped Text挑战赛,进一步推动了任意形状文本检测技术的发展。这些衍生工作不仅提升了文本检测的精度,还为后续研究提供了宝贵的参考。
数据集最近研究
最新研究方向
在场景文本检测与识别领域,Total-Text数据集因其独特的曲线文本标注和多方向文本特性,成为研究任意形状文本检测的重要基准。近年来,随着深度学习技术的快速发展,基于Total-Text的研究方向主要集中在提升模型对复杂文本布局的适应能力,尤其是曲线文本的检测与识别。例如,TextSnake、CRAFT和PSENet等方法通过引入多边形回归和特征融合策略,显著提升了模型在曲线文本场景中的表现。此外,Total-Text与ArT数据集的结合进一步推动了任意形状文本检测的研究,相关成果在ICDAR等顶级会议上屡获关注。这些研究不仅推动了文本检测技术的进步,也为实际应用如自动驾驶、智能文档处理等提供了重要支持。
以上内容由遇见数据集搜集并总结生成



