Total-Text-Dataset
收藏github2020-07-29 更新2024-05-31 收录
下载链接:
https://github.com/janetwise/Total-Text-Dataset
下载链接
链接失效反馈官方服务:
资源简介:
Total Text数据集包含1555张图像,具有三种不同的文本方向:水平、多向和曲线,是一种独特的数据集。
The Total Text dataset comprises 1555 images featuring three distinct text orientations: horizontal, multi-directional, and curved, making it a unique dataset.
创建时间:
2020-07-29
原始信息汇总
数据集概述
数据集名称
- Total-Text-Dataset
数据集更新历史
- 2020年4月29日:更新检测排行榜,突出显示E2E方法。
- 2020年3月19日:更新测试集的新groundtruth。
- 2019年9月8日:提供新的训练groundtruth。
- 2019年9月7日:更新引导标注工具箱。
- 2019年9月7日:更新baseline。
- 2019年8月1日:扩展版本,新增baseline和标注工具,被IJDAR接受。
- 2019年5月30日:关于Total-Text与ArT数据集的重要公告。
- 2019年4月2日:更新排名表,对比默认与提出的DetEval。
- 2019年3月31日:更新DetEval.py,支持Python3。
- 2019年3月14日:更新排名表,包含评估协议信息。
- 2018年11月26日:包含排名表供参考。
- 2018年8月24日:新增引导标注工具箱文件夹。
- 2018年5月15日:添加.txt格式的groundtruth。
- 2018年5月14日:新增功能,支持Do not care候选过滤。
- 2018年4月3日:添加像素级groundtruth。
- 2017年11月4日:添加文本级groundtruth。
- 2017年10月27日:数据集发布。
数据集特点
- 类型:基于单词级别的英文曲线文本数据集。
- 推荐相关数据集:推荐参考SCUT-CTW1500,包含英文和中文的文本行数据集。
- 相关挑战:与SCUT-CTW1500共同扩展为RRC-ArT,在ICDAR2019上举办,旨在促进任意形状文本阅读任务的创新。
重要公告
- 测试集图像处理:为保持Total-Text数据集未来基准的有效性,应从ArT数据集中移除Total-Text的测试集图像及其对应ID。
检测排行榜
- 评估指标:Precision (P), Recall (R), F-score (F)。
- 基准分数:基于Poly-FRCNN-3,得分P=78.0, R=68.0, F=73.0。
- 方法比较:列出了多种方法的P, R, F得分及发表地点。
端到端识别排行榜
- 评估指标:None(无词典)和Full(全词典)的识别准确率。
- 方法比较:列出了多种方法的识别准确率、FPS及发表地点。
搜集汇总
数据集介绍

构建方式
Total-Text-Dataset是一个专注于英文曲线文本检测的数据集,其构建过程结合了多种先进的图像标注工具和技术。数据集的标注工作通过Guided Annotation工具箱进行,确保了标注的精确性和一致性。数据集包含了像素级和文本级的标注信息,涵盖了多种复杂的文本形状和布局。此外,数据集的构建还参考了多个基准模型和评估协议,以确保其在文本检测领域的广泛适用性和可靠性。
特点
Total-Text-Dataset以其丰富的曲线文本样本和多样化的文本布局而著称。数据集中的文本实例不仅包括常见的水平文本,还涵盖了曲线、倾斜、旋转等多种复杂形状的文本。每个文本实例都提供了详细的像素级和文本级标注,便于研究人员进行精确的文本检测和识别任务。此外,数据集还提供了多种评估协议和基准模型,帮助用户更好地理解和比较不同算法的性能。
使用方法
Total-Text-Dataset的使用方法相对灵活,用户可以通过GitHub页面获取数据集的详细信息和下载链接。数据集提供了多种格式的标注文件,包括文本文件和像素级标注文件,便于用户根据需求进行数据处理。用户可以使用提供的基线模型进行文本检测和识别任务的实验,并通过数据集中的评估协议对算法性能进行量化分析。此外,数据集还支持与其他相关数据集(如SCUT-CTW1500)的联合使用,以扩展研究范围。
背景与挑战
背景概述
Total-Text-Dataset是由香港中文大学的研究团队于2017年10月发布的一个专注于曲线文本检测的数据集。该数据集旨在解决自然场景中任意形状文本的检测与识别问题,特别是在复杂背景下的曲线文本识别。Total-Text-Dataset的发布填补了当时文本检测领域在曲线文本数据上的空白,推动了文本检测与识别技术的发展。该数据集不仅为学术界提供了标准化的评测基准,还在国际文档分析与识别会议(ICDAR)等顶级会议上引发了广泛关注,成为该领域的重要研究工具之一。
当前挑战
Total-Text-Dataset面临的挑战主要集中在两个方面。首先,曲线文本的多样性和复杂性使得检测与识别任务极具挑战性,尤其是在文本形状不规则、背景复杂或光照条件不佳的情况下。其次,数据集的构建过程中,标注曲线文本的边界和内容需要极高的精度,这对标注工具和标注人员的专业性提出了严格要求。此外,随着数据集规模的扩大和标注标准的更新,如何保持数据的一致性和公平性也成为了一个重要的挑战。这些挑战不仅推动了数据集的持续优化,也促进了相关算法的创新与改进。
常用场景
经典使用场景
Total-Text-Dataset 是一个专注于曲线文本检测与识别的数据集,广泛应用于自然场景文本检测领域。其经典使用场景包括对任意形状文本的检测与识别,尤其是在复杂背景下的曲线文本识别任务中表现出色。该数据集通过提供高质量的标注数据,帮助研究人员开发和评估先进的文本检测与识别算法。
实际应用
在实际应用中,Total-Text-Dataset 被广泛用于开发智能文档分析系统、自动驾驶中的路标识别、以及增强现实中的文本识别功能。例如,在自动驾驶领域,该数据集帮助开发出能够准确识别弯曲路标和广告牌的算法,提升了车辆的环境感知能力。
衍生相关工作
Total-Text-Dataset 催生了许多经典的研究工作,如基于多边形回归的文本检测方法(Poly-FRCNN-3)和端到端的文本识别框架(如 TextDragon 和 ABCNet)。这些工作不仅在该数据集上取得了显著成果,还推动了整个文本检测与识别领域的发展,尤其是在处理任意形状文本方面。
以上内容由遇见数据集搜集并总结生成



