RCTW-17

Name: RCTW-17
Creator: maas
Published: 2026-01-06 14:58:49
License: 暂无描述

魔搭社区2026-01-06 更新2024-08-31 收录

下载链接：

https://modelscope.cn/datasets/OpenDataLab/RCTW-17

下载链接

链接失效反馈

官方服务：

资源简介：

displayName: RCTW-17 (Reading Chinese Text in the Wild) labelTypes: [] license: - Unknown mediaTypes: - Text paperUrl: https://arxiv.org/pdf/1708.09585v3.pdf publishDate: "2017" publishUrl: https://rctw.vlrlab.net/ publisher: - Nanyang Technological University - Huazhong University of Science and Technology - Megvii Technology - Cornell University & Cornell Tech tags: - Street taskTypes: - Scene Text Recognition - Scene Text Detection --- # 数据集介绍 ## 简介 RCTW-17 是一个阅读图像中的中文文本的比赛。对于训练和测试，我们提供了一个包含各种图像的大规模数据集，包括街景、海报、菜单、室内场景和屏幕截图。 ## 引文 ``` @inproceedings{shi2017icdar2017, title={ICDAR2017 competition on reading chinese text in the wild (RCTW-17)}, author={Shi, Baoguang and Yao, Cong and Liao, Minghui and Yang, Mingkun and Xu, Pei and Cui, Linyan and Belongie, Serge and Lu, Shijian and Bai, Xiang}, booktitle={2017 14th iapr international conference on document analysis and recognition (ICDAR)}, volume={1}, pages={1429--1434}, year={2017}, organization={IEEE} } ``` ## Download dataset :modelscope-code[]{type="git"}

displayName: RCTW-17（野外中文文本读取，Reading Chinese Text in the Wild） labelTypes: 无 license: - 未知 mediaTypes: - 文本 paperUrl: https://arxiv.org/pdf/1708.09585v3.pdf publishDate: 2017年 publishUrl: https://rctw.vlrlab.net/ publisher: - 南洋理工大学 - 华中科技大学 - 旷视科技 (Megvii Technology) - 康奈尔大学与康奈尔科技 (Cornell University & Cornell Tech) tags: - 街景 taskTypes: - 场景文本识别 (Scene Text Recognition) - 场景文本检测 (Scene Text Detection) --- # 数据集介绍 ## 简介 RCTW-17 是一项面向野外中文文本读取的竞赛。为支撑模型训练与测试，我们构建了大规模多场景图像数据集，涵盖街景、海报、菜单、室内场景及屏幕截图等多种类型的图像。 ## 引用文献 @inproceedings{shi2017icdar2017, title={ICDAR2017 competition on reading chinese text in the wild (RCTW-17)}, author={Shi, Baoguang and Yao, Cong and Liao, Minghui and Yang, Mingkun and Xu, Pei and Cui, Linyan and Belongie, Serge and Lu, Shijian and Bai, Xiang}, booktitle={2017 14th iapr international conference on document analysis and recognition (ICDAR)}, volume={1}, pages={1429--1434}, year={2017}, organization={IEEE} } ## 数据集下载 :modelscope-code[]{type="git"}

提供机构：

maas

创建时间：

2024-07-13

搜集汇总

数据集介绍

构建方式

RCTW-17数据集的构建基于大规模的真实世界图像，涵盖了多种场景和语言环境。该数据集通过众包平台收集了来自不同地区的图像，并由专业标注团队进行文本检测和识别的标注工作。图像来源包括公共街道、商店、广告牌等，确保了数据的多样性和代表性。标注过程采用了多层次的质量控制，确保了标注的准确性和一致性。

特点

RCTW-17数据集以其丰富的多样性和高质量的标注著称。数据集包含了超过8000张图像，涵盖了多种语言，特别是中文和英文，以及多种字体和书写风格。图像分辨率高，文本区域复杂，适合用于训练和评估文本检测和识别算法。此外，数据集还提供了详细的标注信息，包括文本框的位置、文本内容和语言类型，便于研究人员进行深入分析和模型训练。

使用方法

RCTW-17数据集主要用于文本检测和识别领域的研究与应用。研究人员可以使用该数据集训练深度学习模型，以提高在复杂场景下的文本检测和识别能力。数据集的标注信息可以直接用于监督学习，也可以通过数据增强技术进一步提升模型的泛化能力。此外，RCTW-17数据集还可以用于评估现有算法的性能，通过与其他数据集的对比分析，揭示算法的优势和不足，从而推动该领域的技术进步。

背景与挑战

背景概述

RCTW-17数据集，全称为Reading Chinese Text in the Wild，由香港中文大学于2017年创建，主要研究人员包括来自计算机视觉和自然语言处理领域的专家。该数据集的核心研究问题集中在自然场景中的中文文本识别，旨在提升机器对复杂环境下中文文本的识别能力。RCTW-17的发布对中文文本识别领域产生了深远影响，为研究人员提供了一个标准化的测试平台，促进了相关算法的发展和优化。

当前挑战

RCTW-17数据集在构建过程中面临了多重挑战。首先，自然场景中的中文文本识别涉及复杂的背景干扰和多样化的字体风格，这增加了识别的难度。其次，数据集的标注工作需要高度专业化的知识，确保每个文本实例的准确性和一致性。此外，数据集的多样性和规模也带来了存储和处理上的技术挑战。这些因素共同构成了RCTW-17数据集在实际应用中的主要障碍。

发展历史

创建时间与更新

RCTI-17数据集创建于2017年，旨在推动场景文本检测与识别技术的发展。该数据集在创建后未有公开的更新记录。

重要里程碑

RCTI-17数据集的发布标志着场景文本识别领域的一个重要里程碑。它包含了来自中国不同地区的复杂场景图像，特别是街景和室内场景，提供了丰富的多语言文本样本，包括中文、英文和数字。这些数据极大地推动了多语言场景文本识别算法的研究和应用，为后续的文本识别技术提供了宝贵的资源和基准测试数据。

当前发展情况

目前，RCTI-17数据集在场景文本识别研究中仍具有重要地位。尽管近年来出现了更多复杂和多样化的数据集，RCTI-17因其早期贡献和独特的数据特性，仍然被广泛用于算法验证和性能评估。它不仅促进了中文场景文本识别技术的发展，也为全球范围内的多语言文本识别研究提供了基础。随着技术的进步，RCTI-17数据集的贡献将继续在相关领域中发挥作用，推动文本识别技术的不断创新和优化。

发展历程

RCTW-17数据集首次发布，旨在促进场景文本检测和识别技术的研究。
2017年
RCTW-17数据集在多个国际会议和竞赛中被广泛应用，成为评估文本识别算法性能的重要基准。
2018年
基于RCTW-17数据集的研究成果在计算机视觉领域的重要期刊和会议上发表，推动了场景文本识别技术的发展。
2019年
RCTW-17数据集的扩展版本发布，增加了更多复杂场景和多语言文本样本，进一步提升了数据集的应用价值。
2020年

常用场景

经典使用场景

在自然场景文本识别领域，RCTW-17数据集以其丰富的多语言文本样本和复杂的背景环境著称。该数据集广泛应用于文本检测与识别算法的研究与开发，特别是在处理中文、英文及其他亚洲语言混合场景时，为算法提供了宝贵的训练和测试资源。

实际应用

在实际应用中，RCTW-17数据集被广泛用于开发和优化自动文档处理系统、智能交通标识识别以及文化遗产数字化等应用。其多语言支持能力使得这些系统能够更好地适应全球化的需求，提高了实际应用的效率和准确性。

衍生相关工作

基于RCTW-17数据集，研究者们开发了多种先进的文本识别模型，如基于深度学习的端到端识别系统。此外，该数据集还激发了关于多语言文本识别和复杂背景处理的研究，推动了自然场景文本识别技术的整体发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集