Chinese Text in the Wild
收藏OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/Chinese_Text_in_the_Wild
下载链接
链接失效反馈官方服务:
资源简介:
Chinese Text in the Wild 是一个包含约 100 万个汉字的中文文本数据集,来自 3850 个独特的汉字,由专家在 30000 多张街景图像中进行注释。这是一个具有挑战性的数据集,具有良好的多样性,包含平面文本、凸起文本、光照不足的文本、远距离文本、部分遮挡的文本等。
Chinese Text in the Wild is a Chinese text dataset containing approximately 1 million Chinese characters, spanning 3850 distinct Chinese characters and annotated by experts on over 30,000 street view images. This is a challenging dataset with excellent diversity, including planar texts, raised texts, under-lit texts, distant texts, partially occluded texts, and more.
提供机构:
OpenDataLab
创建时间:
2022-08-16
搜集汇总
数据集介绍

背景与挑战
背景概述
Chinese Text in the Wild是一个中文文本数据集,包含约100万个汉字,覆盖3850个独特字符,基于30000余张街景图像注释,具有多样化的文本场景。该数据集由清华大学和腾讯于2018年发布,适用于场景文本检测和光学字符识别任务。
以上内容由遇见数据集搜集并总结生成



