five

Chinese Text in the Wild

收藏
OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/Chinese_Text_in_the_Wild
下载链接
链接失效反馈
官方服务:
资源简介:
Chinese Text in the Wild 是一个包含约 100 万个汉字的中文文本数据集,来自 3850 个独特的汉字,由专家在 30000 多张街景图像中进行注释。这是一个具有挑战性的数据集,具有良好的多样性,包含平面文本、凸起文本、光照不足的文本、远距离文本、部分遮挡的文本等。

Chinese Text in the Wild is a Chinese text dataset containing approximately 1 million Chinese characters, spanning 3850 distinct Chinese characters and annotated by experts on over 30,000 street view images. This is a challenging dataset with excellent diversity, including planar texts, raised texts, under-lit texts, distant texts, partially occluded texts, and more.
提供机构:
OpenDataLab
创建时间:
2022-08-16
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
Chinese Text in the Wild是一个中文文本数据集,包含约100万个汉字,覆盖3850个独特字符,基于30000余张街景图像注释,具有多样化的文本场景。该数据集由清华大学和腾讯于2018年发布,适用于场景文本检测和光学字符识别任务。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作