Voxel51/Total-Text-Dataset
收藏Hugging Face2024-05-06 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/Voxel51/Total-Text-Dataset
下载链接
链接失效反馈官方服务:
资源简介:
Total-Text数据集包含1555张图像,涵盖了水平、多方向和曲线三种不同方向的文本。该数据集主要用于解决曲线文本检测问题,是第一个相对大规模的场景文本数据集,强调了文本方向的多样性。数据集通过FiftyOne工具进行安装和使用,提供了详细的安装和使用指南。数据集的创建动机是现有场景文本数据集中文本方向的多样性不足,特别是曲线方向的文本数量较少。
提供机构:
Voxel51
原始信息汇总
数据集概述
基本信息
- 名称:Total-Text-Dataset
- 样本数量:1555
- 语言:英语
- 许可证:BSD-3-Clause
- 任务类别:
- 目标检测
- 图像到文本
- 标签:
- fiftyone
- 图像
- 目标检测
- 文本检测
数据集描述
Total-Text-Dataset包含1555张图像,具有三种不同的文本方向:水平、多向和曲线。这是第一个相对大规模的场景文本数据集,强调文本方向的多样性。
数据集结构
- 媒体类型:图像
- 样本字段:
- id
- filepath
- tags
- metadata
- ground_truth_polylines
- ground_truth
- 分割:训练集和测试集,样本根据分割进行标记。
数据集创建
- 策展人:Chee-Kheng Ch’ng, Chee Seng Chan, Cheng-Lin Liu
- 资金来源:Fundamental Research Grant Scheme (FRGS) MoHE (Grant No. FP004-2016) 和 Postgraduate Research Grant (PPP) (Grant No. PG350-2016A)
- 策展理由:当前场景文本数据集中的文本方向不够多样化,特别是曲线方向的文本数量较少,因此,作者收集了Total-Text数据集,强调文本方向的多样性。
使用场景
- 曲线文本检测问题
引用信息
bibtex @article{CK2019, author = {Chee Kheng Ch’ng and Chee Seng Chan and Chenglin Liu}, title = {Total-Text: Towards Orientation Robustness in Scene Text Detection}, journal = {International Journal on Document Analysis and Recognition (IJDAR)}, volume = {23}, pages = {31-52}, year = {2020}, doi = {10.1007/s10032-019-00334-z}, }



