SynthText|文本检测数据集|自然场景图像数据集
收藏
- SynthText数据集首次发表于CVPR 2016,由Ankush Gupta、Andrea Vedaldi和Andrew Zisserman共同提出,旨在解决自然场景文本检测和识别的问题。
- SynthText数据集首次应用于自然场景文本检测和识别任务,显著提升了相关算法的表现,成为该领域的重要基准数据集。
- 随着深度学习技术的发展,SynthText数据集被广泛用于训练和评估各种文本检测和识别模型,推动了该领域的技术进步。
- SynthText数据集的影响力进一步扩大,被多个国际会议和期刊引用,成为自然场景文本处理领域不可或缺的资源。
- 基于SynthText数据集的研究成果不断涌现,推动了文本检测和识别技术的实际应用,如自动驾驶、智能监控等领域。
- 1Synthetic Data for Text Localisation in Natural ImagesUniversity of Oxford · 2016年
- 2TextSnake: A Flexible Representation for Detecting Text of Arbitrary ShapesNanjing University of Science and Technology · 2018年
- 3EAST: An Efficient and Accurate Scene Text DetectorMegvii Inc. · 2017年
- 4Text Recognition in the Wild: A SurveyUniversity of Science and Technology of China · 2020年
- 5Synthetic Data and Artificial Neural Networks for Natural Scene Text RecognitionUniversity of Oxford · 2016年
CAP-DATA
CAP-DATA数据集由长安大学交通学院的研究团队创建,包含11,727个交通事故视频,总计超过2.19百万帧。该数据集不仅标注了事故发生的时间窗口,还提供了详细的文本描述,包括事故前的实际情况、事故类别、事故原因和预防建议。数据集的创建旨在通过结合视觉和文本信息,提高交通事故预测的准确性和解释性,从而支持更安全的驾驶决策系统。
arXiv 收录
Nexdata/chinese_dialect
该数据集包含25,000小时的中文方言语音数据,收集自多个方言区域的本地方言使用者,涵盖闽南语、粤语、四川话、河南话、东北话、上海话、维吾尔语和藏语等。数据格式为16kHz、16bit、未压缩的wav文件,单声道。句子准确率超过95%。数据集支持的任务包括自动语音识别(ASR)和音频说话人识别。
hugging_face 收录
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录
Beijing Traffic
The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.
Papers with Code 收录
FER2013
FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。
github 收录