five

MSDA (Multi-source domain adaptation dataset for text recognition)

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/MSDA
下载链接
链接失效反馈
官方服务:
资源简介:
近年来,基于深度学习的方法在计算机视觉领域显示出可喜的结果。但是,常见的深度学习模型需要大量的带标签的数据,收集和标记是劳动密集型的。更重要的是,由于训练数据和测试数据之间的域转换,模型可能会被破坏。文本识别是计算机视觉中一个广泛研究的领域,由于字体的多样性和复杂的背景,存在上述相同的问题。本文主要研究文本识别问题,并对这些问题做出了三点贡献。首先,我们收集了用于文本识别的多源域适应数据集,其中包括五个具有500万多个图像的不同域,这是我们所知的第一个多域文本识别数据集。其次,我们提出了一种新的方法,称为元自学习,该方法将自学习方法与元学习范式相结合,在多领域适应的场景下获得了更好的识别效果。第三,在数据集上进行了大量实验,以提供基准,并显示了我们方法的有效性。
提供机构:
OpenDataLab
创建时间:
2022-06-07
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作