five

ISI_Bengali_Character

收藏
OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/ISI_Bengali_Character
下载链接
链接失效反馈
官方服务:
资源简介:
孟加拉文字用于书写孟加拉语和南亚东部的一些其他语言,如阿萨姆语和曼尼普里语。该文字在孟加拉和印度两个邻国拥有官方地位,是世界上使用量第六大的文字。它的字母集除了包含11个元音和39个辅音的50个基本字符外,还有多个变音符号和大量连词。为了满足孟加拉文字场景字符标准数据集对其场景文本识别的计划研究工作的要求,最近,印度统计局的计算机视觉和模式识别部门开发了一个孟加拉文字或其部分的此类数据集。研究所,加尔各答。它的样本是从使用各种数码相机在不同时间从印度西孟加拉邦的街道、小巷和小巷拍摄的 260 张户外场景图像中提取的。由于现实生活文本中几个孟加拉字符的出现统计非常低,我们在 Microsoft Power Point 软件的帮助下添加了几个人工创建的这些字符的样本。
提供机构:
OpenDataLab
创建时间:
2022-09-01
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集由印度统计研究所等单位开发,用于孟加拉文字符的场景文本识别研究。它包含从260张户外图像提取的字符样本,并添加人工样本以补充低频率字符。数据集于2014年发布,支持多语言场景字符识别任务。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作