five

AMFDS (Arabic Multi-Fonts Dataset)

收藏
OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/AMFDS
下载链接
链接失效反馈
官方服务:
资源简介:
阿拉伯多字体数据集 一种多字多字体阿拉伯字-图像数据集 AMDS是阿拉伯单词图像的数据集。 数据集是使用TextImagesToolkit生成的 https://github.com/msfasha/TextImagesToolkit. 数据库由许多二进制文件和文本文件组成。 二进制文件以二进制格式存储所有图像文件。 文本文件包括有关图像字和该图像在二进制文件中的位置的信息。 二进制文件格式除了适用于大量图像的更快的加载过程外,还适用于将图像传输到云中。 有关数据集的更多信息,请访问: https://github.com/msfasha/阿拉伯语-多字体-数据集/编辑/main/README.md

Arabic Multi-Font Dataset A multi-word, multi-font Arabic word-image dataset AMDS is a dataset comprised of Arabic word images. It was generated using the TextImagesToolkit, whose repository is available at https://github.com/msfasha/TextImagesToolkit. The dataset consists of numerous binary files and accompanying text files. All image files are stored in binary format within these binary files. The text files provide details about the words depicted in the images and the byte offset positions of each image within its corresponding binary file. This binary file format enables faster loading of large volumes of images, as well as efficient transfer of images to cloud environments. For more information about this dataset, please visit: https://github.com/msfasha/阿拉伯语-多字体-数据集/编辑/main/README.md
提供机构:
OpenDataLab
创建时间:
2022-06-07
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
AMFDS是一个用于阿拉伯单词识别的多字体图像数据集,通过TextImagesToolkit生成,采用二进制文件格式以提高加载和传输效率。该数据集由约旦大学于2020年发布,支持相关深度学习研究。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作