five

google_fonts

收藏
Hugging Face2026-03-18 更新2026-03-20 收录
下载链接:
https://huggingface.co/datasets/kargaranamir/google_fonts
下载链接
链接失效反馈
官方服务:
资源简介:
Google Fonts 数据集是一个按脚本(script)组织的结构化 Google 字体集合。数据集使用 ISO/Unicode 脚本标识符对字体进行分类,每个脚本目录包含属于该脚本家族的字体。该数据集适用于排版研究、多语言 OCR、字体分类、文档生成、多语言渲染管道以及语言/脚本识别实验等场景。数据集涵盖了广泛的书写系统,包括阿拉伯文(Arab)、拉丁文(Latn)、西里尔文(Cyrl)、梵文(Deva)、希腊文(Grek)、希伯来文(Hebr)、韩文(Hang)、日文(Jpan、Hira、Kana)、中文(Hans、Hant、Hani)、泰文(Thai)、格鲁吉亚文(Geor)、亚美尼亚文(Armn)、埃塞俄比亚文(Ethi)、孟加拉文(Beng)、泰米尔文(Taml)、泰卢固文(Telu)等 100 多种脚本目录。字体以压缩文件夹形式按脚本代码组织,每个脚本文件夹包含多个字体系列。数据集采用 SIL Open Font License (OFL) 许可,可通过 git clone 下载。

The Google Fonts Dataset is a structured collection of Google fonts organized by script. The dataset classifies fonts using ISO/Unicode script identifiers, with each script directory containing fonts belonging to that script family. This dataset is suitable for scenarios including typography research, multilingual OCR, font classification, document generation, multilingual rendering pipelines, and language/script recognition experiments. The dataset covers a wide range of writing systems, with over 100 script directories such as Arabic (Arab), Latin (Latn), Cyrillic (Cyrl), Devanagari (Deva), Greek (Grek), Hebrew (Hebr), Hangul (Hang), Japanese (Jpan, Hira, Kana), Chinese (Hans, Hant, Hani), Thai (Thai), Georgian (Geor), Armenian (Armn), Ethiopic (Ethi), Bengali (Beng), Tamil (Taml), and Telugu (Telu). Fonts are organized by script code in compressed folder format, with each script folder containing multiple font families. The dataset is licensed under the SIL Open Font License (OFL) and can be downloaded via git clone.
创建时间:
2026-03-15
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作