bishopfunc/kanji-fonts-500
收藏Hugging Face2026-03-01 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/bishopfunc/kanji-fonts-500
下载链接
链接失效反馈官方服务:
资源简介:
---
language:
- ja
license: other
task_categories:
- image-to-image
pretty_name: 常用漢字500字のGoogle Fontsデータセット
size_categories:
- 100K<n<1M
---
# Dataset Card for kanji-fonts-500
## Dataset Summary
- このデータセットは、フォントのStyle Transferのタスクに使用できるように加工されたデータセットです。
- Google Fontsに収録されているフォントの中から、常用漢字の上位500字を抽出し、合計306種類のフォントで構成されています。
- 文字をアルファベット順に並べ、80%をseenchars、20%をunseencharsとしています。
- フォントをアルファベット順に並べ、80%をseenfonts、20%をunseenfontsとしています。
- 文字とフォント、つまりcontentとstyleの両方の汎用性を評価できるように、4つのサブセットに分割しています。
- データセットは以下のような4つのサブセットに分割されています。
- train(seenfonts_seenchars)
- unseenfonts_seenchars
- seenfonts_unseenchars
- unseenfonts_unseenchars
---
语言: ja
许可证: other
任务类别:
- 图像到图像
数据集展示名: 常用汉字500字谷歌字体数据集
规模类别:
- 100K<n<1M
---
# 数据集卡片:kanji-fonts-500
## 数据集概览
- 本数据集专为字体风格迁移(Style Transfer)任务优化适配,可直接用于相关研究与应用。
- 本数据集从谷歌字体(Google Fonts)收录的全量字体中,筛选提取常用汉字排名前500的字符,共涵盖306种不同字体。
- 按字母顺序对提取的汉字进行排序后,将其划分为80%的可见字符(seenchars)与20%的不可见字符(unseenchars)。
- 按字母顺序对收录的字体进行排序后,将其划分为80%的可见字体(seenfonts)与20%的不可见字体(unseenfonts)。
- 为实现对字符与字体(即内容content与风格style)泛化能力的全面评估,本数据集被划分为4个子集。
- 本数据集具体划分为以下4个子集:
- 训练集(seenfonts_seenchars,可见字体与可见字符)
- 不可见字体与可见字符子集(unseenfonts_seenchars)
- 可见字体与不可见字符子集(seenfonts_unseenchars)
- 不可见字体与不可见字符子集(unseenfonts_unseenchars)
提供机构:
bishopfunc



