bishopfunc/kanji-fonts-500-elements
收藏Hugging Face2026-04-06 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/bishopfunc/kanji-fonts-500-elements
下载链接
链接失效反馈官方服务:
资源简介:
---
language:
- ja
license: other
task_categories:
- image-to-image
pretty_name: 常用漢字500字のGoogle Fontsデータセット(要素分解版)
size_categories:
- 100K<n<1M
---
# Dataset Card for kanji-fonts-500-elements
## Dataset Summary
- このデータセットは、フォントのStyle Transferのタスクに使用できるように加工されたデータセットです。
- Google Fontsに収録されているフォントの中から、常用漢字の上位500字を抽出し、各文字を要素(部品)ごとに分解した画像を含みます。
- 各フォント・ウェイトの組み合わせごとにディレクトリが作成されており、`{font_name}_{weight}/` という構成になっています。
- 各文字につき以下の2種類の画像が含まれます:
- `{char}_full.png` : 文字全体の画像
- `{char}_{id}.png` : 要素(部品)ごとに分解した画像
## Splits
- 文字をアルファベット順に並べ、80%を seen_chars、20%を unseen_chars としています。
- フォント名(ウェイトを除く)をアルファベット順に並べ、80%を seen_fonts、20%を unseen_fonts としています。
- 同一フォントファミリーの全ウェイトは同じ seen/unseen グループに属します。
- 文字とフォント、つまり content と style の両方の汎用性を評価できるように、4つのサブセットに分割しています。
| Split | フォント | 文字 |
|---|---|---|
| `train` | seen | seen |
| `seen_font_unseen_char` | seen | unseen |
| `unseen_font_seen_char` | unseen | seen |
| `unseen_font_unseen_char` | unseen | unseen |
## Dataset Structure
```
element-kanji-fonts-500/
└── {font_name}_{weight}/
├── {char}_full.png # 文字全体
├── {char}_0.png # 要素 0
├── {char}_1.png # 要素 1
└── ...
```
## Metadata Fields
| Field | 説明 |
|---|---|
| `file_name` | ファイルの相対パス |
| `font_name` | フォント名(ウェイトを除く) |
| `weight` | フォントウェイト |
| `char` | 文字 |
| `image_type` | `full`(全体画像)または `element`(要素画像) |
| `element_id` | 要素画像の場合のID(`image_type` が `full` の場合は空) |
| `split` | データ分割ラベル |
提供机构:
bishopfunc



