five

bishopfunc/kanji-fonts-500-elements

收藏
Hugging Face2026-04-06 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/bishopfunc/kanji-fonts-500-elements
下载链接
链接失效反馈
官方服务:
资源简介:
--- language: - ja license: other task_categories: - image-to-image pretty_name: 常用漢字500字のGoogle Fontsデータセット(要素分解版) size_categories: - 100K<n<1M --- # Dataset Card for kanji-fonts-500-elements ## Dataset Summary - このデータセットは、フォントのStyle Transferのタスクに使用できるように加工されたデータセットです。 - Google Fontsに収録されているフォントの中から、常用漢字の上位500字を抽出し、各文字を要素(部品)ごとに分解した画像を含みます。 - 各フォント・ウェイトの組み合わせごとにディレクトリが作成されており、`{font_name}_{weight}/` という構成になっています。 - 各文字につき以下の2種類の画像が含まれます: - `{char}_full.png` : 文字全体の画像 - `{char}_{id}.png` : 要素(部品)ごとに分解した画像 ## Splits - 文字をアルファベット順に並べ、80%を seen_chars、20%を unseen_chars としています。 - フォント名(ウェイトを除く)をアルファベット順に並べ、80%を seen_fonts、20%を unseen_fonts としています。 - 同一フォントファミリーの全ウェイトは同じ seen/unseen グループに属します。 - 文字とフォント、つまり content と style の両方の汎用性を評価できるように、4つのサブセットに分割しています。 | Split | フォント | 文字 | |---|---|---| | `train` | seen | seen | | `seen_font_unseen_char` | seen | unseen | | `unseen_font_seen_char` | unseen | seen | | `unseen_font_unseen_char` | unseen | unseen | ## Dataset Structure ``` element-kanji-fonts-500/ └── {font_name}_{weight}/ ├── {char}_full.png # 文字全体 ├── {char}_0.png # 要素 0 ├── {char}_1.png # 要素 1 └── ... ``` ## Metadata Fields | Field | 説明 | |---|---| | `file_name` | ファイルの相対パス | | `font_name` | フォント名(ウェイトを除く) | | `weight` | フォントウェイト | | `char` | 文字 | | `image_type` | `full`(全体画像)または `element`(要素画像) | | `element_id` | 要素画像の場合のID(`image_type` が `full` の場合は空) | | `split` | データ分割ラベル |
提供机构:
bishopfunc
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作