five

bishopfunc/kanji-fonts-500

收藏
Hugging Face2026-03-01 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/bishopfunc/kanji-fonts-500
下载链接
链接失效反馈
官方服务:
资源简介:
--- language: - ja license: other task_categories: - image-to-image pretty_name: 常用漢字500字のGoogle Fontsデータセット size_categories: - 100K<n<1M --- # Dataset Card for kanji-fonts-500 ## Dataset Summary - このデータセットは、フォントのStyle Transferのタスクに使用できるように加工されたデータセットです。 - Google Fontsに収録されているフォントの中から、常用漢字の上位500字を抽出し、合計306種類のフォントで構成されています。 - 文字をアルファベット順に並べ、80%をseenchars、20%をunseencharsとしています。 - フォントをアルファベット順に並べ、80%をseenfonts、20%をunseenfontsとしています。 - 文字とフォント、つまりcontentとstyleの両方の汎用性を評価できるように、4つのサブセットに分割しています。 - データセットは以下のような4つのサブセットに分割されています。 - train(seenfonts_seenchars) - unseenfonts_seenchars - seenfonts_unseenchars - unseenfonts_unseenchars

--- 语言: ja 许可证: other 任务类别: - 图像到图像 数据集展示名: 常用汉字500字谷歌字体数据集 规模类别: - 100K<n<1M --- # 数据集卡片:kanji-fonts-500 ## 数据集概览 - 本数据集专为字体风格迁移(Style Transfer)任务优化适配,可直接用于相关研究与应用。 - 本数据集从谷歌字体(Google Fonts)收录的全量字体中,筛选提取常用汉字排名前500的字符,共涵盖306种不同字体。 - 按字母顺序对提取的汉字进行排序后,将其划分为80%的可见字符(seenchars)与20%的不可见字符(unseenchars)。 - 按字母顺序对收录的字体进行排序后,将其划分为80%的可见字体(seenfonts)与20%的不可见字体(unseenfonts)。 - 为实现对字符与字体(即内容content与风格style)泛化能力的全面评估,本数据集被划分为4个子集。 - 本数据集具体划分为以下4个子集: - 训练集(seenfonts_seenchars,可见字体与可见字符) - 不可见字体与可见字符子集(unseenfonts_seenchars) - 可见字体与不可见字符子集(seenfonts_unseenchars) - 不可见字体与不可见字符子集(unseenfonts_unseenchars)
提供机构:
bishopfunc
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作