image-text-pairs-ja-cc0
收藏魔搭社区2025-12-05 更新2025-08-16 收录
下载链接:
https://modelscope.cn/datasets/alfredplpl/image-text-pairs-ja-cc0
下载链接
链接失效反馈官方服务:
资源简介:
# Japanese Glyph Images with English Captions (CC0)
This dataset contains Japanese glyph images rendered with **black text on white background**.
Each `.png` image has a corresponding `.txt` file with an English caption:
```
This image is saying "<Japanese>". The background is white. The letter is black.
```
## Structure
- `train/` — PNG images and matching TXT captions (same base filename)
- `provenance/assets_registry.csv` — Fonts and license info
- `LICENSE.txt` — CC0-1.0 license
## Generation Script
The dataset was generated with a custom Python script using:
- [Pillow](https://pypi.org/project/Pillow/)
## License
CC0-1.0 — Public Domain Dedication.
# 带英文标注的日文字形图像数据集(CC0)
本数据集包含以**白底黑字**形式渲染的日文字形图像。
每张`.png`格式图像均配有同名的`.txt`格式标注文件,其英文标注遵循固定格式:
该图像对应"<日文>". 背景为白色。文字颜色为黑色。
## 目录结构
- `train/`:存储PNG图像及匹配的TXT标注文件(二者文件名前缀完全一致)
- `provenance/assets_registry.csv`:记录字体及许可证信息的CSV文件
- `LICENSE.txt`:CC0-1.0许可证文件
## 生成脚本
本数据集通过自定义Python脚本生成,依赖[Pillow](https://pypi.org/project/Pillow/)图像处理库。
## 许可证
采用CC0-1.0公有领域授权协议。
提供机构:
maas
创建时间:
2025-08-15



