five

image-text-pairs-ja-cc0

收藏
魔搭社区2025-12-05 更新2025-08-16 收录
下载链接:
https://modelscope.cn/datasets/alfredplpl/image-text-pairs-ja-cc0
下载链接
链接失效反馈
官方服务:
资源简介:
# Japanese Glyph Images with English Captions (CC0) This dataset contains Japanese glyph images rendered with **black text on white background**. Each `.png` image has a corresponding `.txt` file with an English caption: ``` This image is saying "<Japanese>". The background is white. The letter is black. ``` ## Structure - `train/` — PNG images and matching TXT captions (same base filename) - `provenance/assets_registry.csv` — Fonts and license info - `LICENSE.txt` — CC0-1.0 license ## Generation Script The dataset was generated with a custom Python script using: - [Pillow](https://pypi.org/project/Pillow/) ## License CC0-1.0 — Public Domain Dedication.

# 带英文标注的日文字形图像数据集(CC0) 本数据集包含以**白底黑字**形式渲染的日文字形图像。 每张`.png`格式图像均配有同名的`.txt`格式标注文件,其英文标注遵循固定格式: 该图像对应"<日文>". 背景为白色。文字颜色为黑色。 ## 目录结构 - `train/`:存储PNG图像及匹配的TXT标注文件(二者文件名前缀完全一致) - `provenance/assets_registry.csv`:记录字体及许可证信息的CSV文件 - `LICENSE.txt`:CC0-1.0许可证文件 ## 生成脚本 本数据集通过自定义Python脚本生成,依赖[Pillow](https://pypi.org/project/Pillow/)图像处理库。 ## 许可证 采用CC0-1.0公有领域授权协议。
提供机构:
maas
创建时间:
2025-08-15
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作