wendlerc/CaptionedSynthText
收藏Hugging Face2023-07-05 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/wendlerc/CaptionedSynthText
下载链接
链接失效反馈官方服务:
资源简介:
*This dataset has been created by Stability AI and LAION.*
[SynthText](https://www.robots.ox.ac.uk/~vgg/data/scenetext/) is a popular OCR dataset, where random texts are rendered into random locations in images based on depth maps.
In this dataset, we additionally computed image captions using [BLIP2](https://huggingface.co/Salesforce/blip2-opt-6.7b).

**Caption: "a close up of a leopard's face with a blurry background"**
提供机构:
wendlerc
原始信息汇总
数据集概述
创建者
- Stability AI
- LAION
数据集类型
- OCR(光学字符识别)数据集
数据集特点
- 使用SynthText方法生成,其中随机文本根据深度图渲染到图像的随机位置。
- 额外计算了图像的标题,使用BLIP2模型(Salesforce/blip2-opt-6.7b)生成。
示例预览
- 图像标题:"a close up of a leopards face with a blurry background"



