five

pbevan11/GPT4V-captions-from-LVIS-typography

收藏
Hugging Face2024-03-21 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/pbevan11/GPT4V-captions-from-LVIS-typography
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是LVIS数据集的一个子集,包含8,857个带有标题的图像,这些图像的标题准确反映了图像中的印刷文字。标题是通过Mistral-7B-OpenOrca模型从LVIS-Instruct4V数据集的指令生成的。数据集旨在用于改进文本到图像生成模型的拼写/印刷输出,并可用于评估图像生成模型的拼写输出。

该数据集是LVIS数据集的一个子集,包含8,857个带有标题的图像,这些图像的标题准确反映了图像中的印刷文字。标题是通过Mistral-7B-OpenOrca模型从LVIS-Instruct4V数据集的指令生成的。数据集旨在用于改进文本到图像生成模型的拼写/印刷输出,并可用于评估图像生成模型的拼写输出。
提供机构:
pbevan11
原始信息汇总

数据集概述

名称: GPT4V-captions-from-LVIS-typography

创建者: Peter Bevan

创建日期: 21 March 2023

数据集来源: 该数据集是220k-GPT4Vision-captions-from-LIVIS的一个子集。

数据内容: 包含8,857个带有标题的图像,这些图像来自LVIS数据集,且标题准确反映了图像中的版式。

标题生成: 标题是通过总结LVIS-Instruct4V数据集并使用Mistral-7B-OpenOrca转换成标题的。每个图像提供短版和长版两种标题。

预期用途: 用于改进文本到图像生成模型的拼写/版式输出。

引用信息:

@misc {peter_j._bevan_2024, author = { {Peter J. Bevan} }, title = { GPT4V-captions-from-LVIS-typography (Revision 379a5f2) }, year = 2024, url = { https://huggingface.co/datasets/pbevan11/GPT4V-captions-from-LVIS-typography }, doi = { 10.57967/hf/1945 }, publisher = { Hugging Face } }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作