pbevan11/GPT4V-captions-from-LVIS-typography

Name: pbevan11/GPT4V-captions-from-LVIS-typography
Creator: pbevan11
Published: 2024-03-21 19:28:00
License: 暂无描述

Hugging Face2024-03-21 更新2024-06-11 收录

下载链接：

https://hf-mirror.com/datasets/pbevan11/GPT4V-captions-from-LVIS-typography

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是LVIS数据集的一个子集，包含8,857个带有标题的图像，这些图像的标题准确反映了图像中的印刷文字。标题是通过Mistral-7B-OpenOrca模型从LVIS-Instruct4V数据集的指令生成的。数据集旨在用于改进文本到图像生成模型的拼写/印刷输出，并可用于评估图像生成模型的拼写输出。

提供机构：

pbevan11

原始信息汇总

数据集概述

名称: GPT4V-captions-from-LVIS-typography

创建者: Peter Bevan

创建日期: 21 March 2023

数据集来源: 该数据集是220k-GPT4Vision-captions-from-LIVIS的一个子集。

数据内容: 包含8,857个带有标题的图像，这些图像来自LVIS数据集，且标题准确反映了图像中的版式。

标题生成: 标题是通过总结LVIS-Instruct4V数据集并使用Mistral-7B-OpenOrca转换成标题的。每个图像提供短版和长版两种标题。

预期用途: 用于改进文本到图像生成模型的拼写/版式输出。

引用信息:

@misc {peter_j._bevan_2024, author = { {Peter J. Bevan} }, title = { GPT4V-captions-from-LVIS-typography (Revision 379a5f2) }, year = 2024, url = { https://huggingface.co/datasets/pbevan11/GPT4V-captions-from-LVIS-typography }, doi = { 10.57967/hf/1945 }, publisher = { Hugging Face } }

5,000+

优质数据集

54 个

任务类型

进入经典数据集