pbevan11/GPT4V-captions-from-LVIS-typography
收藏Hugging Face2024-03-21 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/pbevan11/GPT4V-captions-from-LVIS-typography
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是LVIS数据集的一个子集,包含8,857个带有标题的图像,这些图像的标题准确反映了图像中的印刷文字。标题是通过Mistral-7B-OpenOrca模型从LVIS-Instruct4V数据集的指令生成的。数据集旨在用于改进文本到图像生成模型的拼写/印刷输出,并可用于评估图像生成模型的拼写输出。
该数据集是LVIS数据集的一个子集,包含8,857个带有标题的图像,这些图像的标题准确反映了图像中的印刷文字。标题是通过Mistral-7B-OpenOrca模型从LVIS-Instruct4V数据集的指令生成的。数据集旨在用于改进文本到图像生成模型的拼写/印刷输出,并可用于评估图像生成模型的拼写输出。
提供机构:
pbevan11
原始信息汇总
数据集概述
名称: GPT4V-captions-from-LVIS-typography
创建者: Peter Bevan
创建日期: 21 March 2023
数据集来源: 该数据集是220k-GPT4Vision-captions-from-LIVIS的一个子集。
数据内容: 包含8,857个带有标题的图像,这些图像来自LVIS数据集,且标题准确反映了图像中的版式。
标题生成: 标题是通过总结LVIS-Instruct4V数据集并使用Mistral-7B-OpenOrca转换成标题的。每个图像提供短版和长版两种标题。
预期用途: 用于改进文本到图像生成模型的拼写/版式输出。
引用信息:
@misc {peter_j._bevan_2024, author = { {Peter J. Bevan} }, title = { GPT4V-captions-from-LVIS-typography (Revision 379a5f2) }, year = 2024, url = { https://huggingface.co/datasets/pbevan11/GPT4V-captions-from-LVIS-typography }, doi = { 10.57967/hf/1945 }, publisher = { Hugging Face } }



