AlexWortega/InstructCaptions2
收藏Hugging Face2023-12-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/AlexWortega/InstructCaptions2
下载链接
链接失效反馈官方服务:
资源简介:
InstructImages数据集遵循Dalle3论文的风格创建,首先使用LVM(在本例中为Llava13b)为所有图像添加标注,然后使用GPT4改进这些标注。此外,创建者计划未来开源一个基于这些图像的RLAIF管道。数据集包含图像和文本两种数据类型,训练集包含22776个示例,总大小为33059118217.928字节,下载大小为33273147003字节。数据集使用Apache 2.0许可证,主要语言为英语。
InstructImages数据集遵循Dalle3论文的风格创建,首先使用LVM(在本例中为Llava13b)为所有图像添加标注,然后使用GPT4改进这些标注。此外,创建者计划未来开源一个基于这些图像的RLAIF管道。数据集包含图像和文本两种数据类型,训练集包含22776个示例,总大小为33059118217.928字节,下载大小为33273147003字节。数据集使用Apache 2.0许可证,主要语言为英语。
提供机构:
AlexWortega
原始信息汇总
数据集概述
数据集信息
- 特征:
image: 图像类型text: 字符串类型
- 分割:
train: 训练集- 字节数: 33059118217.928
- 样本数: 22776
- 下载大小: 33273147003
- 数据集大小: 33059118217.928
配置
- 配置名称: default
- 数据文件:
train: data/train-*
- 数据文件:
许可证
apache-2.0
语言
en
数据集名称
InstructImages



