scene-genie/captioned-instagram-dataset-big
收藏Hugging Face2024-03-25 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/scene-genie/captioned-instagram-dataset-big
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含用户信息、边界框信息、图像尺寸、预测类别、置信度、检测ID等特征。数据集还包含训练集的分割信息,如字节大小和示例数量。数据集的下载大小和总大小也有详细说明。
该数据集包含用户信息、边界框信息、图像尺寸、预测类别、置信度、检测ID等特征。数据集还包含训练集的分割信息,如字节大小和示例数量。数据集的下载大小和总大小也有详细说明。
提供机构:
scene-genie
原始信息汇总
数据集概述
数据集特征
- user: 数据类型为字符串。
- bounding_box: 结构化数据,包含以下子特征:
- image: 包含图像的尺寸信息,具体为:
- height: 数据类型为整数。
- width: 数据类型为整数。
- predictions: 列表类型,包含多个预测结果,每个结果包括:
- class: 数据类型为字符串。
- class_id: 数据类型为整数。
- confidence: 数据类型为浮点数。
- detection_id: 数据类型为字符串。
- height: 数据类型为浮点数。
- width: 数据类型为浮点数。
- x: 数据类型为浮点数。
- y: 数据类型为浮点数。
- processed: 数据类型为布尔值。
- time: 数据类型为浮点数。
- image: 包含图像的尺寸信息,具体为:
- resized_image: 数据类型为图像。
- caption: 数据类型为字符串。
- gpt4caption: 数据类型为字符串。
数据集分割
- train: 训练集,包含23237个样本,数据大小为7657038649.19字节。
数据集大小
- 下载大小: 7635864734字节。
- 数据集总大小: 7657038649.19字节。
配置
- default: 配置文件中包含训练数据的路径,格式为
data/train-*。



