kinianlo/imagenet_embeddings
收藏Hugging Face2024-04-16 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/kinianlo/imagenet_embeddings
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含ImageNet中每张图像的嵌入向量。这些嵌入向量是通过OpenAI的CLIP模型(ViT-L/14变体)生成的,使用的是2021年冬季发布的完整ImageNet版本。数据集包含13,158,856张图像,索引文件`index.parquet`包含两列:`synset_id`和`image_id`,而嵌入向量则存储在`imagenet_ViT_L_14.npy`文件中,该文件是一个形状为(13,158,856, 768)的矩阵。
提供机构:
kinianlo
原始信息汇总
ImageNet Embeddings 数据集概述
数据集描述
- 名称: ImageNet embeddings
- 语言: 英语
- 大小类别: 10M<n<100M
数据内容
- 图像数量: 13,158,856 张
- 来源: ImageNet Winter 2021 完整版本,MD5:
ab313ce03179fd803a401b02c651c0a2 - 嵌入生成方法: OpenAI 的 CLIP 模型,使用 ViT-L/14 变体
文件结构
- 索引文件:
index.parquet,包含两列:synset_id和image_id - 嵌入文件:
imagenet_ViT_L_14.npy,形状为 (13,158,856, 768) 的矩阵 - 顺序一致性:
index.parquet中的条目顺序与.npy文件中的顺序完全一致



