five

kinianlo/imagenet_embeddings

收藏
Hugging Face2024-04-16 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/kinianlo/imagenet_embeddings
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含ImageNet中每张图像的嵌入向量。这些嵌入向量是通过OpenAI的CLIP模型(ViT-L/14变体)生成的,使用的是2021年冬季发布的完整ImageNet版本。数据集包含13,158,856张图像,索引文件`index.parquet`包含两列:`synset_id`和`image_id`,而嵌入向量则存储在`imagenet_ViT_L_14.npy`文件中,该文件是一个形状为(13,158,856, 768)的矩阵。
提供机构:
kinianlo
原始信息汇总

ImageNet Embeddings 数据集概述

数据集描述

  • 名称: ImageNet embeddings
  • 语言: 英语
  • 大小类别: 10M<n<100M

数据内容

  • 图像数量: 13,158,856 张
  • 来源: ImageNet Winter 2021 完整版本,MD5: ab313ce03179fd803a401b02c651c0a2
  • 嵌入生成方法: OpenAI 的 CLIP 模型,使用 ViT-L/14 变体

文件结构

  • 索引文件: index.parquet,包含两列:synset_idimage_id
  • 嵌入文件: imagenet_ViT_L_14.npy,形状为 (13,158,856, 768) 的矩阵
  • 顺序一致性: index.parquet 中的条目顺序与 .npy 文件中的顺序完全一致
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作