semantic-cifar100

Hugging Face2026-01-11 更新2026-01-12 收录

下载链接：

https://huggingface.co/datasets/spaicom-lab/semantic-cifar100

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集存储了针对cifar100数据集的预计算嵌入（float32），涵盖了多个timm模型。每个配置对应一个特定的模型，仅包含该模型的Parquet文件。数据集包含训练集和测试集，每个样本包含id、label、model_name和embedding字段。嵌入是通过timm.resolve_data_config和create_transform生成的，以适应不同模型的需求。

创建时间：

2025-12-30

原始信息汇总

数据集概述

基本信息

数据集名称: Latents for cifar100 (timm)
数据集地址: https://huggingface.co/datasets/spaicom-lab/semantic-cifar100
描述: 该仓库托管了 cifar100 数据在多个 timm 模型上的预计算嵌入（float32 格式）。每个数据集配置对应一个单独的模型；在 load_dataset 时仅读取该模型的 Parquet 文件。

数据集配置

数据集包含多个配置，每个配置对应一个特定的视觉 Transformer (ViT) 模型变体及其预训练权重。所有配置均包含训练集（train）和测试集（test）分割。

配置列表

vit_small_patch14_dinov2.lvd142m
vit_small_patch14_reg4_dinov2.lvd142m
vit_small_patch16_224.augreg_in1k
vit_small_patch16_224.augreg_in21k
vit_small_patch16_224.augreg_in21k_ft_in1k
vit_small_patch16_224.dino
vit_small_patch16_384.augreg_in1k
vit_small_patch16_384.augreg_in21k_ft_in1k
vit_small_patch16_dinov3.lvd1689m
vit_small_patch16_dinov3_qkvb.lvd1689m
vit_small_patch16_rope_224.naver_in1k
vit_small_patch16_rope_ape_224.naver_in1k
vit_small_patch16_rope_mixed_224.naver_in1k
vit_small_patch16_rope_mixed_ape_224.naver_in1k
vit_small_patch32_224.augreg_in21k
vit_small_patch32_224.augreg_in21k_ft_in1k
vit_small_patch32_384.augreg_in21k_ft_in1k
vit_small_patch8_224.dino
vit_small_plus_patch16_dinov3.lvd1689m
vit_small_plus_patch16_dinov3_qkvb.lvd1689m
vit_small_r26_s32_224.augreg_in21k
vit_small_r26_s32_224.augreg_in21k_ft_in1k
vit_small_r26_s32_384.augreg_in21k_ft_in1k
vit_tiny_patch16_224.augreg_in21k
vit_tiny_patch16_224.augreg_in21k_ft_in1k
vit_tiny_patch16_384.augreg_in21k_ft_in1k
vit_tiny_r_s16_p8_224.augreg_in21k
vit_tiny_r_s16_p8_224.augreg_in21k_ft_in1k
vit_tiny_r_s16_p8_384.augreg_in21k_ft_in1k

数据模式

每个数据样本包含以下字段：

id: uint32 类型。
label: int64 类型。
model_name: large_string 类型。
embedding: fixed_size_list<float32>[D] 类型，其中维度 D 因模型而异。

使用方法

使用 datasets 库加载数据。需要指定数据集名称、配置名称和分割。 python from datasets import load_dataset ds_train = load_dataset("spaicom-lab/semantic-cifar100", "vit_small_patch14_dinov2.lvd142m", split="train") ds_test = load_dataset("spaicom-lab/semantic-cifar100", "vit_small_patch14_dinov2.lvd142m", split="test")

技术说明

嵌入是使用 timm.resolve_data_config 和 create_transform 生成的，以使数据集适应特定模型的要求。
数据文件格式为 Parquet。

搜集汇总

数据集介绍

构建方式

在计算机视觉领域，预计算嵌入已成为提升模型训练效率的关键手段。semantic-cifar100数据集的构建，基于经典的CIFAR-100图像数据集，通过timm库中的多种视觉Transformer模型进行特征提取。具体而言，每个模型均采用其对应的数据配置与变换流程，将原始图像转化为高维语义向量，并以Parquet格式存储，确保了嵌入向量的规范性与可复用性。

特点

该数据集的核心特点在于其丰富的模型覆盖与标准化的嵌入表示。它囊括了从ViT-Tiny到ViT-Small等多种架构变体，包括DINOv2、DINOv3及不同预训练策略下的模型，为对比研究提供了统一基准。每个配置均包含训练集与测试集划分，嵌入向量以固定大小的浮点数组形式存储，维度随模型而异，同时保留了样本标识与类别标签，便于下游任务直接调用。

使用方法

为便利研究者高效利用该资源，数据集通过Hugging Face的datasets库提供标准化接口。用户仅需指定目标模型配置名称与数据划分，即可加载对应的嵌入数据。例如，调用vit_small_patch14_dinov2.lvd142m配置，能够获取该模型在CIFAR-100上提取的特征表示，进而用于分类、检索或表示学习等任务的快速原型开发与实验验证。

背景与挑战

背景概述

在计算机视觉与深度学习领域，预训练模型的中间表示（即潜在特征）对于迁移学习与模型分析具有关键价值。semantic-cifar100数据集由spaicom-lab团队构建，其核心研究问题在于为经典的CIFAR-100图像分类基准提供多模型、标准化的特征嵌入集合。该数据集通过集成timm库中的多种视觉Transformer架构（如ViT、DINOv2、DINOv3等），生成了对应不同模型配置的预计算嵌入，旨在促进模型比较、特征可重用性以及下游任务的高效微调研究，从而在视觉表示学习领域推动模型解释性与效率的探索。

当前挑战

该数据集致力于解决图像分类领域中模型特征迁移与复现的挑战，具体体现在如何统一不同视觉Transformer架构的输出表示，并确保嵌入的兼容性与一致性。在构建过程中，面临的主要挑战包括：适配多样化的模型输入规范（如分辨率、预处理流程），处理大规模嵌入数据的高效存储与读取，以及维护多配置版本下数据结构的标准化。这些技术难点要求精密的工程实现，以保障数据集的可靠性与易用性。

常用场景

经典使用场景

在计算机视觉领域，预训练模型的语义嵌入已成为表征学习的关键资源。semantic-cifar100数据集通过提供CIFAR-100图像在多种timm模型下的预计算嵌入，为研究者构建了一个高效的基准测试平台。其经典使用场景聚焦于视觉表征的对比分析与模型性能评估，研究人员能够直接利用这些高维语义特征，避免重复计算开销，从而专注于下游任务的算法设计与优化。

衍生相关工作

围绕该数据集衍生的经典工作主要集中在嵌入空间的可视化分析与跨模型知识迁移领域。部分研究利用其多模型嵌入对比，揭示了不同预训练策略对语义簇形成的影响机制；另有工作基于其统一格式的特征数据，开发了模型融合与特征蒸馏的新方法。这些成果进一步丰富了视觉表征学习的理论框架，并为轻量化模型设计提供了实证依据。

数据集最近研究