five

semantic-tiny-imagenet

收藏
Hugging Face2026-02-13 更新2026-02-14 收录
下载链接:
https://huggingface.co/datasets/spaicom-lab/semantic-tiny-imagenet
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含针对 'tiny-imagenet' 数据集通过多种 'timm' 模型预计算得到的嵌入表示。数据集包含多个配置项,每个配置对应一个特定的模型,数据以 Parquet 文件格式存储。用户可以通过指定模型配置来加载对应的训练数据。该数据集适用于需要利用预训练模型嵌入进行图像表示学习的任务。
创建时间:
2026-02-11
原始信息汇总

数据集概述

基本信息

  • 数据集名称: Latents for tiny-imagenet (timm)
  • 数据集地址: https://huggingface.co/datasets/spaicom-lab/semantic-tiny-imagenet
  • 数据集描述: 该数据集托管了 tiny-imagenet 数据在多个 timm 模型上的预计算嵌入

数据集结构

  • 数据格式: Parquet 文件
  • 数据划分: 包含 traintest 划分
  • 配置数量: 提供 38 个不同的配置,每个配置对应一个特定的 timm 模型。

配置列表

  1. aimv2_huge_patch14_224.apple_pt
  2. aimv2_huge_patch14_336.apple_pt
  3. aimv2_huge_patch14_448.apple_pt
  4. aimv2_large_patch14_224.apple_pt
  5. aimv2_large_patch14_224.apple_pt_dist
  6. aimv2_large_patch14_336.apple_pt
  7. aimv2_large_patch14_336.apple_pt_dist
  8. aimv2_large_patch14_448.apple_pt
  9. bat_resnext26ts.ch_in1k
  10. beit3_base_patch16_224.in22k_ft_in1k
  11. beit3_base_patch16_224.indomain_in22k_ft_in1k
  12. beit3_base_patch16_224.indomain_pt
  13. beit3_base_patch16_224.pt
  14. beit3_large_patch16_224.in22k_ft_in1k
  15. beit3_large_patch16_224.indomain_in22k_ft_in1k
  16. beit3_large_patch16_224.indomain_pt
  17. beit3_large_patch16_224.pt
  18. beit_base_patch16_224.in22k_ft_in22k
  19. beit_base_patch16_224.in22k_ft_in22k_in1k
  20. beit_base_patch16_384.in22k_ft_in22k_in1k
  21. beit_large_patch16_224.in22k_ft_in22k
  22. beit_large_patch16_224.in22k_ft_in22k_in1k
  23. beit_large_patch16_384.in22k_ft_in22k_in1k
  24. beit_large_patch16_512.in22k_ft_in22k_in1k
  25. beitv2_base_patch16_224.in1k_ft_in1k
  26. beitv2_base_patch16_224.in1k_ft_in22k
  27. beitv2_base_patch16_224.in1k_ft_in22k_in1k
  28. beitv2_large_patch16_224.in1k_ft_in1k
  29. xception41.tf_in1k
  30. xception41p.ra3_in1k
  31. xception65.ra3_in1k
  32. xception65.tf_in1k
  33. xception65p.ra3_in1k
  34. xception71.tf_in1k
  35. xcit_large_24_p16_224.fb_dist_in1k
  36. xcit_large_24_p16_224.fb_in1k
  37. xcit_large_24_p16_384.fb_dist_in1k
  38. xcit_large_24_p8_224.fb_dist_in1k

使用方式

加载数据集时,需指定数据集名称、配置名称和数据划分。 python from datasets import load_dataset ds_train = load_dataset("spaicom-lab/semantic-tiny-imagenet", "xception41.tf_in1k", split="train") ds_test = load_dataset("spaicom-lab/semantic-tiny-imagenet", "xception41.tf_in1k", split="test")

注意事项

  • 每个数据集配置对应一个单一的模型;在 load_dataset 时仅读取该模型的 Parquet 文件。
  • 配置是根据 Hub 上实际已上传的 Parquet 文件生成的。
搜集汇总
数据集介绍
main_image_url
构建方式
在计算机视觉领域,预计算嵌入已成为提升模型训练效率的关键策略。semantic-tiny-imagenet数据集基于经典的tiny-imagenet图像分类数据集,通过timm库中的多种先进视觉Transformer和卷积神经网络模型,对原始图像进行前向传播,提取其高维语义表示。这些嵌入以Parquet文件格式存储,每个配置文件对应一个特定模型架构及其预训练权重版本,确保了嵌入向量的准确性和一致性,为后续的机器学习任务提供了可直接利用的深度特征。
特点
该数据集的核心特征在于其广泛的模型覆盖与标准化的数据组织。它集成了包括AIM、BEiT、Xception等在内的数十种前沿视觉模型,涵盖了不同尺寸的补丁分辨率与多种预训练范式,如ImageNet-1k、ImageNet-22k上的微调或蒸馏版本。所有嵌入均以Parquet格式封装,支持高效的数据加载与并行处理。这种设计使得研究者能够便捷地跨模型比较语义表示的质量,或直接将其作为下游任务的输入,避免了重复计算原始图像嵌入的资源消耗。
使用方法
为利用该数据集进行实验,用户需通过Hugging Face的datasets库加载指定配置。在调用load_dataset函数时,需明确数据集名称、对应的模型配置名称以及训练或测试划分。加载后的数据集对象可直接集成到PyTorch或TensorFlow等深度学习框架中,作为特征提取器或监督学习的输入。这种使用方法不仅简化了特征工程流程,还支持快速原型设计与模型评估,尤其适用于对比不同预训练模型在相同数据上的语义编码能力。
背景与挑战
背景概述
在计算机视觉领域,预训练模型的特征表示已成为推动下游任务性能提升的关键因素。semantic-tiny-imagenet数据集应运而生,由spaicom-lab团队构建,旨在为tiny-imagenet图像集提供多模型预计算的语义嵌入。该数据集汇集了包括AIM、BEiT、Xception等在内的众多先进视觉Transformer与卷积神经网络模型,覆盖了不同架构与训练策略下的特征空间。其核心研究问题聚焦于如何高效地利用预训练模型的深层语义信息,以支持图像分类、检索及表示学习等任务的快速原型开发与基准测试,从而减少重复计算开销,加速视觉表征研究的迭代进程。
当前挑战
该数据集致力于解决图像表征学习中模型特征复用与标准化访问的挑战,其核心在于如何确保跨模型嵌入的可比性与一致性,以及处理高维特征空间中的语义对齐问题。在构建过程中,面临多重技术障碍:需协调众多异构模型架构的输出格式,统一为Parquet数据文件;同时,必须保证大规模嵌入计算的资源效率与存储优化,避免数据冗余。此外,维护数据集版本与上游模型更新的同步性,以及验证不同配置下嵌入质量的可靠性,亦是持续存在的工程难题。
常用场景
经典使用场景
在计算机视觉领域,预训练模型的特征提取能力是评估模型性能的关键环节。semantic-tiny-imagenet数据集通过提供多种timm模型在tiny-imagenet上的预计算嵌入,为研究人员提供了一个标准化的特征表示基准。该数据集常用于模型对比分析、特征可视化以及迁移学习实验,使得研究者能够直接利用高质量的语义特征,避免重复计算,显著提升实验效率。
解决学术问题
该数据集有效解决了视觉表示学习中模型特征一致性评估的难题。传统方法需要研究者自行运行模型生成嵌入,过程繁琐且易受环境差异影响。semantic-tiny-imagenet通过提供统一格式的预计算特征,确保了实验的可复现性,并支持跨模型的特征质量比较。这为研究模型架构对语义表示的影响、探索特征空间的几何特性等基础问题提供了可靠数据支撑。
衍生相关工作
围绕该数据集衍生的经典工作主要集中在特征分析与模型优化方向。研究者利用其多模型嵌入对比,深入探讨了Vision Transformer与CNN架构在语义表示上的差异,相关成果发表于顶级会议。此外,基于这些预计算特征,出现了针对特征蒸馏、跨模型知识迁移的高效算法,以及用于评估特征鲁棒性的新颖基准测试方法,推动了视觉表示学习领域的理论进展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作