five

Multimodal-Fatima/StanfordCars_train

收藏
Hugging Face2023-06-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Multimodal-Fatima/StanfordCars_train
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个特征,如图像、标签、ID、CLIP标签、LLM描述、BLIP标题等。标签部分详细列出了196种不同车型的名称和年份,表明该数据集可能与汽车分类或识别相关。数据集分为训练集,包含8144个样本,总大小为1016273762字节。
提供机构:
Multimodal-Fatima
原始信息汇总

数据集概述

数据集名称: StanfordCars_train

主要特征:

  • image: 图片数据,包含多种车辆图像。
  • label: 分类标签,详细列出了196种不同车型的名称。

其他特征:

  • id: 整数类型,用于标识每条记录。
  • clip_tags_ViT_L_14: 字符串序列,可能包含图像的标签信息。
  • LLM_Description_gpt3_downstream_tasks_ViT_L_14: 字符串序列,描述了使用GPT-3模型的下游任务。
  • LLM_Description_gpt3_downstream_tasks_visual_genome_ViT_L_14: 字符串序列,描述了视觉基因组相关的下游任务。
  • blip_caption_beam_5: 字符串类型,可能包含图像的描述信息。
  • Attributes_ViT_L_14_text_davinci_003_full: 字符串序列,描述了完整的文本属性。
  • Attributes_ViT_L_14_text_davinci_003_stanfordcars: 字符串序列,专门针对Stanford Cars数据集的文本属性。
  • clip_tags_ViT_L_14_with_openai_classes: 字符串序列,包含OpenAI类别的标签。
  • clip_tags_ViT_L_14_wo_openai_classes: 字符串序列,不包含OpenAI类别的标签。
  • clip_tags_ViT_L_14_simple_specific: 字符串类型,简化的特定标签。
  • clip_tags_ViT_L_14_ensemble_specific: 字符串类型,集合的特定标签。
  • clip_tags_ViT_B_16_simple_specific: 字符串类型,简化的特定标签,使用ViT_B_16模型。
  • clip_tags_ViT_B_16_ensemble_specific: 字符串类型,集合的特定标签,使用ViT_B_16模型。
  • clip_tags_ViT_B_32_ensemble_specific: 字符串类型,集合的特定标签,使用ViT_B_32模型。
  • Attributes_ViT_B_16_descriptors_text_davinci_003_full: 字符串序列,描述了ViT_B_16模型的完整描述符。
  • Attributes_LAION_ViT_H_14_2B_descriptors_text_davinci_003_full: 字符串序列,描述了LAION_ViT_H_14_2B模型的完整描述符。
  • clip_tags_LAION_ViT_H_14_2B_simple_specific: 字符串类型,简化的特定标签,使用LAION_ViT_H_14_2B模型。
  • clip_tags_LAION_ViT_H_14_2B_ensemble_specific: 字符串类型,集合的特定标签,使用LAION_ViT_H_14_2B模型。
  • Attributes_ViT_L_14_descriptors_text_davinci_003_full: 字符串序列,描述了ViT_L_14模型的完整描述符。

数据集分割:

  • train: 训练集,包含8144个样本,总大小为1016273762字节。

下载大小: 991440998字节

数据集大小: 1016273762字节

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作