Multimodal-Fatima/StanfordCars_train

Name: Multimodal-Fatima/StanfordCars_train
Creator: Multimodal-Fatima
Published: 2023-06-12 06:26:48
License: 暂无描述

Hugging Face2023-06-12 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/Multimodal-Fatima/StanfordCars_train

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含多个特征，如图像、标签、ID、CLIP标签、LLM描述、BLIP标题等。标签部分详细列出了196种不同车型的名称和年份，表明该数据集可能与汽车分类或识别相关。数据集分为训练集，包含8144个样本，总大小为1016273762字节。

提供机构：

Multimodal-Fatima

原始信息汇总

数据集概述

数据集名称: StanfordCars_train

主要特征:

image: 图片数据，包含多种车辆图像。
label: 分类标签，详细列出了196种不同车型的名称。

其他特征:

id: 整数类型，用于标识每条记录。
clip_tags_ViT_L_14: 字符串序列，可能包含图像的标签信息。
LLM_Description_gpt3_downstream_tasks_ViT_L_14: 字符串序列，描述了使用GPT-3模型的下游任务。
LLM_Description_gpt3_downstream_tasks_visual_genome_ViT_L_14: 字符串序列，描述了视觉基因组相关的下游任务。
blip_caption_beam_5: 字符串类型，可能包含图像的描述信息。
Attributes_ViT_L_14_text_davinci_003_full: 字符串序列，描述了完整的文本属性。
Attributes_ViT_L_14_text_davinci_003_stanfordcars: 字符串序列，专门针对Stanford Cars数据集的文本属性。
clip_tags_ViT_L_14_with_openai_classes: 字符串序列，包含OpenAI类别的标签。
clip_tags_ViT_L_14_wo_openai_classes: 字符串序列，不包含OpenAI类别的标签。
clip_tags_ViT_L_14_simple_specific: 字符串类型，简化的特定标签。
clip_tags_ViT_L_14_ensemble_specific: 字符串类型，集合的特定标签。
clip_tags_ViT_B_16_simple_specific: 字符串类型，简化的特定标签，使用ViT_B_16模型。
clip_tags_ViT_B_16_ensemble_specific: 字符串类型，集合的特定标签，使用ViT_B_16模型。
clip_tags_ViT_B_32_ensemble_specific: 字符串类型，集合的特定标签，使用ViT_B_32模型。
Attributes_ViT_B_16_descriptors_text_davinci_003_full: 字符串序列，描述了ViT_B_16模型的完整描述符。
Attributes_LAION_ViT_H_14_2B_descriptors_text_davinci_003_full: 字符串序列，描述了LAION_ViT_H_14_2B模型的完整描述符。
clip_tags_LAION_ViT_H_14_2B_simple_specific: 字符串类型，简化的特定标签，使用LAION_ViT_H_14_2B模型。
clip_tags_LAION_ViT_H_14_2B_ensemble_specific: 字符串类型，集合的特定标签，使用LAION_ViT_H_14_2B模型。
Attributes_ViT_L_14_descriptors_text_davinci_003_full: 字符串序列，描述了ViT_L_14模型的完整描述符。

数据集分割:

train: 训练集，包含8144个样本，总大小为1016273762字节。

下载大小: 991440998字节

数据集大小: 1016273762字节

5,000+

优质数据集

54 个

任务类型

进入经典数据集