Multimodal-Fatima/StanfordCars_train
收藏Hugging Face2023-06-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Multimodal-Fatima/StanfordCars_train
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,如图像、标签、ID、CLIP标签、LLM描述、BLIP标题等。标签部分详细列出了196种不同车型的名称和年份,表明该数据集可能与汽车分类或识别相关。数据集分为训练集,包含8144个样本,总大小为1016273762字节。
提供机构:
Multimodal-Fatima
原始信息汇总
数据集概述
数据集名称: StanfordCars_train
主要特征:
- image: 图片数据,包含多种车辆图像。
- label: 分类标签,详细列出了196种不同车型的名称。
其他特征:
- id: 整数类型,用于标识每条记录。
- clip_tags_ViT_L_14: 字符串序列,可能包含图像的标签信息。
- LLM_Description_gpt3_downstream_tasks_ViT_L_14: 字符串序列,描述了使用GPT-3模型的下游任务。
- LLM_Description_gpt3_downstream_tasks_visual_genome_ViT_L_14: 字符串序列,描述了视觉基因组相关的下游任务。
- blip_caption_beam_5: 字符串类型,可能包含图像的描述信息。
- Attributes_ViT_L_14_text_davinci_003_full: 字符串序列,描述了完整的文本属性。
- Attributes_ViT_L_14_text_davinci_003_stanfordcars: 字符串序列,专门针对Stanford Cars数据集的文本属性。
- clip_tags_ViT_L_14_with_openai_classes: 字符串序列,包含OpenAI类别的标签。
- clip_tags_ViT_L_14_wo_openai_classes: 字符串序列,不包含OpenAI类别的标签。
- clip_tags_ViT_L_14_simple_specific: 字符串类型,简化的特定标签。
- clip_tags_ViT_L_14_ensemble_specific: 字符串类型,集合的特定标签。
- clip_tags_ViT_B_16_simple_specific: 字符串类型,简化的特定标签,使用ViT_B_16模型。
- clip_tags_ViT_B_16_ensemble_specific: 字符串类型,集合的特定标签,使用ViT_B_16模型。
- clip_tags_ViT_B_32_ensemble_specific: 字符串类型,集合的特定标签,使用ViT_B_32模型。
- Attributes_ViT_B_16_descriptors_text_davinci_003_full: 字符串序列,描述了ViT_B_16模型的完整描述符。
- Attributes_LAION_ViT_H_14_2B_descriptors_text_davinci_003_full: 字符串序列,描述了LAION_ViT_H_14_2B模型的完整描述符。
- clip_tags_LAION_ViT_H_14_2B_simple_specific: 字符串类型,简化的特定标签,使用LAION_ViT_H_14_2B模型。
- clip_tags_LAION_ViT_H_14_2B_ensemble_specific: 字符串类型,集合的特定标签,使用LAION_ViT_H_14_2B模型。
- Attributes_ViT_L_14_descriptors_text_davinci_003_full: 字符串序列,描述了ViT_L_14模型的完整描述符。
数据集分割:
- train: 训练集,包含8144个样本,总大小为1016273762字节。
下载大小: 991440998字节
数据集大小: 1016273762字节



