mulsi/fruit-vegetable-outputs
收藏Hugging Face2024-04-24 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/mulsi/fruit-vegetable-outputs
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
- config_name: embeds
features:
- name: output
sequence: float32
- name: class
dtype: string
- name: id
dtype: string
- name: sphere
dtype: bool
- name: cube
dtype: bool
- name: cylinder
dtype: bool
- name: red
dtype: bool
- name: green
dtype: bool
- name: orange
dtype: bool
- name: yellow
dtype: bool
- name: stem
dtype: bool
- name: leaf
dtype: bool
- name: tail
dtype: bool
- name: seed
dtype: bool
- name: pulp
dtype: bool
- name: soil
dtype: bool
- name: tree
dtype: bool
- name: ovaloid
dtype: bool
- name: blue
dtype: bool
- name: brown
dtype: bool
- name: white
dtype: bool
- name: black
dtype: bool
- name: purple
dtype: bool
splits:
- name: train
num_bytes: 5437057
num_examples: 2579
- name: test
num_bytes: 708338
num_examples: 336
download_size: 8369044
dataset_size: 6145395
- config_name: mean_pooling
features:
- name: output
sequence: float32
- name: class
dtype: string
- name: id
dtype: string
- name: sphere
dtype: bool
- name: cube
dtype: bool
- name: cylinder
dtype: bool
- name: red
dtype: bool
- name: green
dtype: bool
- name: orange
dtype: bool
- name: yellow
dtype: bool
- name: stem
dtype: bool
- name: leaf
dtype: bool
- name: tail
dtype: bool
- name: seed
dtype: bool
- name: pulp
dtype: bool
- name: soil
dtype: bool
- name: tree
dtype: bool
- name: ovaloid
dtype: bool
- name: blue
dtype: bool
- name: brown
dtype: bool
- name: white
dtype: bool
- name: black
dtype: bool
- name: purple
dtype: bool
splits:
- name: train
num_bytes: 8077953
num_examples: 2579
- name: test
num_bytes: 1052402
num_examples: 336
download_size: 11545802
dataset_size: 9130355
- config_name: pooler
features:
- name: output
sequence: float32
- name: class
dtype: string
- name: id
dtype: string
- name: sphere
dtype: bool
- name: cube
dtype: bool
- name: cylinder
dtype: bool
- name: red
dtype: bool
- name: green
dtype: bool
- name: orange
dtype: bool
- name: yellow
dtype: bool
- name: stem
dtype: bool
- name: leaf
dtype: bool
- name: tail
dtype: bool
- name: seed
dtype: bool
- name: pulp
dtype: bool
- name: soil
dtype: bool
- name: tree
dtype: bool
- name: ovaloid
dtype: bool
- name: blue
dtype: bool
- name: brown
dtype: bool
- name: white
dtype: bool
- name: black
dtype: bool
- name: purple
dtype: bool
splits:
- name: train
num_bytes: 8077953
num_examples: 2579
- name: test
num_bytes: 1052402
num_examples: 336
download_size: 11547254
dataset_size: 9130355
configs:
- config_name: embeds
data_files:
- split: train
path: embeds/train-*
- split: test
path: embeds/test-*
- config_name: mean_pooling
data_files:
- split: train
path: mean_pooling/train-*
- split: test
path: mean_pooling/test-*
- config_name: pooler
data_files:
- split: train
path: pooler/train-*
- split: test
path: pooler/test-*
---
数据集信息:
- 配置名称:embeds
特征:
- 输出:float32类型序列
- 类别:字符串类型
- 样本ID:字符串类型
- 球体(sphere):布尔类型
- 立方体(cube):布尔类型
- 圆柱体(cylinder):布尔类型
- 红色(red):布尔类型
- 绿色(green):布尔类型
- 橙色(orange):布尔类型
- 黄色(yellow):布尔类型
- 茎干(stem):布尔类型
- 叶片(leaf):布尔类型
- 尾部(tail):布尔类型
- 种子(seed):布尔类型
- 果肉(pulp):布尔类型
- 土壤(soil):布尔类型
- 树木(tree):布尔类型
- 椭圆体(ovaloid):布尔类型
- 蓝色(blue):布尔类型
- 棕色(brown):布尔类型
- 白色(white):布尔类型
- 黑色(black):布尔类型
- 紫色(purple):布尔类型
拆分集:
- 名称:训练集(train),字节占用大小:5437057,样本总数:2579
- 名称:测试集(test),字节占用大小:708338,样本总数:336
下载总大小:8369044
本地数据集总存储大小:6145395
- 配置名称:mean_pooling
特征:
- 输出:float32类型序列
- 类别:字符串类型
- 样本ID:字符串类型
- 球体(sphere):布尔类型
- 立方体(cube):布尔类型
- 圆柱体(cylinder):布尔类型
- 红色(red):布尔类型
- 绿色(green):布尔类型
- 橙色(orange):布尔类型
- 黄色(yellow):布尔类型
- 茎干(stem):布尔类型
- 叶片(leaf):布尔类型
- 尾部(tail):布尔类型
- 种子(seed):布尔类型
- 果肉(pulp):布尔类型
- 土壤(soil):布尔类型
- 树木(tree):布尔类型
- 椭圆体(ovaloid):布尔类型
- 蓝色(blue):布尔类型
- 棕色(brown):布尔类型
- 白色(white):布尔类型
- 黑色(black):布尔类型
- 紫色(purple):布尔类型
拆分集:
- 名称:训练集(train),字节占用大小:8077953,样本总数:2579
- 名称:测试集(test),字节占用大小:1052402,样本总数:336
下载总大小:11545802
本地数据集总存储大小:9130355
- 配置名称:pooler
特征:
- 输出:float32类型序列
- 类别:字符串类型
- 样本ID:字符串类型
- 球体(sphere):布尔类型
- 立方体(cube):布尔类型
- 圆柱体(cylinder):布尔类型
- 红色(red):布尔类型
- 绿色(green):布尔类型
- 橙色(orange):布尔类型
- 黄色(yellow):布尔类型
- 茎干(stem):布尔类型
- 叶片(leaf):布尔类型
- 尾部(tail):布尔类型
- 种子(seed):布尔类型
- 果肉(pulp):布尔类型
- 土壤(soil):布尔类型
- 树木(tree):布尔类型
- 椭圆体(ovaloid):布尔类型
- 蓝色(blue):布尔类型
- 棕色(brown):布尔类型
- 白色(white):布尔类型
- 黑色(black):布尔类型
- 紫色(purple):布尔类型
拆分集:
- 名称:训练集(train),字节占用大小:8077953,样本总数:2579
- 名称:测试集(test),字节占用大小:1052402,样本总数:336
下载总大小:11547254
本地数据集总存储大小:9130355
配置项:
- 配置名称:embeds,数据文件:
- 训练集拆分:路径为embeds/train-*
- 测试集拆分:路径为embeds/test-*
- 配置名称:mean_pooling,数据文件:
- 训练集拆分:路径为mean_pooling/train-*
- 测试集拆分:路径为mean_pooling/test-*
- 配置名称:pooler,数据文件:
- 训练集拆分:路径为pooler/train-*
- 测试集拆分:路径为pooler/test-*
提供机构:
mulsi
原始信息汇总
数据集概述
配置名称:embeds
-
特征信息:
- output: 序列类型,float32
- class: 字符串类型
- id: 字符串类型
- sphere, cube, cylinder, red, green, orange, yellow, stem, leaf, tail, seed, pulp, soil, tree, ovaloid, blue, brown, white, black, purple: 布尔类型
-
数据分割:
- 训练集:2579个样本,占用5437057字节
- 测试集:336个样本,占用708338字节
-
数据大小:
- 下载大小:8369044字节
- 数据集大小:6145395字节
配置名称:mean_pooling
-
特征信息:
- output: 序列类型,float32
- class: 字符串类型
- id: 字符串类型
- sphere, cube, cylinder, red, green, orange, yellow, stem, leaf, tail, seed, pulp, soil, tree, ovaloid, blue, brown, white, black, purple: 布尔类型
-
数据分割:
- 训练集:2579个样本,占用8077953字节
- 测试集:336个样本,占用1052402字节
-
数据大小:
- 下载大小:11545802字节
- 数据集大小:9130355字节
配置名称:pooler
-
特征信息:
- output: 序列类型,float32
- class: 字符串类型
- id: 字符串类型
- sphere, cube, cylinder, red, green, orange, yellow, stem, leaf, tail, seed, pulp, soil, tree, ovaloid, blue, brown, white, black, purple: 布尔类型
-
数据分割:
- 训练集:2579个样本,占用8077953字节
- 测试集:336个样本,占用1052402字节
-
数据大小:
- 下载大小:11547254字节
- 数据集大小:9130355字节
搜集汇总
数据集介绍

构建方式
在计算机视觉与多模态学习领域,fruit-vegetable-outputs数据集通过系统化采集与标注流程构建而成。该数据集包含2579个训练样本与336个测试样本,涵盖多种水果与蔬菜类别。每个样本均经过精细的特征标注,涉及几何形状、颜色及结构属性等多个维度,并采用三种不同的嵌入表示配置,包括embeds、mean_pooling与pooler,以支持多样化的模型输入需求。数据集的构建过程注重样本的多样性与标注的一致性,为后续的模型训练与评估提供了可靠的基础。
使用方法
在模型开发与评估中,该数据集可通过HuggingFace平台直接加载,支持按配置名称选择嵌入表示方式。研究者可利用训练集进行模型训练,测试集则用于性能验证。数据集的布尔特征可用于多标签分类或属性预测任务,而浮点序列输出适用于嵌入向量的可视化或相似性计算。通过划分清晰的训练与测试分割,该数据集能够有效支持监督学习与表示学习实验,促进计算机视觉领域在细粒度分类与特征理解方面的研究进展。
背景与挑战
背景概述
在计算机视觉与多模态学习领域,对果蔬类对象的细粒度识别与属性理解一直是研究热点。数据集mulsi/fruit-vegetable-outputs由相关研究团队构建,旨在通过提供丰富的视觉特征嵌入与结构化属性标注,推动模型在果蔬分类与属性推理方面的进展。该数据集不仅包含类别标签,还整合了形状、颜色、纹理等多维度布尔特征,为探索视觉表征与语义属性间的关联提供了重要基础。其构建反映了当前研究对可解释性视觉表征的追求,对农业自动化、零售智能及食品健康监测等领域具有潜在应用价值。
当前挑战
该数据集致力于解决细粒度果蔬识别与多属性联合推理的挑战,其核心问题在于如何从高维嵌入中有效分离并融合形状、颜色等异构特征,以提升模型在复杂真实场景中的泛化能力。在构建过程中,挑战主要体现在多源数据对齐与标注一致性上,例如确保视觉特征与语义属性的精确匹配,以及处理果蔬类内差异与类间相似性所带来的标注模糊性。此外,嵌入向量的维度选择与特征冗余控制也是构建中需平衡的技术难点。
常用场景
经典使用场景
在计算机视觉与多模态学习领域,mulsi/fruit-vegetable-outputs数据集以其丰富的几何形状、颜色及结构属性标注,为视觉表征学习提供了经典范例。该数据集常用于评估和训练深度学习模型在细粒度物体识别任务中的性能,特别是针对水果和蔬菜类别的多属性联合理解。研究者通过其预生成的嵌入向量,能够深入探究模型在复杂视觉特征提取与语义关联方面的能力,为图像分类与属性预测的基准测试奠定基础。
解决学术问题
该数据集有效解决了视觉识别研究中细粒度分类与多属性联合学习的核心挑战。通过提供精确的几何形状、颜色和部件标注,它支持学者探索模型如何从视觉输入中解析高层次语义概念,并理解属性间的交互关系。其意义在于推动了可解释计算机视觉的发展,使模型不仅能识别物体类别,还能分解其构成要素,为视觉推理与认知建模提供了关键数据支撑。
实际应用
在实际应用层面,mulsi/fruit-vegetable-outputs数据集可服务于智能农业与零售自动化系统。例如,在农产品质量检测与分拣流程中,基于该数据集训练的模型能够准确识别果蔬的成熟度、形状缺陷及颜色变异,从而实现高效自动化分级。此外,在增强现实导购或饮食健康管理应用中,它也能助力实现实时物体识别与营养信息关联,提升用户体验与操作效率。
数据集最近研究
最新研究方向
在计算机视觉与多模态学习领域,mulsi/fruit-vegetable-outputs数据集以其丰富的几何形状、颜色及结构特征标注,为细粒度图像分类与视觉表征学习提供了关键资源。当前研究聚焦于利用该数据集中的嵌入向量与布尔属性,探索零样本学习与属性推理的前沿方向,旨在构建能够泛化至未见类别的鲁棒模型。随着可解释人工智能的兴起,该数据集在视觉概念解耦与语义属性分析中的应用备受关注,推动了模型在农业自动化与食品检测等实际场景中的精准识别能力。其多配置设计进一步促进了对比学习与特征融合策略的创新,为视觉语言模型的预训练与微调提供了重要基准,对提升智能系统的感知与推理能力具有深远意义。
以上内容由遇见数据集搜集并总结生成



