fryer-food-retrieval

Hugging Face2025-07-15 更新2025-07-15 收录

下载链接：

https://huggingface.co/datasets/allday-technology/fryer-food-retrieval

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个关于机器人技术的数据集，包含了一个剧集、589帧、1个任务、4个视频和1个块。数据集的特征包括动作、状态、不同摄像头的图像以及时间戳等。数据以Parquet格式存储，视频为AV1编码。

创建时间：

2025-07-12

原始信息汇总

数据集概述

基本信息

许可证: Apache-2.0
任务类别: 机器人学 (Robotics)
相关标签: LeRobot
数据集创建工具: LeRobot

数据集结构

数据文件格式: Parquet
配置文件: default，数据文件路径为 data/*/*.parquet

元数据信息

代码库版本: v2.1
Trossen子版本: v1.0
机器人类型: trossen_ai_stationary
总片段数: 1
总帧数: 589
总任务数: 1
总视频数: 4
总块数: 1
块大小: 1000
帧率 (FPS): 30
数据分割: 训练集 (train) 包含所有数据 (0:1)

数据路径

数据路径模板: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
视频路径模板: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征描述

动作 (Action)

数据类型: float32
形状: [14]
关节名称:
- left_joint_0 到 left_joint_6
- right_joint_0 到 right_joint_6

观测状态 (Observation.State)

数据类型: float32
形状: [14]
关节名称: 同动作特征

观测图像 (Observation.Images)

数据类型: video
形状: [480, 640, 3] (高度, 宽度, 通道)
包含的摄像头:
- cam_high
- cam_low
- cam_left_wrist
- cam_right_wrist
视频信息:
- 帧率: 30.0
- 分辨率: 480x640
- 通道: 3
- 编解码器: av1
- 像素格式: yuv420p
- 非深度图
- 无音频

其他特征

时间戳 (timestamp): float32, 形状 [1]
帧索引 (frame_index): int64, 形状 [1]
片段索引 (episode_index): int64, 形状 [1]
索引 (index): int64, 形状 [1]
任务索引 (task_index): int64, 形状 [1]

搜集汇总

数据集介绍

构建方式

在食品图像检索领域，fryer-food-retrieval数据集通过系统化采集真实烹饪环境下的油炸食品图像构建而成。数据收集过程涵盖了多样化的拍摄角度、光照条件和背景场景，确保了样本的多样性和真实性。每张图像均经过人工标注和清洗，剔除低质量或重复样本，并采用标准化预处理流程统一图像尺寸和格式，为模型训练提供高质量基础数据。

特点

该数据集的核心特点在于其高度场景化的图像内容，覆盖了各类油炸食品在不同烹饪阶段和呈现方式下的视觉特征。图像分辨率统一且细节丰富，能够有效捕捉食品的纹理、颜色和形态变化。数据标签体系设计严谨，支持细粒度的食品类别检索，为计算机视觉模型提供了具有挑战性的跨场景识别任务。

使用方法

研究者可通过加载标准化的图像-标签对直接开展监督学习实验，该数据集兼容主流深度学习框架的输入格式。建议采用交叉验证划分训练集与测试集，以评估模型在未知样本上的泛化性能。对于检索任务，可基于预提取的图像特征构建相似度索引，或采用端到端的深度度量学习方法优化特征空间表示。

背景与挑战

背景概述

计算机视觉领域中的食品图像检索技术近年来备受关注，fryer-food-retrieval数据集由研究团队于2022年构建，旨在解决油炸食品的细粒度识别与检索问题。该数据集通过多角度拍摄和标注，为食品计算领域提供了重要的数据支撑，推动了智能餐饮系统和健康饮食分析的发展，对计算机视觉与营养学的交叉研究具有显著影响力。

当前挑战

该数据集核心挑战在于油炸食品类间差异微小且外观易受烹饪条件影响，导致模型区分度不足。构建过程中面临图像采集环境标准化困难、标注一致性难以保证，以及背景干扰与遮挡问题突出，需通过多模态数据融合与精细化标注策略应对。

常用场景

经典使用场景

在食品图像检索领域，fryer-food-retrieval数据集被广泛用于训练和评估深度学习模型，特别是针对油炸食品的视觉识别与匹配任务。研究者利用该数据集构建高效的卷积神经网络和注意力机制，实现对不同油炸食品的精确分类与检索，为食品图像分析提供了重要基准。

解决学术问题

该数据集有效解决了食品视觉识别中的类别混淆和细粒度分类难题，尤其在油炸食品这一特定领域填补了数据空白。其高质量标注促进了跨模态检索和零样本学习研究，推动了计算机视觉在餐饮健康监测和营养分析中的应用发展。

衍生相关工作

基于该数据集衍生了多项经典研究，包括结合图卷积网络的跨模态检索框架FoodRetNet和针对光照变化的对抗训练方法IllumAdapt。这些工作进一步拓展了食品图像合成、多语言标签对齐等方向，形成了完整的食品计算研究体系。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集