连续目标识别数据集CORe50 它是50个生活用品的集合

Name: 连续目标识别数据集CORe50 它是50个生活用品的集合
Creator: 帕依提提
License: 暂无描述

帕依提提2024-03-04 收录

下载链接：

https://www.payititi.com/opendatasets/show-1742.html

下载链接

链接失效反馈

官方服务：

资源简介：

CORe50是专为（C）物体（O）物体（Re）认知而设计的，它是50个生活用品的集合，属于10个类别：插头适配器，手机，剪刀，灯泡，易拉罐，眼镜，球，标记物，杯子和遥控器。分类可以在对象级别（50个类别）或类别级别（10个类别）执行。第一项任务（默认任务）更具挑战性，因为在某些姿势下很难区分相同类别的对象。该数据集已在11个不同的会话中收集（8个室内和3个室外）以不同的背景和光线为特征。对于每个会话和每个对象，使用Kinect 2.0传感器记录了15秒的视频（20 fps），该视频提供300 RGB-D帧。操作员可以手持物体，而摄像机的视点就是操作员的眼睛。要求操作员伸出手臂并平稳地移动/旋转摄像机前面的物体。物体在抓斗距离处的主观视角非常适合许多机器人应用。整个过程中，抓手（左手或右手）都会发生变化，并且相关的对象遮挡通常由手本身产生。 Fig.1 Example images of the 50 objects in CORe50. Each column denotes one of the 10 categories. The presence of temporal coherent sessions (i.e., videos where the objects gently move in front of the camera) is another key feature since temporal smoothness can be used to simplify object detection, improve classification accuracy and to address semi-supervised (or unsupervised) scenarios. In Fig. 1 you can see some image examples of the 50 objects in CORe50 where each column denotes one of the 10 categories and each row a different object. The full dataset consists of 164,866 128×128 RGB-D images: 11 sessions × 50 objects × (around 300) frames per session. Three of the eleven sessions (#3, #7 and #10) have been selected for test and the remaining 8 sessions are used for training. We tried to balance as much as possible the difficulty of training and test session with respect to: indoor/outdoor, holding hand (left or right) and complexity of the background. For more information about the dataset take a look a the section "CORe50" in the paper.

CORe50是专为物体认知（Cognitive Object Recognition）设计的数据集，其涵盖50件日常用品，分属10个类别：插头适配器、手机、剪刀、灯泡、易拉罐、眼镜、球类、标记物、水杯以及遥控器。分类任务可在对象级（50个细分类别）或类别级（10个粗分类别）下开展。其默认的第一项任务难度更高，因为部分姿态下同类物体极易混淆。该数据集共包含11组采集会话（8组室内场景、3组室外场景），各场景具备差异化的背景与光照条件。针对每一组会话与每一件物体，均使用Kinect 2.0传感器录制了一段时长15秒、帧率20fps的视频，共包含约300帧RGB-D图像。采集过程中由操作员手持物体，摄像机的视点与操作员的眼点保持一致：操作员需伸出手臂，平稳地移动或旋转摄像机前方的物体。物体处于抓取距离下的主观拍摄视角，可适配绝大多数机器人应用场景。采集全程中，握持物体的手（左手或右手）会发生切换，由此产生的物体遮挡通常由握持手自身造成。图1为CORe50数据集中50件物体的示例图像，每一列代表10个类别中的一类。具备时间连贯性的采集会话（即物体在摄像机前缓慢移动的视频）是该数据集的另一核心特性：时间平滑性可用于简化目标检测任务、提升分类精度，并可适配半监督（或无监督）学习场景。在图1中，可观察到CORe50数据集50件物体的示例图像：每一列对应10个类别中的一类，每一行则对应一件不同的物体。完整数据集共包含164866张分辨率为128×128的RGB-D图像，具体构成为：11组会话 × 50件物体 × 每组会话约300帧图像。11组会话中，第3、7、10组被选为测试集，剩余8组作为训练集。在数据集构建过程中，我们尽可能平衡训练集与测试集的难度，考量维度包括：场景室内/室外属性、握持手类型（左手或右手）以及背景复杂度。如需了解该数据集的更多细节，请查阅论文中的"CORe50"章节。

提供机构：

帕依提提

搜集汇总

数据集介绍

背景与挑战

背景概述

CORe50是一个连续目标识别数据集，包含50个生活用品，分为10个类别，专为物体认知设计。数据集通过11个不同会话（8个室内和3个室外）收集，使用Kinect 2.0传感器记录RGB-D视频，总共有164,866张128×128图像，支持对象级别和类别级别的分类任务，并强调时间连贯性以简化对象检测和改善分类准确性。

以上内容由遇见数据集搜集并总结生成