D435i FOD Dataset
收藏数据集概述
数据集名称:D435i FOD Dataset(基于Intel RealSense D435i深度相机的外来碎片数据集)
数据集地址:https://github.com/Victor-sck/Realsense_D435i_FOD_Dataset
采集与硬件参数
- 相机型号:Intel RealSense D435i
- 分辨率:1280 × 720
- 帧率:30 FPS
- 采集高度:距地面0.6米
- 深度范围:0.2米 – 3.0米
- 路面条件:干燥混凝土路面,表面粗糙
- 数据总量:约19 GB,共420帧
目录结构与数据模态
D435i_FOD_Dataset/ ├── calib/ # 相机标定参数 ├── color/ # RGB图像(PNG, 1280×720, 8-bit) ├── left_ir/ # 左IR立体图像(PNG, 1280×720) ├── right_ir/ # 右IR立体图像(PNG, 1280×720) ├── depth/ # 深度图(raw PNG + 米级NPY) ├── disparity/ # 视差图(PFM, float32) ├── mask/ # 有效深度二值掩码(8-bit PNG) ├── pointcloud/ # 彩色3D点云(PLY, 二进制) ├── pointcloud_array/ # 点云NumPy数组(NPY) └── meta/ # 每帧元数据(JSON)
每帧文件命名统一采用6位数字前缀(000001 – 000420),示例(frame 000001):
| 模态 | 文件路径 |
|---|---|
| Color | color/000001.png |
| Left IR | left_ir/000001.png |
| Right IR | right_ir/000001.png |
| Depth raw | depth/000001_depth_raw.png |
| Depth (meters) | depth/000001_depth_m.npy |
| Disparity | disparity/000001.pfm |
| Valid mask | mask/000001.png |
| Point cloud | pointcloud/000001.ply |
| Point cloud array | pointcloud_array/000001.npy |
| Metadata | meta/000001.json |
相机标定参数
标定文件位于 calib/realsense_d435i_1280x720.json
| 参数 | 左IR / 右IR / 深度相机 | 彩色相机 |
|---|---|---|
| 焦距 (fx, fy) | 639.14, 639.14 | 914.31, 912.38 |
| 主点 (cx, cy) | 633.05, 357.06 | 646.72, 371.75 |
| 畸变模型 | Brown-Conrady(全零) | Inverse Brown-Conrady(全零) |
| 基线长度 | 50.01 mm | — |
| 深度缩放因子 | 0.001 m/unit | — |
物体类别与分布
共20类物体,总计420帧:
| 数量 | 类别 |
|---|---|
| 40 | metalpart |
| 20 | tape, metalsheet, nail, hammer, wire, adjustablewrench, rock, nut, bolt, hose, sodacan, boltwasher, pen, screwdriver, boltnutset, plasticpart, pliers, battery, cutter |
物体属性分布:
- 材质:金属(280)、塑料(100)、PVC(20)、石头(20)
- 尺寸等级:中等(120)、大(120)、小(120)、未知(40)、极小(20)
- 形状:全部为不规则碎片
每帧元数据(JSON)
每个 meta/*.json 包含:
frame_id:帧索引capture_time:采集时间戳image_files:所有模态的相对路径camera_setting:分辨率、FPS、流配置scene_label:物体类别、材质、尺寸(mm)、形状、尺寸等级、物体数量、路面类型与状况、相机高度valid_depth_rule:有效深度阈值(0.2 m / 3.0 m)disparity_formula:视差计算公式及参数
深度与视差
-
深度图提供两种形式:原始16位PNG(毫米级)和float32 NPY(米级)
-
视差图以单通道float32 PFM文件存储,计算公式:
d = fx × baseline / Z
其中
fx = 639.14,baseline = 0.05001 m,Z为以米为单位的深度
使用说明
- 有效深度掩码(
mask/)标记像素深度在 [0.2 m, 3.0 m] 内的区域 - 点云(PLY)由深度图和彩色图像预计算生成,包含 XYZ + RGB
- 点云数组(NPY)以形状为 (N, 6) 的NumPy数组存储,列顺序为 (x, y, z, r, g, b)
- 左IR和右IR图像构成立体像对,基线约50 mm
许可与下载
- 许可:仅用于研究目的,使用时请引用或标注本仓库
- 下载地址:
- 数据集页面:https://huggingface.co/datasets/VictorS0908/D435i_FOD_Dataset
- 直接下载:https://huggingface.co/datasets/VictorS0908/D435i_FOD_Dataset/resolve/main/D435i_FOD_Dataset.rar
- 文件信息:文件名
D435i_FOD_Dataset.rar,RAR压缩格式,下载后需解压使用




