zanshiyincang
收藏Changing Grounding Benchmark 数据集概述
核心特性
-
处理的3RScan数据集
- 标准化坐标:
- 包含在
align.zip中
- 包含在
- 重新渲染的RGB-D图像:
- 分辨率:1296×968
- 相机内参:
fx=1169.6, fy=1167.1, cx=646.3, cy=489.9
- 标准化坐标:
-
266,916条空间关系标注集
-
每行代表一个独特的空间指代表达式,包含以下列:
列名 类型 描述 示例 scan_idUUID 3D场景的唯一标识符 8eabc41a-5af7-2f32-8677-c1e3f9b04e62target_idint 场景中目标对象的ID 23distractor_idsint[] 与目标类别相同但不是目标的对象的ID列表 [12]utterancestring 语言指代表达式 "select the window that is closer to the blinds"stimulus_idstring 表达式的复合唯一ID 8eabc41a...-window-2-23-12coarse_reference_typeenum 高层次空间关系类型 horizontalreference_typestring 具体空间关系 closestinstance_typestring 目标对象类别 windowanchors_typesstring[] 锚对象的类别 [blinds]anchor_idsint[] 锚对象的ID [21]initialbool 目标是否在初始扫描中 Falsebase&rescanUUID[] 初始扫描和重新扫描成对匹配 [752cc595...]
-
3RScan数据集安装
- 从 https://github.com/WaldJohannaU/3RScan 下载3RScan数据集
- 解压
sequence.zip并提取图像和信息 - 运行以下命令: bash python extract.py
渲染工具
-
描述:使用Nvdiffrast进行渲染
-
安装:
-
运行环境:Python 3.10.11, pytorch 2.0.1, cuda 11.7
-
安装基础库: bash pip install torch==2.0.1 torchvision==0.15.2 torchaudio==2.0.2 --index-url https://download.pytorch.org/whl/cu118 cd nvdiffrast_tool pip install -r requirements.txt
-
安装nvdiffrast: bash cd nvdiffrast sudo apt-get update && DEBIAN_FRONTEND=noninteractive sudo apt-get install -y --no-install-recommends pkg-config libglvnd0 libgl1 libglx0 libegl1 libgles2 libglvnd-dev libgl1-mesa-dev libegl1-mesa-dev libgles2-mesa-dev cmake curl export CUDA_HOME=/usr/local/cuda pip install -e . cd ..
-
-
使用: bash cd nvdiffrast cd nvdiffrast_tool python rerenderimages.py
数据集可用性与维护
- 可通过huggingface访问
- 定期更新和维护以确保数据的准确性和相关性
- 禁止商业使用或任何可能危害社会的用途
致谢
感谢3RScan和nvdiffrast的开源库和数据集对本项目的支持。




