ScanRefer_Dataset
收藏魔搭社区2025-12-27 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/ScanRefer_Dataset
下载链接
链接失效反馈官方服务:
资源简介:
displayName: ScanRefer Dataset
license:
- CC BY-NC-SA 3.0
paperUrl: https://arxiv.org/pdf/1912.08830v3.pdf
publishDate: "2020"
publishUrl: https://github.com/daveredrum/ScanRefer
publisher:
- Technical University of Munich
- Simon Fraser University
tags:
- 3D Object
taskTypes:
- Sentence Embeddings
- Object Localization
- Object Detection
---
# 数据集介绍
## 简介
包含来自 800 个 ScanNet 场景的 11,046 个对象的 51,583 个描述。 ScanRefer 是第一个通过自然语言直接在 3D 中执行对象定位的大规模工作。
## 引文
```
@inproceedings{chen2020scanrefer,
title={Scanrefer: 3d object localization in rgb-d scans using natural language},
author={Chen, Dave Zhenyu and Chang, Angel X and Nie{\ss}ner, Matthias},
booktitle={European Conference on Computer Vision},
pages={202--221},
year={2020},
organization={Springer}
}
```
## Download dataset
:modelscope-code[]{type="git"}
显示名称:ScanRefer 数据集
许可证:CC BY-NC-SA 3.0
论文链接:https://arxiv.org/pdf/1912.08830v3.pdf
发布年份:2020
项目主页:https://github.com/daveredrum/ScanRefer
发布机构:慕尼黑工业大学(Technical University of Munich)、西蒙弗雷泽大学(Simon Fraser University)
标签:3D 对象(3D Object)
任务类型:句子嵌入(Sentence Embeddings)、对象定位(Object Localization)、对象检测(Object Detection)
---
# 数据集介绍
## 简介
本数据集涵盖源自800个ScanNet(ScanNet)场景的11046个对象对应的51583条自然语言描述。ScanRefer是首个依托自然语言直接在三维空间完成对象定位的大规模基准数据集。
## 引文
@inproceedings{chen2020scanrefer,
title={Scanrefer: 3d object localization in rgb-d scans using natural language},
author={Chen, Dave Zhenyu and Chang, Angel X and Nie{ss}ner, Matthias},
booktitle={European Conference on Computer Vision},
pages={202--221},
year={2020},
organization={Springer}
}
## 数据集下载
:modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-01
搜集汇总
数据集介绍

背景与挑战
背景概述
ScanRefer_Dataset是一个专注于3D对象定位的大规模数据集,包含51,583条自然语言描述,覆盖800个ScanNet场景中的11,046个对象。它是首个通过自然语言直接在3D RGB-D扫描中进行对象定位的数据集,旨在推动3D视觉与语言理解的交叉研究。
以上内容由遇见数据集搜集并总结生成



