five

Replica Dataset|三维重建数据集|室内空间分析数据集

收藏
github2024-05-23 更新2024-05-31 收录
三维重建
室内空间分析
下载链接:
https://github.com/facebookresearch/Replica-Dataset
下载链接
链接失效反馈
资源简介:
Replica Dataset是一个包含多种室内空间高质量重建的数据集。每个重建包含清晰的密集几何结构、高分辨率和高动态范围纹理、玻璃和镜面表面信息、平面分割以及语义和实例分割。

The Replica Dataset is a comprehensive collection of high-quality reconstructions of various indoor spaces. Each reconstruction includes detailed dense geometry, high-resolution and high-dynamic-range textures, information on glass and mirror surfaces, planar segmentation, as well as semantic and instance segmentation.
创建时间:
2019-02-09
原始信息汇总

数据集概述

数据集名称

  • Replica Dataset

数据集描述

  • Replica Dataset 包含多种室内空间的高质量重建数据。每个重建包含清晰的密集几何结构、高分辨率和高动态范围纹理、玻璃和镜面表面信息、平面分割以及语义类别和实例分割。

数据集内容

  • 场景数量:18个场景
  • 包含资产
    • glass.sur: 玻璃和镜面表面的参数化
    • mesh.ply: 场景的四边形网格,带有顶点颜色
    • preseg.jsonpreseg.bin: 场景的预分割,包括平面和非平面
    • semantic.jsonsemantic.bin: 场景的语义分割
    • textures: 场景的高分辨率和高动态范围纹理
    • habitat/mesh*semantic.ply: 包含语义或预分割信息的四边形网格
    • habitat/info*semantic.json: 实例ID到语义名称的映射
    • habitat/mesh*semantic.navmesh: 导航网格
    • habitat/replica_stage.stage_config.json: 场景级别参数的配置文件
    • habitat/sorted_faces.bin: 预处理的几何数据,支持habitat-sim的Ptex渲染

数据集用途

  • 适用于机器学习,特别是AI Habitat框架中的AI代理训练和其他ML任务。

引用信息

  • 若在研究中使用Replica数据集,请引用以下技术报告:

    @article{replica19arxiv, title = {The {R}eplica Dataset: A Digital Replica of Indoor Spaces}, author = {Julian Straub et al.}, journal = {arXiv preprint arXiv:1906.05797}, year = {2019} }

数据集下载

  • 支持平台:Mac OS 和 Linux
  • 下载命令:使用download.sh脚本进行下载和解压缩
  • Windows下载:执行win_download.bat进行下载

数据集SDK

  • Replica SDK 包含ReplicaViewer和ReplicaRenderer,分别用于可视化数据集和无界面渲染图像。

数据集与AI Habitat的集成

AI搜集汇总
数据集介绍
main_image_url
构建方式
Replica Dataset通过高精度重建技术,对多种室内空间进行了细致的复现。每个场景不仅包含干净的密集几何结构,还配备了高分辨率和高动态范围的纹理,以及玻璃和镜面表面的参数化信息。此外,数据集还提供了平面分割、语义类别和实例分割等详细信息。这些数据是通过先进的扫描和重建技术生成的,确保了数据的高质量和多样性。
使用方法
使用Replica Dataset时,用户可以通过Replica SDK中的ReplicaViewer进行交互式视觉检查,或使用ReplicaRenderer进行无头渲染。对于机器学习任务,数据集可以直接导入AI Habitat框架,利用其提供的语义和几何信息进行AI代理的训练。此外,数据集的下载和解压过程简单,支持Mac OS、Linux和Windows系统,确保了跨平台的兼容性和易用性。
背景与挑战
背景概述
Replica Dataset是由一群来自不同研究机构和公司的研究人员于2019年创建的高质量室内空间重建数据集。该数据集的核心研究问题是如何在计算机视觉和机器学习领域中,提供精确且多模态的室内环境表示。Replica Dataset不仅包含高分辨率和高动态范围的纹理,还提供了玻璃和镜面信息、平面分割以及语义和实例分割。这些特性使得该数据集在AI Habitat等框架中无缝使用,为AI代理训练和其他机器学习任务提供了强大的支持。Replica Dataset的发布,极大地推动了室内环境理解和机器人导航等领域的研究进展。
当前挑战
Replica Dataset在构建过程中面临了多项挑战。首先,高质量室内空间的重建需要精确的传感器数据和复杂的处理算法,以确保几何和纹理的准确性。其次,数据集的多模态特性,如玻璃和镜面信息的处理,增加了数据处理的复杂性。此外,将数据集与AI Habitat等框架无缝集成,需要解决格式转换和兼容性问题。最后,数据集的规模和多样性要求高效的存储和传输解决方案,以确保用户能够方便地访问和使用这些数据。这些挑战共同构成了Replica Dataset在实际应用中的主要障碍。
常用场景
经典使用场景
Replica Dataset因其高质量的室内空间重建而闻名,广泛应用于计算机视觉和机器人学领域。其经典使用场景包括但不限于:室内导航算法的训练与评估、场景理解与语义分割、增强现实(AR)和虚拟现实(VR)中的环境模拟。通过提供高分辨率的几何和纹理信息,Replica Dataset使得研究人员能够在真实感极强的环境中测试和优化算法,从而显著提升算法的鲁棒性和准确性。
解决学术问题
Replica Dataset在学术研究中解决了多个关键问题,如室内场景的精确重建、语义分割和实例分割。其高动态范围纹理和玻璃、镜子表面的详细信息,为研究者提供了丰富的数据资源,有助于推动计算机视觉和机器人学的发展。此外,通过与AI Habitat的无缝集成,Replica Dataset为智能代理的训练提供了理想的环境,进一步促进了人工智能在复杂室内环境中的应用研究。
实际应用
在实际应用中,Replica Dataset被广泛用于智能家居、室内导航系统、虚拟现实和增强现实等领域。例如,智能家居系统可以通过该数据集进行环境感知和路径规划,提升用户体验;虚拟现实和增强现实应用则可以利用其高精度的室内模型,提供更加沉浸式的交互体验。此外,机器人导航和场景理解技术也从该数据集中受益,提高了在复杂室内环境中的操作能力和适应性。
数据集最近研究
最新研究方向
在室内场景重建与智能体训练领域,Replica Dataset凭借其高质量的几何重建和高动态范围纹理,成为前沿研究的重要基石。该数据集不仅支持传统的视觉检查和渲染,还无缝集成于AI Habitat框架,为AI代理的训练提供了丰富的语义和实例分割信息。近期研究主要集中在利用Replica Dataset进行多模态数据融合,以提升智能体在复杂室内环境中的导航和交互能力。此外,数据集的高分辨率纹理和玻璃、镜子表面信息为增强现实(AR)和虚拟现实(VR)应用提供了新的可能性,推动了这些技术在室内设计、教育和娱乐等领域的创新应用。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

ChinaTravel

ChinaTravel是由南京大学国家重点实验室开发的一个真实世界基准数据集,专门用于评估语言代理在中国旅行规划中的应用。该数据集涵盖了中国10个最受欢迎城市的旅行信息,包括720个航班和5770趟列车,以及3413个景点、4655家餐厅和4124家酒店的详细信息。数据集通过问卷调查收集用户需求,并设计了一个可扩展的领域特定语言来支持自动评估。ChinaTravel旨在解决复杂的真实世界旅行规划问题,特别是在多兴趣点行程安排和用户偏好满足方面,为语言代理在旅行规划中的应用提供了重要的测试平台。

arXiv 收录

AISHELL/AISHELL-1

Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。

hugging_face 收录

THUCNews

THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。

github 收录

NSL-KDD

NSL-KDD数据集是一个用于测试入侵检测算法的网络流量数据集。它是KDD Cup 1999数据集的改进版本,解决了原始数据集中的冗余记录和类别不平衡问题。该数据集包含训练和测试数据文件,以及包含数据集列名的文件。

github 收录