Replica Dataset|三维重建数据集|室内空间分析数据集
收藏数据集概述
数据集名称
- Replica Dataset
数据集描述
- Replica Dataset 包含多种室内空间的高质量重建数据。每个重建包含清晰的密集几何结构、高分辨率和高动态范围纹理、玻璃和镜面表面信息、平面分割以及语义类别和实例分割。
数据集内容
- 场景数量:18个场景
- 包含资产:
glass.sur
: 玻璃和镜面表面的参数化mesh.ply
: 场景的四边形网格,带有顶点颜色preseg.json
和preseg.bin
: 场景的预分割,包括平面和非平面semantic.json
和semantic.bin
: 场景的语义分割textures
: 场景的高分辨率和高动态范围纹理habitat/mesh*semantic.ply
: 包含语义或预分割信息的四边形网格habitat/info*semantic.json
: 实例ID到语义名称的映射habitat/mesh*semantic.navmesh
: 导航网格habitat/replica_stage.stage_config.json
: 场景级别参数的配置文件habitat/sorted_faces.bin
: 预处理的几何数据,支持habitat-sim的Ptex渲染
数据集用途
- 适用于机器学习,特别是AI Habitat框架中的AI代理训练和其他ML任务。
引用信息
-
若在研究中使用Replica数据集,请引用以下技术报告:
@article{replica19arxiv, title = {The {R}eplica Dataset: A Digital Replica of Indoor Spaces}, author = {Julian Straub et al.}, journal = {arXiv preprint arXiv:1906.05797}, year = {2019} }
数据集下载
- 支持平台:Mac OS 和 Linux
- 下载命令:使用
download.sh
脚本进行下载和解压缩 - Windows下载:执行
win_download.bat
进行下载
数据集SDK
- Replica SDK 包含ReplicaViewer和ReplicaRenderer,分别用于可视化数据集和无界面渲染图像。
数据集与AI Habitat的集成
- 使用Replica数据集在AI Habitat中,需参考AI Habitat Sim。

学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
ChinaTravel
ChinaTravel是由南京大学国家重点实验室开发的一个真实世界基准数据集,专门用于评估语言代理在中国旅行规划中的应用。该数据集涵盖了中国10个最受欢迎城市的旅行信息,包括720个航班和5770趟列车,以及3413个景点、4655家餐厅和4124家酒店的详细信息。数据集通过问卷调查收集用户需求,并设计了一个可扩展的领域特定语言来支持自动评估。ChinaTravel旨在解决复杂的真实世界旅行规划问题,特别是在多兴趣点行程安排和用户偏好满足方面,为语言代理在旅行规划中的应用提供了重要的测试平台。
arXiv 收录
AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录
THUCNews
THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。
github 收录
NSL-KDD
NSL-KDD数据集是一个用于测试入侵检测算法的网络流量数据集。它是KDD Cup 1999数据集的改进版本,解决了原始数据集中的冗余记录和类别不平衡问题。该数据集包含训练和测试数据文件,以及包含数据集列名的文件。
github 收录