SLABIM|SLAM数据集|建筑信息模型数据集
收藏SLABIM: A SLAM-BIM Coupled Dataset in HKUST Main Building
概述
SLABIM是一个开源的SLAM数据集,与BIM(建筑信息建模)相结合。
特点
- 大规模建筑信息建模:数据集的BIM模型是香港科技大学数字孪生项目的一部分,包含各种类型的办公室、教室、休息室和走廊。
- 多会话与多传感器数据:收集了12个会话,涵盖不同楼层和区域,包含多种室内场景。
- 数据集验证:通过三个不同的任务展示了SLABIM的实用性:(1) LiDAR-to-BIM注册,(2) 基于BIM的机器人姿态跟踪,(3) 语义映射。
数据结构
BIM/
包含从原始BIM模型导出的CAD文件(.dxf)和网格文件(.ply),按楼层和语义标签组织。用户可以根据特定密度采样网格以获取点云,适用于各种机器人任务。calibration files
提供相机内参和LiDAR的外参。sensor data/
目录中,每个会话命名为<X>F Region<Y>
,其中X=1,3,4,5,Y=1,2,3,表示收集的楼层和区域,如3F Region1
。该目录包含相机和LiDAR生成的图像和点云。data <x>.bag
,x=0,1,2... 是编码原始信息的rosbag,可以使用ROS工具解析。sensor data/
还包含SLAM生成的地图,包括用于LiDAR-to-BIM注册的子地图和离线映射系统优化的地图。pose_frame_to_bim.txt
,pose_map_to_bim.txt
和pose_submap_to_bim.txt
包含从LiDAR扫描和地图到BIM坐标系的地面真值姿态。这些姿态通过手动提供的初始猜测和局部点云对齐进行精细调整。
数据获取平台
手持传感器套件如图1所示,详细特性见表1。
定性结果
全局LiDAR-to-BIM注册
全局LiDAR-to-BIM注册旨在从头开始估计LiDAR子地图和BIM坐标系之间的变换。机器人可以通过将在线构建的子地图与BIM对齐来实现全局定位。
基于BIM的机器人姿态跟踪
与LiDAR-to-BIM不同,姿态跟踪需要估计给定初始状态和顺序测量的姿态。
语义映射
我们在SLABIM上部署了FM-Fusion。对于地面真值,我们使用BIM中的语义标签将HKUST BIM转换为语义点云地图。两个地图都包含四个语义类别:地板、墙、门和柱子,这是室内环境的常见元素。
致谢
我们衷心感谢Jack C. P. Cheng教授慷慨提供原始的HKUST BIM文件,以及Skyland Innovation提供的优秀传感器套件。

LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
THUCNews
THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。
github 收录
AgiBot World
为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。
github 收录
网易云音乐数据集
该数据集包含了网易云音乐平台上的歌手信息、歌曲信息和歌单信息,数据通过爬虫技术获取并整理成CSV格式,用于音乐数据挖掘和推荐系统构建。
github 收录
RAVDESS
情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。
OpenDataLab 收录