S3DIS|室内场景分析数据集|3D点云数据数据集
收藏数据集概述
数据集名称
S3DIS-Structural-Completion
数据集描述
该数据集旨在从真实的S3DIS数据集中合成3D点云结构,重点关注墙、天花板、地板和柱子的结构完整性。
数据集内容
- 6个大规模室内区域:包括办公室、实验室和走廊等多种室内环境。
- 271个房间:每个区域细分为多个房间,提供多样化的空间配置。
- 点云数据:使用LiDAR扫描捕捉的3D几何数据,每个点包含空间位置及其反射强度值。
- 语义标注:每个点云点都标有语义类别,如天花板、地板、窗户等,用于训练和评估分割模型。
项目目的
- 问题陈述:S3DIS数据集由于自然因素影响,其点云数据中的平面结构(如墙、天花板、地板和柱子)存在噪声。
- 解决方案:通过简单的算法,找到三维坐标(xyz)的最小和最大值,然后使用linspace创建新的点云网格,以重建干净、平滑的3D点云结构。
数据集应用
- 语义分割:对点云中的每个点进行语义分类。
- 物体检测和识别:在场景中识别和定位物体。
- 3D场景完成和重建:基于点云数据创建完整的3D场景模型。
示例图像
- 墙、天花板和地板:展示了处理前后的点云图像。
- 柱子:展示了柱子的点云图像。
- 完整房间:展示了完整房间的点云重建图像。
致谢
感谢Pham Huy Thien Phuc提供的培训资源和在想法及关系上的努力,以及Dr. Tuan Dang提供的在实验室工作的机会。

LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
中国1km分辨率逐月降水量数据集(1901-2023)
该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。
国家青藏高原科学数据中心 收录
RAVDESS
情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。
OpenDataLab 收录
THUCNews
THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。
github 收录
典型分布式光伏出力预测数据集
光伏电站出力数据每5分钟从电站机房监控系统获取;气象实测数据从气象站获取,气象站建于电站30号箱变附近,每5分钟将采集的数据通过光纤传输到机房;数值天气预报数据利用中国电科院新能源气象应用机房的WRF业务系统(包括30TF计算刀片机、250TB并行存储)进行中尺度模式计算后输出预报产品,每日8点前通过反向隔离装置推送到电站内网预测系统。
国家基础学科公共科学数据中心 收录