five

UrbanScene3D|城市场景感知数据集|3D重建数据集

收藏
arXiv2022-07-19 更新2024-06-21 收录
城市场景感知
3D重建
下载链接:
https://vcc.tech/UrbanScene3D
下载链接
链接失效反馈
资源简介:
UrbanScene3D是由深圳大学创建的大型城市场景感知和重建研究数据平台,包含超过12.8万张高分辨率图像,覆盖16个场景,总面积达136平方公里。该数据集不仅包含高精度激光雷达扫描,还有数百个具有不同观测模式的图像集,为设计和评估空中路径规划和3D重建算法提供了全面的基准。此外,该数据集基于Unreal Engine和Airsim模拟器,结合手动标注的独特实例标签,能够生成各种数据,如2D深度图、2D/3D边界框和3D点云/网格分割等。模拟器不仅能够产生多样化的数据,还能让用户在提出的城市环境中模拟汽车或无人机,为未来的研究提供支持。UrbanScene3D旨在解决户外研究中由于缺乏有效设备和大规模尺度带来的数据捕捉难度,以及由于多变的天气和光照条件导致的数据结构化和设计鲁棒采集算法的挑战。
提供机构:
深圳大学
创建时间:
2021-07-09
AI搜集汇总
数据集介绍
main_image_url
构建方式
UrbanScene3D数据集的构建融合了真实世界与合成场景,涵盖了16个场景,总面积达136平方公里。该数据集通过无人机搭载的高分辨率相机和激光雷达设备,捕捉了超过128,000张图像和精确的激光扫描数据。此外,数据集利用Unreal Engine和AirSim模拟器,结合人工标注的建筑物实例标签,生成包括2D深度图、2D/3D边界框和3D点云/网格分割等多种数据类型。
特点
UrbanScene3D数据集的显著特点在于其大规模、高分辨率和多样化的数据类型。数据集不仅包含真实城市的详细重建,还包括合成城市的高质量模型,为研究提供了丰富的基准。此外,数据集支持多种数据生成,如2D深度图和3D点云分割,以及物理引擎和光照系统的模拟,使得用户能够在复杂的城市环境中进行无人机和自动驾驶汽车的模拟实验。
使用方法
UrbanScene3D数据集适用于多种研究领域,包括但不限于无人机路径规划、3D重建算法评估和城市环境感知。用户可以通过访问数据集的官方网站下载所需数据,并利用提供的模拟平台进行实验。数据集中的高精度激光扫描数据和合成场景的地面真实模型,为算法评估提供了可靠的基准。此外,用户还可以利用模拟器在不同光照和天气条件下进行实验,以测试算法的鲁棒性和适应性。
背景与挑战
背景概述
UrbanScene3D数据集由深圳大学的Liqiang Lin、Yilin Liu、Yue Hu、Xingguang Yan、Ke Xie和Hui Huang⋆团队于近年创建,旨在为城市场景感知与重建研究提供大规模数据平台。该数据集包含超过128,000张高分辨率图像,覆盖16个场景,总面积达136平方公里,涵盖真实城市区域和合成城市。UrbanScene3D不仅提供高精度LiDAR扫描和多种观测模式的图像集,还基于Unreal Engine和AirSim模拟器,生成2D深度图、2D/3D边界框和3D点云/网格分割等多种数据。该数据集的推出,极大地推动了无人机路径规划和3D重建算法的设计与评估研究。
当前挑战
UrbanScene3D数据集面临的挑战主要包括:1) 城市环境的大规模和复杂性使得数据采集变得极为困难,尤其是在天气和光照条件多变的情况下;2) 构建过程中,如何确保无人机路径规划的效率和重建结果的精度是一个重大难题。此外,数据集的多样性和真实性之间的平衡,以及如何在模拟环境中有效模拟真实世界的物理和光照条件,也是当前研究的重点和难点。
常用场景
经典使用场景
UrbanScene3D数据集的经典使用场景主要集中在城市场景的感知与重建研究中。该数据集通过提供大规模的高分辨率图像、高精度LiDAR扫描数据以及多种观测模式下的图像集,为设计和评估空中路径规划和三维重建算法提供了全面的基准。研究者可以利用这些数据进行多视角立体(MVS)技术的实验,以及无人机在复杂城市环境中的路径规划和自主导航任务的模拟。
实际应用
UrbanScene3D数据集在实际应用中具有广泛的前景,特别是在城市规划、智能交通系统和无人机导航等领域。通过该数据集,城市规划者可以更精确地进行三维城市模型的重建和更新,智能交通系统可以利用高精度的三维数据进行路径规划和交通流量管理,无人机制造商和运营商则可以利用数据集进行飞行路径优化和自主导航算法的测试与验证。
衍生相关工作
UrbanScene3D数据集的发布催生了一系列相关研究工作,特别是在无人机路径规划和三维重建领域。例如,Smith等人和Zhou等人分别提出了基于该数据集的路径规划优化方法,Zhang等人则进一步提出了连续路径规划技术。此外,该数据集还激发了对城市场景深度估计、实例分割和新型视图合成的研究,推动了计算机视觉和机器人学领域的技术进步。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Breast Cancer Dataset

该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。

github 收录

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

中国高分辨率高质量PM2.5数据集(2000-2023)

ChinaHighPM2.5数据集是中国高分辨率高质量近地表空气污染物数据集(ChinaHighAirPollutants, CHAP)中PM2.5数据集。该数据集利用人工智能技术,使用模式资料填补了卫星MODIS MAIAC AOD产品的空间缺失值,结合地基观测、大气再分析和排放清单等大数据生产得到2000年至今全国无缝隙地面PM2.5数据。数据十折交叉验证决定系数R2为0.92,均方根误差RMSE为10.76 µg/m3。主要范围为整个中国地区,空间分辨率为1 km,时间分辨率为日、月、年,单位为µg/m3。注意:该数据集持续更新,如需要更多数据,请发邮件联系作者(weijing_rs@163.com; weijing@umd.edu)。 数据文件中包含NC转GeoTiff的四种代码(Python、Matlab、IDL和R语言)nc2geotiff codes。

国家青藏高原科学数据中心 收录

TIMIT

TIMIT 阅读语音语料库的开发旨在为声学语音研究和自动语音识别系统的评估提供语音数据。 TIMIT 包含 630 个人/说话者的 8 种不同美式英语方言的高质量录音,每个人阅读多达 10 个语音丰富的句子。

OpenDataLab 收录