KITTI dataset|点云分析数据集|机器学习数据集
收藏数据集概述
问题陈述
在无人机配送的背景下,确保精确且无障碍的导航是一个关键挑战。传统相机在特定场景下有效,但在恶劣天气或低光条件下可见度降低。单目相机在准确感知复杂3D环境方面存在挑战。此外,识别环境中所有潜在障碍物(从树木、电线到路灯杆和其他无人机)的挑战在于,障碍物检测所依赖的有限数据集无法涵盖所有对象。然而,3D数据通过关注对象的相对位置和速度,无需识别个体对象,从而增强了障碍物避免系统的无监督优化,提高了操作效率。
项目摘要
本项目使用KITTI数据集进行实际的点云分析,首先使用Open3D进行可视化,并应用Voxel Grid进行下采样。然后,通过RANSAC算法从道路表面分割障碍物,增强场景理解。利用DBSCAN聚类,对相似障碍物进行聚类,以获得更准确的空间洞察。为了实现跟踪,围绕每个障碍物创建3D边界框。最后,对由iPhone的LiDAR生成的自定义点云进行表面重建。项目的目标是展示机器学习算法在处理3D空间中的点云数据的应用。
行动计划
- 理解LiDAR
- 点云处理
- 使用Voxel Grid下采样
- 使用RANSAC进行分割
- 使用DBSCAN进行聚类
- 使用PCA创建3D边界框
- 表面重建
数据集应用
- KITTI数据集:本项目使用KITTI数据集,该数据集包含同步的立体图像和LiDAR数据,用于分析和处理点云数据。
- Open3D:用于点云的可视化和处理,包括下采样、分割、聚类和表面重建。
- Voxel Grid:用于下采样,减少点云中的点数,同时保持其基本结构。
- RANSAC:用于从道路表面分割障碍物,提高场景理解的准确性。
- DBSCAN:用于聚类相似的障碍物,提供更精确的空间信息。
- PCA:用于创建围绕每个障碍物的3D边界框,实现障碍物的跟踪。
- 表面重建:对由iPhone的LiDAR生成的自定义点云进行表面重建,展示点云数据的实际应用。
本项目通过这些技术和数据集,展示了如何利用机器学习算法处理和分析3D点云数据,以解决无人机配送中的导航和障碍物检测问题。

HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
网易云音乐数据集
该数据集包含了网易云音乐平台上的歌手信息、歌曲信息和歌单信息,数据通过爬虫技术获取并整理成CSV格式,用于音乐数据挖掘和推荐系统构建。
github 收录
Global Volcanism Program (GVP)
该数据集包含了全球火山活动的详细信息,包括火山的位置、类型、历史喷发记录、喷发频率等。数据集还提供了关于火山活动的研究报告和相关文献的链接。
volcano.si.edu 收录
Yahoo Finance
Dataset About finance related to stock market
kaggle 收录
Traditional-Chinese-Medicine-Dataset-SFT
该数据集是一个高质量的中医数据集,主要由非网络来源的内部数据构成,包含约1GB的中医各个领域临床案例、名家典籍、医学百科、名词解释等优质内容。数据集99%为简体中文内容,质量优异,信息密度可观。数据集适用于预训练或继续预训练用途,未来将继续发布针对SFT/IFT的多轮对话和问答数据集。数据集可以独立使用,但建议先使用配套的预训练数据集对模型进行继续预训练后,再使用该数据集进行进一步的指令微调。数据集还包含一定比例的中文常识、中文多轮对话数据以及古文/文言文<->现代文翻译数据,以避免灾难性遗忘并加强模型表现。
huggingface 收录