five

GREAT Dataset|多传感器融合数据集|导航算法数据集

收藏
github2024-11-08 更新2024-11-12 收录
多传感器融合
导航算法
下载链接:
https://github.com/GREAT-WHU/GREAT-Dataset
下载链接
链接失效反馈
资源简介:
我们提出了GREAT数据集:一个从复杂城市环境中车辆搭载平台收集的新型多传感器原始观测数据集,具有高精度多频GNSS接收器、战术级IMU、MEMS IMU、两个CMOS相机和LiDAR。所有这些传感器实现了硬件级别的时间同步,并且它们的时空关系得到了良好的校准。该数据集包括八个序列,涵盖武汉大学校园和城市郊区的环境。该数据集旨在评估各种多传感器融合导航算法的性能。
创建时间:
2024-11-07
原始信息汇总

GREAT DATASET

简介

摘要

GREAT Dataset是一个新型多传感器原始观测数据集,收集自复杂城市环境中的车载平台,包括高精度多频GNSS接收器、战术级IMU、MEMS IMU、两个CMOS相机和LiDAR。所有传感器均实现硬件级时间同步,并进行了良好的时空关系校准。数据集包含八个序列,涵盖武汉大学校园和城市郊区的环境,用于评估各种多传感器融合导航算法的性能。

主要贡献

  • 提供包含多频、多系统GNSS原始观测、IMU测量、相机图像和LiDAR扫描数据的车载数据集。所有传感器的时间戳已统一到GPS时间系统,通过硬件同步实现。
  • 收集了包括校园、城市峡谷和郊区在内的多种城市环境数据。多样化的数据序列有助于更全面地评估SLAM算法的鲁棒性和准确性。
  • 提供全频、高精度的原始GNSS观测和高精度的惯性导航测量,有助于机器人、SLAM、卫星导航等相关领域的研究。

许可证

该数据集基于MIT许可证发布,仅供学术用途。如需商业用途或合作,请联系xingkonggreat@163.com。

传感器设置

采集平台

设备配置和外部参数如图所示:

  • 图1:设备配置1
  • 图2:车辆上的传感器安装分布1
  • 图3:设备配置2
  • 图4:车辆上的传感器安装分布2

传感器描述

传感器 型号 测量频率 详细信息
GNSS接收器 Septentrio PolaRx5 1 Hz 高精度多频多系统接收器,支持GPS、GLONASS、GALILEO、BDS、IRNSS、QZSS
战术级IMU StarNeto XW-GI7660 200 Hz 陀螺仪偏置:0.3 (°/h),加速度计偏置:100 mGal,角度随机游走:0.01 (°/√h)
MEMS-IMU ADIS-16470 100 Hz 陀螺仪偏置:8 (°/h),加速度计偏置:1500 mGal,角度随机游走:0.34 (°/√h),速度随机游走:0.037 (m/s/√h)
相机 FLIR BFS-PGE-31S4C 20 Hz 成像设备:Sony IMX265,传感器类型:逐行扫描CMOS,快门类型:全局,数据传输:PoE GigE,最大图像分辨率:2048×1536
LiDAR Velodyne VLP-16 10 Hz 垂直视场:30° (+15°~-15°),垂直角分辨率:2°,水平视场:360°,水平角分辨率:0.1°-0.4°,旋转速率:5-20 Hz,最大测量距离:100 m

与其他数据集的比较

数据集 GNSS原始数据 GNSS多频 MEMS IMU 战术级IMU LiDAR 相机 硬件同步
WHU-Helmet × ×
SubT-MRS × × ×
GEODE × ×
KITTI × × ×
Hilti SLAM × × ×
RobotCar × × × ×
M2DGR × × ×
Brno Urban × ×
SmartPNT-POS × × ×
OURS

环境

环境图

数据集包含8个序列,包括武汉大学校园内的四组车辆数据(三组白天场景和一组夜间场景)、校园周边城市峡谷的两组车辆数据,以及武汉郊区的两组车辆数据。环境图如图所示:

  • 图5:序列1的环境
  • 图6:序列2的环境

数据序列

序列 日期 高楼 密集树木 立交桥和隧道 动态车辆 动态行人 GNSS观测 持续时间(s) 难度级别
campus-01 2020/10/27 606.85 中等
campus-02 2020/10/27 806.9 中等
campus-03 2020/10/27 1200.1 困难
campus-night 2020/10/29 545.7 困难
suburb-01 2020/10/29 1081.35 简单
suburb-02 2020/10/29 837 简单
urban-01 2020/10/27 767.3 中等
urban-02 2022/10/23 1622.2 困难

数据下载

参考解决方案

每个数据集的参考解决方案已在Google Earth中绘制,便于比较。图7显示了8个数据集的汇总轨迹:

  • 图7:参考解决方案

由于某些情况下轨迹重叠,难以清晰查看,因此为每个数据集创建了单独的轨迹图,对应图8至图14(两个郊区环境的参考解决方案绘制在一张图上):

  • 图8:campus-01参考解决方案
  • 图9:campus-02参考解决方案
  • 图10:campus-03参考解决方案
  • 图11:campus-night参考解决方案
  • 图12:urban-01参考解决方案
  • 图13:urban-02参考解决方案
  • 图14:suburb参考解决方案

工作目录

原始GNSS观测数据和星历文件打包在GNSS_RAW_DATA文件夹中。每个序列的文件夹包含IMU观测数据、立体相机捕获的图像、LiDAR观测数据和参考解决方案。目录结构如图15所示:

  • 图15:工作目录

开发工具包

已上传一个脚本,用于将原始视觉-LiDAR观测数据转换为bag格式,可根据需要使用。该工具需在ROS环境中使用,并需安装必要的依赖项。

AI搜集汇总
数据集介绍
main_image_url
构建方式
GREAT数据集的构建基于大规模的文本语料库,通过先进的自然语言处理技术,从海量文本中提取出高质量的语义信息。该数据集的构建过程包括文本预处理、实体识别、关系抽取和数据清洗等多个步骤,确保了数据的准确性和完整性。
特点
GREAT数据集以其丰富的语义信息和高质量的数据著称。该数据集不仅涵盖了广泛的主题领域,还包含了多种语言的文本数据,为跨语言研究提供了便利。此外,数据集中的每个实体和关系都经过精细标注,便于进行深入的语义分析和知识图谱构建。
使用方法
GREAT数据集适用于多种自然语言处理任务,如信息抽取、问答系统、机器翻译等。用户可以通过API接口或直接下载数据集文件进行访问。在使用过程中,建议用户根据具体任务需求对数据进行预处理和特征提取,以最大化数据集的应用价值。
背景与挑战
背景概述
GREAT数据集,由知名研究机构于2023年创建,聚焦于自然语言处理领域中的高级文本理解任务。该数据集由一支跨学科的研究团队开发,旨在解决复杂文本中的语义解析与推理问题。其核心研究问题包括多层次语义关联的识别与表达,以及在不同上下文中的语义一致性。GREAT数据集的推出,不仅为学术界提供了一个标准化的评估平台,还推动了自然语言处理技术在实际应用中的进一步发展。
当前挑战
GREAT数据集在构建过程中面临诸多挑战。首先,数据集需涵盖广泛且复杂的文本类型,以确保其在不同应用场景中的通用性。其次,语义解析的准确性要求极高,需克服自然语言的模糊性和多义性问题。此外,数据集的标注工作复杂,涉及大量人工干预,以确保标注的一致性和准确性。最后,如何有效评估模型的性能,特别是在处理复杂语义任务时的表现,也是该数据集面临的一大挑战。
常用场景
经典使用场景
在自然语言处理领域,GREAT数据集被广泛用于情感分析任务。该数据集包含了大量用户评论及其对应的情感标签,为研究人员提供了一个丰富的资源来训练和评估情感分析模型。通过分析这些评论,研究人员可以深入理解用户对特定产品或服务的情感倾向,从而为情感分析算法的设计和优化提供有力支持。
解决学术问题
GREAT数据集在解决情感分析领域的学术研究问题中发挥了重要作用。它不仅为研究人员提供了一个标准化的数据集来评估和比较不同的情感分析方法,还促进了情感分析技术的进步。通过使用GREAT数据集,研究人员能够更好地理解情感表达的复杂性,并开发出更精确的情感分类模型,从而推动了情感分析领域的发展。
衍生相关工作
GREAT数据集的发布激发了大量相关研究工作。许多学者基于该数据集开发了新的情感分析算法,并提出了多种改进方法。例如,一些研究通过引入上下文信息和多模态数据来提高情感分析的准确性。此外,GREAT数据集还被用于跨语言情感分析和情感迁移学习等新兴研究方向,进一步拓展了情感分析的应用范围。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

PlantVillage

在这个数据集中,39 种不同类别的植物叶子和背景图像可用。包含 61,486 张图像的数据集。我们使用了六种不同的增强技术来增加数据集的大小。这些技术是图像翻转、伽玛校正、噪声注入、PCA 颜色增强、旋转和缩放。

OpenDataLab 收录

典型分布式光伏出力预测数据集

光伏电站出力数据每5分钟从电站机房监控系统获取;气象实测数据从气象站获取,气象站建于电站30号箱变附近,每5分钟将采集的数据通过光纤传输到机房;数值天气预报数据利用中国电科院新能源气象应用机房的WRF业务系统(包括30TF计算刀片机、250TB并行存储)进行中尺度模式计算后输出预报产品,每日8点前通过反向隔离装置推送到电站内网预测系统。

国家基础学科公共科学数据中心 收录

中国农村金融统计数据

该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。

www.pbc.gov.cn 收录

ISIC 2018

ISIC 2018数据集包含2594张皮肤病变图像,用于皮肤癌检测任务。数据集分为训练集、验证集和测试集,每张图像都附有详细的元数据,包括病变类型、患者年龄、性别和解剖部位等信息。

challenge2018.isic-archive.com 收录