HeLiPR|地点识别数据集|3D点云数据集
收藏HeLiPR-Place-Recognition 数据集概述
数据集简介
HeLiPR 数据集用于比较不同的地点识别方法,使用 3D 点云数据,每帧扫描包含 8192 个点。数据集包括以下序列:
数据集详情
-
Ouster - Narrow
- 数据库:
Sequence01-Ouster
- 查询:
Sequence01-Aeva
,Sequence01-Livox
,Sequence02-Aeva
,Sequence02-Livox
,Sequence03-Aeva
,Sequence03-Livox
- 数据库:
-
Aeva - Wide
- 数据库:
Sequence01-Aeva
- 查询:
Sequence01-Ouster
,Sequence01-Velodyne
,Sequence02-Ouster
,Sequence02-Velodyne
,Sequence03-Ouster
,Sequence03-Velodyne
- 数据库:
-
Bridge
- Ouster - Narrow
- 数据库:
Sequence01-Ouster
- 查询:
Sequence01-Ouster
,Sequence01-Velodyne
,Sequence02-Ouster
,Sequence02-Velodyne
- 数据库:
- Ouster - Narrow
数据集下载
验证数据集可以从 这里 下载,包含以下内容:
- 从 HeLiPR 数据集采样的点云数据(Roundabout, Town, Bridge)
- 每个方法的检查点文件
- 重叠矩阵文件
每个扫描包含 8192 个点,采样间隔为 5 米。
目录结构
数据集的目录结构如下:
HeLiPR-Place-Recognition ├── model_X ├── data_validation │ ├── SequenceA-Sensor1 │ │ ├── LiDAR │ │ │ ├── 000000.bin │ │ │ ├── 000001.bin │ │ │ └── ... │ │ └── trajectory.csv │ ├── SequenceB-Sensor2 │ │ ├── LiDAR │ │ │ ├── 000000.bin │ │ │ ├── 000001.bin │ │ │ └── ... │ │ └── trajectory.csv │ └── ... ├── data_overlap │ ├── overlap_matrix_validation_SequenceA.txt │ ├── overlap_matrix_validation_SequenceB.txt │ └── ... ├── data_ckpt │ ├── X_ckpt.pth │ ├── Y_ckpt.pth │ └── ...
使用方法
1. 构建 Docker 镜像并启动容器
bash docker build -t helipr_evaluation . docker run --gpus all -dit --env="DISPLAY" --net=host --ipc=host --volume="/tmp/.X11-unix:/tmp/.X11-unix:rw" -v /:/mydata --volume /dev/:/dev/ helipr_evaluation:latest /bin/bash
2. 克隆仓库
bash git clone https://github.com/minwoo0611/HeLiPR-Place-Recognition cd HeLiPR-Place-Recognition
3. 生成 HeLiPR 数据集的 Pickle 文件
运行以下脚本:
bash python generate_test_sets.py
4. 运行每个方法的验证代码
进入要测试的方法目录,并按照其 README.md
中的说明操作。
bash cd model_X
按照 model_X/README.md 中的说明操作

中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
URPC系列数据集, S-URPC2019, UDD
URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。
github 收录
TM-Senti
TM-Senti是由伦敦玛丽女王大学开发的一个大规模、远距离监督的Twitter情感数据集,包含超过1.84亿条推文,覆盖了超过七年的时间跨度。该数据集基于互联网档案馆的公开推文存档,可以完全重新构建,包括推文元数据且无缺失推文。数据集内容丰富,涵盖多种语言,主要用于情感分析和文本分类等任务。创建过程中,研究团队精心筛选了表情符号和表情,确保数据集的质量和多样性。该数据集的应用领域广泛,旨在解决社交媒体情感表达的长期变化问题,特别是在表情符号和表情使用上的趋势分析。
arXiv 收录
UniProt
UniProt(Universal Protein Resource)是全球公认的蛋白质序列与功能信息权威数据库,由欧洲生物信息学研究所(EBI)、瑞士生物信息学研究所(SIB)和美国蛋白质信息资源中心(PIR)联合运营。该数据库以其广度和深度兼备的蛋白质信息资源闻名,整合了实验验证的高质量数据与大规模预测的自动注释内容,涵盖从分子序列、结构到功能的全面信息。UniProt核心包括注释详尽的UniProtKB知识库(分为人工校验的Swiss-Prot和自动生成的TrEMBL),以及支持高效序列聚类分析的UniRef和全局蛋白质序列归档的UniParc。其卓越的数据质量和多样化的检索工具,为基础研究和药物研发提供了无可替代的支持,成为生物学研究中不可或缺的资源。
www.uniprot.org 收录
Wind Turbine Data
该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。
www.kaggle.com 收录