GPR_Data|地面穿透雷达数据集|目标检测数据集
收藏GPR_Data 数据集概述
数据集描述
- 数据类型: 高分辨率地面穿透雷达(GPR)数据,包括A-scan和B-scan剖面。
- 频率: 使用400 MHz和200 MHz的天线采集数据。
- 数据量: 包含2239张图像及其对应的注释。
- 注释内容: 地下设施、空洞和完整区域的注释。
- 注释工具: 使用makesense.ai进行注释。
- 注释格式: 提供YOLO和VOC XML格式的注释文件。
数据采集
- 天线: 使用GSSI的400 MHz和200 MHz天线。
- 配置:
- 400 MHz天线:范围50 ns,增益点5,低通频率800 MHz,高通频率100 MHz,每扫描512个样本。
- 200 MHz天线:范围150 ns,增益点5,低通频率400 MHz,高通频率30 MHz,每扫描512个样本。
- 材料: 根据被检测材料调整介电常数。
数据可视化
- 图像示例: 包含注释的图像示例。
数据处理
- 裁剪: 使用Python脚本
crop.py将原始GPR剖面裁剪为224×224大小。 - 数据增强: 使用Python脚本
augmentation.py进行数据增强,包括几何变换、随机噪声、频谱偏移、弹性变形和时间偏移。
文件结构
GPR_data文件夹: 包含2239张图像,分为553张空洞图像、786张地下设施图像和900张完整区域图像。augmented_cavities文件夹: 包含553张空洞图像及其注释文件(VOC XML和YOLO格式)。augmented_utilities文件夹: 包含786张地下设施图像及其注释文件(VOC XML和YOLO格式)。augmented_intact文件夹: 包含900张完整区域图像。cavities文件夹: 包含79张原始空洞剖面。Utilities文件夹: 包含131张原始地下设施剖面。intact文件夹: 包含75张原始完整剖面。
引用
如果使用该数据集,请引用以下文献:
- A. MOJAHID, D. EL OUAI, K. El Amraoui, K. EL-HAMI, H. AITBENAMER, (2024). Intelligent Recognition of Subsurface Utilities and Voids: A Ground Penetrating Radar Dataset for Deep Learning Applications. in data in brief journal 10.17632/ww7fd9t325.1
下载
数据集可以从这里下载。

AIS数据集
该研究使用了多个公开的AIS数据集,这些数据集经过过滤、清理和统计分析。数据集涵盖了多种类型的船舶,并提供了关于船舶位置、速度和航向的关键信息。数据集包括来自19,185艘船舶的AIS消息,总计约6.4亿条记录。
github 收录
中国劳动力动态调查
“中国劳动力动态调查” (China Labor-force Dynamics Survey,简称 CLDS)是“985”三期“中山大学社会科学特色数据库建设”专项内容,CLDS的目的是通过对中国城乡以村/居为追踪范围的家庭、劳动力个体开展每两年一次的动态追踪调查,系统地监测村/居社区的社会结构和家庭、劳动力个体的变化与相互影响,建立劳动力、家庭和社区三个层次上的追踪数据库,从而为进行实证导向的高质量的理论研究和政策研究提供基础数据。
中国学术调查数据资料库 收录
Wind Turbine Data
该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。
www.kaggle.com 收录
MeSH
MeSH(医学主题词表)是一个用于索引和检索生物医学文献的标准化词汇表。它包含了大量的医学术语和概念,用于描述医学文献中的主题和内容。MeSH数据集包括主题词、副主题词、树状结构、历史记录等信息,广泛应用于医学文献的分类和检索。
www.nlm.nih.gov 收录
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
