five

RadChar|雷达信号处理数据集|特征化数据集

收藏
github2024-10-03 更新2024-10-04 收录
雷达信号处理
特征化
下载链接:
https://github.com/abcxyzi/RadCharSSL
下载链接
链接失效反馈
资源简介:
RadChar是我们自己的数据集,用于雷达信号特征化。该数据集在2023年IEEE国际声学、语音和信号处理会议研讨会上介绍。
创建时间:
2024-09-16
原始信息汇总

数据集概述

本仓库包含四个雷达数据集,这些数据集伴随论文《通过自监督学习和领域适应进行雷达信号识别》提交至IEEE国际声学、语音和信号处理会议(ICASSP 2025)。

数据集列表

  1. RadioML - 仅包含电信信号。
  2. DeepRadar - 仅包含雷达信号。
  3. RadarComm - 包含电信和雷达信号的混合。
  4. RadChar - 仅包含雷达信号。

RadioML (电信数据)

  • 来源: DeepSig Inc
  • 特征:
    • 24个类别
    • 26个信噪比级别(-20至30 dB,分辨率为2 dB)
    • 每帧1,024个I/Q样本
    • 时间分辨率为1 μs
  • 文件: GOLD_XYZ_OSC.0001_1024.hdf5 (21.45 GB)
  • 下载链接: https://www.kaggle.com/datasets/pinxau1000/radioml2018

DeepRadar (雷达数据)

  • 来源: Radar and Microwave Group
  • 特征:
    • 23个类别
    • 17个信噪比级别(-12至20 dB,分辨率为2 dB)
    • 每帧1,024个I/Q样本
    • 时间分辨率为0.01 μs
  • 文件: 分为训练、验证和测试集的.mat文件
  • 下载链接: https://www.kaggle.com/datasets/pinxau1000/radioml2018

RadarComm (电信与雷达数据)

  • 来源: ANDRO Computational Solutions
  • 特征:
    • 6个调制类别和8个信号类别(每帧双重标注)
    • 17个信噪比级别(-12至20 dB,分辨率为2 dB)
    • 每帧128个I/Q样本
    • 时间分辨率为0.1 μs
  • 文件: 多个.zip文件
  • 下载链接: https://www.kaggle.com/datasets/pinxau1000/radioml2018

RadChar (雷达数据)

  • 来源: 本研究
  • 特征:
    • 5个类别
    • 41个信噪比级别(-20至20 dB,分辨率为1 dB)
    • 每帧512个I/Q样本
    • 时间分辨率为0.3 μs
  • 文件: 多个.h5文件
  • 下载链接: https://github.com/abcxyzi/RadChar

RadChar变体

  • RadChar-SSL: 用于预训练
  • RadChar-nShot: 用于少样本微调(n = 1, 5, 10)
  • RadChar-Eval: 用于评估

RadChar-Eval

  • 来源: RadChar-Baseline的10%分割
  • 用途: 作为评估数据集
  • 下载链接: 即将提供

RadChar-nShot

  • 来源: RadChar-Baseline的90%分割
  • 用途: 用于少样本微调
  • 下载链接: 即将提供

RadChar-SSL

  • 特征:
    • 5个类别
    • 41个信噪比级别(-20至20 dB,分辨率为1 dB)
    • 每帧512个I/Q样本
    • 时间分辨率为0.3 μs
    • 500,000帧
  • 用途: 仅用于预训练
AI搜集汇总
数据集介绍
main_image_url
构建方式
在雷达信号识别领域,RadChar数据集的构建基于多任务学习框架,旨在支持自监督预训练、少样本微调及模型评估。该数据集包含多个变体,如RadChar-SSL用于预训练,RadChar-nShot用于少样本微调,RadChar-Eval用于评估。RadChar-SSL是通过生成合成数据创建的,而RadChar-nShot和RadChar-Eval则从RadChar-Baseline中随机分割得到,分别用于训练和测试。
特点
RadChar数据集的显著特点在于其精细的SNR级别划分和多样化的数据变体。该数据集包含5个类别,41个SNR级别(从-20dB到20dB,分辨率为1dB),每帧包含512个I/Q样本,时间分辨率为0.3μs。此外,RadChar-SSL的合成数据特性使其特别适用于自监督学习,而RadChar-nShot的少样本设计则增强了其在实际应用中的适应性。
使用方法
RadChar数据集的使用方法多样,适用于不同阶段的模型训练和评估。RadChar-SSL适用于自监督预训练,RadChar-nShot适用于少样本微调,而RadChar-Eval则用于最终的模型评估。用户可根据具体需求选择合适的数据集变体,并通过提供的下载链接获取数据。此外,数据集的详细使用指南和代码示例可在相关GitHub页面中找到,确保用户能够高效地利用该数据集进行研究和开发。
背景与挑战
背景概述
RadChar数据集是由一支专注于雷达信号识别的研究团队创建的,该团队在2023年IEEE国际声学、语音和信号处理会议(ICASSP)上提交了题为“通过自监督学习和领域适应进行雷达信号识别”的论文。RadChar数据集的构建旨在支持自监督预训练、少样本微调以及模型评估,其核心研究问题是如何在复杂和多样化的雷达信号环境中实现高效且准确的信号分类。该数据集的推出,为雷达信号处理领域提供了一个重要的基准,推动了相关技术的进一步发展。
当前挑战
RadChar数据集在构建过程中面临多项挑战。首先,雷达信号的复杂性和多样性使得数据标注和分类变得极为困难。其次,自监督预训练和少样本微调的需求增加了数据集的多样性和覆盖范围,这对数据生成和处理技术提出了更高的要求。此外,数据集的规模和质量直接影响到模型的训练效果,如何在有限的资源下生成高质量的合成数据也是一个重要的挑战。最后,数据集的评估标准和方法需要不断优化,以确保模型的泛化能力和实际应用效果。
常用场景
经典使用场景
在雷达信号识别领域,RadChar数据集以其独特的结构和丰富的特征,成为自监督学习和领域适应研究的重要资源。该数据集的经典使用场景包括自监督预训练、少样本微调以及模型评估。通过RadChar-SSL变体,研究者可以在无标签数据上进行预训练,从而提升模型的泛化能力。RadChar-nShot变体则为少样本学习提供了理想的实验平台,支持在有限标注数据下进行模型微调。RadChar-Eval变体则用于模型性能的最终评估,确保研究结果的可靠性和准确性。
衍生相关工作
RadChar数据集的发布催生了一系列相关研究工作。例如,基于RadChar-SSL变体的自监督学习方法已被应用于多个雷达信号识别任务,显著提升了模型的性能。RadChar-nShot变体则激发了少样本学习在雷达信号领域的研究热潮,推动了相关算法的创新和发展。此外,RadChar-Eval变体的标准化评估方法也为后续研究提供了基准,促进了雷达信号识别领域的技术进步。这些衍生工作不仅丰富了RadChar的应用场景,也为该领域的持续发展奠定了坚实基础。
数据集最近研究
最新研究方向
在雷达信号识别领域,RadChar数据集的最新研究方向主要集中在自监督学习和领域适应性上。该数据集通过引入RadChar-SSL用于自监督预训练,RadChar-nShot用于少样本微调,以及RadChar-Eval用于模型评估,推动了雷达信号分类技术的进步。这些研究不仅提升了模型的泛化能力,还显著降低了数据依赖性,为实际应用中的信号识别提供了更为灵活和高效的解决方案。此外,RadChar数据集的发布也为相关领域的研究者提供了宝贵的资源,促进了雷达信号处理技术的快速发展和广泛应用。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

SuMeyYao/ysmpubmedclt

该数据集的许可证为apache-2.0,主要用于表格问答任务,数据集语言为英语,大小介于1亿到10亿之间。

hugging_face 收录

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

Breast Cancer Dataset

该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。

github 收录

Figshare

Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。

figshare.com 收录