RadChar|雷达信号处理数据集|特征化数据集
收藏数据集概述
本仓库包含四个雷达数据集,这些数据集伴随论文《通过自监督学习和领域适应进行雷达信号识别》提交至IEEE国际声学、语音和信号处理会议(ICASSP 2025)。
数据集列表
- RadioML - 仅包含电信信号。
- DeepRadar - 仅包含雷达信号。
- RadarComm - 包含电信和雷达信号的混合。
- RadChar - 仅包含雷达信号。
RadioML (电信数据)
- 来源: DeepSig Inc
- 特征:
- 24个类别
- 26个信噪比级别(-20至30 dB,分辨率为2 dB)
- 每帧1,024个I/Q样本
- 时间分辨率为1 μs
- 文件:
GOLD_XYZ_OSC.0001_1024.hdf5
(21.45 GB) - 下载链接: https://www.kaggle.com/datasets/pinxau1000/radioml2018
DeepRadar (雷达数据)
- 来源: Radar and Microwave Group
- 特征:
- 23个类别
- 17个信噪比级别(-12至20 dB,分辨率为2 dB)
- 每帧1,024个I/Q样本
- 时间分辨率为0.01 μs
- 文件: 分为训练、验证和测试集的
.mat
文件 - 下载链接: https://www.kaggle.com/datasets/pinxau1000/radioml2018
RadarComm (电信与雷达数据)
- 来源: ANDRO Computational Solutions
- 特征:
- 6个调制类别和8个信号类别(每帧双重标注)
- 17个信噪比级别(-12至20 dB,分辨率为2 dB)
- 每帧128个I/Q样本
- 时间分辨率为0.1 μs
- 文件: 多个
.zip
文件 - 下载链接: https://www.kaggle.com/datasets/pinxau1000/radioml2018
RadChar (雷达数据)
- 来源: 本研究
- 特征:
- 5个类别
- 41个信噪比级别(-20至20 dB,分辨率为1 dB)
- 每帧512个I/Q样本
- 时间分辨率为0.3 μs
- 文件: 多个
.h5
文件 - 下载链接: https://github.com/abcxyzi/RadChar
RadChar变体
- RadChar-SSL: 用于预训练
- RadChar-nShot: 用于少样本微调(n = 1, 5, 10)
- RadChar-Eval: 用于评估
RadChar-Eval
- 来源: RadChar-Baseline的10%分割
- 用途: 作为评估数据集
- 下载链接: 即将提供
RadChar-nShot
- 来源: RadChar-Baseline的90%分割
- 用途: 用于少样本微调
- 下载链接: 即将提供
RadChar-SSL
- 特征:
- 5个类别
- 41个信噪比级别(-20至20 dB,分辨率为1 dB)
- 每帧512个I/Q样本
- 时间分辨率为0.3 μs
- 500,000帧
- 用途: 仅用于预训练

SuMeyYao/ysmpubmedclt
该数据集的许可证为apache-2.0,主要用于表格问答任务,数据集语言为英语,大小介于1亿到10亿之间。
hugging_face 收录
学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
Breast Cancer Dataset
该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。
github 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录