SARDet-100k|雷达技术数据集|目标检测数据集
收藏数据集概述
数据集名称
- SARDet-100K
数据集描述
- SARDet-100K 是一个大规模的合成孔径雷达(SAR)图像多类别目标检测数据集,由南开大学VCIP课题组和CSIG机器视觉专委会、深势科技联合发布。该数据集整合了10个现有的SAR检测数据集,提供了大规模且多样化的数据资源,旨在推动SAR目标检测的研究。
数据集特点
- 规模:包含超过116,000张图像。
- 多样性:涵盖多种目标类别,包括船只、飞机、汽车、桥梁、港口和坦克等。
- 质量:数据集经过精心筛选和标准化处理,确保数据质量。
数据集组成
- 图像数量:总计116,598张图像,其中训练集94,493张,验证集10,492张,测试集11,613张。
- 实例数量:总计245,653个实例,其中训练集198,747个,验证集22,703个,测试集24,023个。
- 平均实例/图像:每张图像平均包含2.11个实例。
数据集下载
- 百度盘:SARDet-100K数据集
- OneDrive:图像,标注
模型权重下载
数据集统计
- 图像和实例级别统计:详细列出了各个子数据集的图像和实例数量,以及平均每张图像的实例数。
数据集应用
- 研究:用于SAR目标检测的研究,特别是在模型预训练和微调方面。
- 竞赛:作为PRCV2024 SARDet目标检测竞赛的主要数据集。
数据集创新点
- 首次:创建了COCO级别的大规模多类别SAR目标检测数据集。
- 方法:提出了Multi-Stage with Filter Augmentation(MSFA)预训练框架,有效解决了SAR目标检测中的数据域和模型结构差异问题。

CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
Data_on_Data_Analysts
我们正在探索数据分析师职位的就业市场趋势:需求技能、薪资变化和招聘模式。该数据集汇编了美国数据分析师职位的招聘信息,直接来源于Google的职位搜索结果。数据收集始于2022年11月4日,并持续增长,每天新增约100个职位信息,提供了当前就业市场的持续更新快照。
github 收录
AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录
A00_13081a.jpg
Link to OCHRE database: http://pi.lib.uchicago.edu/1001/org/ochre/a8598ac4-9093-d548-30f3-84ce2ec953a7
DataONE 收录
HIT-UAV
HIT-UAV数据集包含2898张红外热成像图像,这些图像从43,470帧无人机拍摄的画面中提取。数据集涵盖了多种场景,如学校、停车场、道路和游乐场,在不同的光照条件下,包括白天和夜晚。
github 收录