SARD数据集|软件漏洞分析数据集|数据分类数据集
收藏SARD数据集概述
数据集目的
解析SARD数据集,进行分类(有无漏洞)和标注(CWE编号+触发行号)。
文件类型处理
- bad:判断能否通过编译。
- good:判断能否通过编译。
- mixed:
- 单文件:根据宏定义拆分,保留main函数。
- 多文件:暂不处理,后续考虑文件合并。
标注方式
- 解析xml文件获取样本信息。
- 读取样本,分割处理后保存至单独文件夹。
- 可选:创建新xml文件指定处理后样本信息。

中国近海地形数据集(渤海,黄海,东海,南海)
本数据集包含历年来通过收集和实测方法取得的中国近海水深点数据、地形图数据(ArcGIS格式),以及黄河口、莱州湾东部、辽东湾、山东南部沿海、南海部分海域的单波束、多波束水深测量数据,包括大尺度的低密度水深数据与局部高密度水深数据。
地球大数据科学工程 收录
YOLO Drone Detection Dataset
为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。
github 收录
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录
ERCOT电网综合数据集
ERCOT电网综合数据集是由德克萨斯A&M大学和哈佛大学的研究团队创建的,旨在支持电力系统中的多元时间序列预测。该数据集包含五年内的负荷、电价、辅助服务价格和可再生能源发电数据,具有每小时的时间分辨率和区域级别的详细信息。数据集的创建过程结合了高分辨率的外部预测数据,以提高预测精度。该数据集主要应用于电力系统的预测和优化,旨在解决电网中由于可再生能源集成和需求变化带来的不确定性问题。
arXiv 收录
UAV-VisLoc - 用于无人机视觉定位的大规模数据集
UAV-VisLoc数据集由北京邮电大学、中科院和香港城市大学联合构建,旨在解决无人机在失去全球导航卫星系统信号时的精确定位问题。该数据集涵盖了中国11个不同地点的无人机图像,捕获了多样化的地形特征,包括固定翼无人机和多地形无人机在不同高度和方向上拍摄的6742张图像以及11幅卫星地图。每张图像均附有经纬度、高度、拍摄日期和航向角等元数据,为模型的训练与测试提供了丰富多元的数据支持。UAV-VisLoc数据集用于支持无人机视觉定位任务,为无人机视觉定位任务提供了训练和测试样本,通过匹配无人机拍摄的地面向下视角图像与正射卫星地图,实现无人机的自主视觉定位。
github 收录