five

CVEfixes|安全研究数据集|漏洞检测数据集

收藏
魔搭社区2025-05-13 更新2024-08-31 收录
安全研究
漏洞检测
下载链接:
https://modelscope.cn/datasets/OmniData/CVEfixes
下载链接
链接失效反馈
资源简介:
displayName: CVEfixes license: - CC BY 4.0 paperUrl: https://arxiv.org/pdf/2107.08760v1.pdf publishDate: "2021-07-18" publishUrl: https://zenodo.org/record/4476564 publisher: - Simula Research Laboratory tags: - Vulnerabilities taskTypes: - Vulnerability Detection --- # 数据集介绍 ## 简介 CVEfixes 是一个全面的漏洞数据集,它从美国公共国家漏洞数据库 (NVD) 中的常见漏洞和暴露 (CVE) 记录中自动收集和整理。目标是通过提供不同相互关联的抽象级别(例如提交、文件和方法级别)的详细信息,支持基于源代码和与 NVD 中 CVE 修复相关的源代码指标的数据驱动的安全研究,以及存储库和 CVE 级别。在初始版本中,数据集涵盖了截至 2021 年 6 月 9 日的所有已发布 CVE。在此时间范围内,在 NVD 中的 CVE 记录中报告并具有公开可用的 git 存储库的所有开源项目都被提取并考虑用于构建此漏洞数据集。该数据集组织为一个关系数据库,涵盖了 1754 个开源项目中的 5495 个漏洞修复提交,共有 180 个不同的通用弱点枚举 (CWE) 类型的 5365 个 CVE。数据集包括修复前后的源代码18249个文件,50322个函数。 ## 引文 ``` @inproceedings{bhandari2021cvefixes, title={CVEfixes: automated collection of vulnerabilities and their fixes from open-source software}, author={Bhandari, Guru and Naseer, Amara and Moonen, Leon}, booktitle={Proceedings of the 17th International Conference on Predictive Models and Data Analytics in Software Engineering}, pages={30--39}, year={2021} } ``` ## Download dataset :modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-08
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

光伏电站发电量预估数据

1、准确预测一个地区分布式光伏场站的整体输出功率,可以提高电网的稳定性,增加电网消纳光电能量的能力,在降低能源消耗成本的同时促进低碳能源发展,实现动态供需状态预测的方法,为绿色电力源网荷储的应用落地提供支持。 2、准确预估光伏电站发电量,可以自动发现一些有故障的设备或者低效电站,提升发电效能。1、逆变器及电站数据采集,将逆变器中计算累计发电量数据,告警数据同步到Maxcompute大数据平台 2、天气数据采集, 通过API获取ERA5气象数据包括光照辐射、云量、温度、湿度等 3、数据特征构建, 在大数据处理平台进行数据预处理,用累计发电量矫正小时平均发电功率,剔除异常数据、归一化。告警次数等指标计算 4、异常数据处理, 天气、设备数据根据经纬度信息进行融合, 并对融合后的数据进行二次预处理操作,剔除辐照度和发电异常的一些数据 5、算法模型训练,基于XGBoost算法模型对历史数据进行训练, 生成训练集并保存至OSS 6、算法模型预测,基于XGBoost算法模型接入OSS训练集对增量数据进行预测, 并评估预测准确率等效果数据,其中误差率=(发电量-预估发电量)/发电量,当误差率低于一定阈值时,该数据预测为准确。预测准确率=预测准确数量/预测数据总量。

浙江省数据知识产权登记平台 收录

中国气象数据

本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。

github 收录

TPTP

TPTP(Thousands of Problems for Theorem Provers)是一个包含大量逻辑问题的数据集,主要用于定理证明器的测试和评估。它包含了多种逻辑形式的问题,如一阶逻辑、高阶逻辑、命题逻辑等。

www.tptp.org 收录

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录

Yahoo Finance

Dataset About finance related to stock market

kaggle 收录