five

BroSCH Dataset

收藏
github2019-08-01 更新2024-05-31 收录
下载链接:
https://github.com/renatahodovan/brosch-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集由BroSCH工具从WebKit和Firefox项目的提交历史和问题跟踪器中挖掘而来,包含提交ID、作者日期、提交日期以及引用的问题ID列表。数据集采用JSON格式,遵循BroSCH模式,并根据BSD 3-Clause许可证授权。

This dataset was mined by the BroSCH tool from the commit history and issue trackers of the WebKit and Firefox projects. It includes commit IDs, author dates, commit dates, and a list of referenced issue IDs. The dataset is formatted in JSON, adheres to the BroSCH schema, and is licensed under the BSD 3-Clause License.
创建时间:
2019-08-01
原始信息汇总

BroSCH Dataset (r2018) 概述

数据集描述

  • 名称: BroSCH Dataset (r2018)
  • 全称: Browser Security Commit History Dataset
  • 来源: 通过 BroSCH 工具 (版本 19.7) 从 WebKit 和 Firefox 的提交历史和问题跟踪器中挖掘得到,数据截止至2018年底。

数据集生成命令

  • WebKit:
    • 收集: ./brosch.py -b webkit collect -r ./WebKit --before "2019-01-01 00:00:00"
    • 识别: ./brosch.py -b webkit identify --retry 2
    • 匹配: ./brosch.py -b webkit match -r ./WebKit --before "2019-01-01 00:00:00"
  • Firefox:
    • 收集: ./brosch.py -b firefox collect -r ./gecko-dev --before "2019-01-01 00:00:00"
    • 识别: ./brosch.py -b firefox identify --retry 2
    • 匹配: ./brosch.py -b firefox match -r ./gecko-dev --before "2019-01-01 00:00:00"

数据集格式与内容

  • 格式: JSON
  • 内容: 包含提交ID、作者日期、提交日期及引用的问题ID列表。
  • 扩展信息: 可通过 BroSCH 工具获取作者名、提交者名及提交消息详情。

数据集许可证

  • 许可证: BSD 3-Clause License
搜集汇总
数据集介绍
main_image_url
构建方式
BroSCH Dataset乃是通过BroSCH工具从两个开源浏览器项目——WebKit与Firefox的提交历史和问题跟踪器中挖掘而构建的。该工具在2019年版本中执行了一系列命令,包括数据的收集、识别与匹配,时间范围限定在2018年底以前,从而确保了数据的时效性与相关性。
特点
该数据集以JSON格式呈现,遵循BroSCH的schema规范,包含提交ID、作者日期、提交日期以及引用的问题ID列表等关键信息。其结构化设计便于研究者在浏览器安全性分析中快速检索与利用相关数据,具备高度的可用性与可扩展性。
使用方法
用户可依照BroSCH工具的使用说明,对数据集进行扩展,添加作者名称、提交者名称及提交消息详情等额外信息。通过合规的使用方式,研究者能够高效地导入并分析数据集,以推进浏览器安全性的相关研究。
背景与挑战
背景概述
BroSCH Dataset(浏览器安全提交历史数据集)是一款专注于浏览器安全领域的开源数据集,创建于2018年。该数据集由BroSCH工具从WebKit和Firefox两个开源浏览器项目的历史提交和问题跟踪器中挖掘而得。作为安全研究的重要资源,BroSCH Dataset为研究人员提供了一个深入分析浏览器安全漏洞提交历史和跟踪其修复进度的平台,对浏览器安全性的研究以及对开源软件安全性的理解具有显著影响。
当前挑战
BroSCH Dataset在构建过程中面临的挑战主要包括:如何从复杂的开源项目历史中有效地提取与安全相关的提交信息,以及如何确保数据的准确性和完整性。在研究领域问题上,该数据集的挑战体现在如何利用这些历史数据来提高安全漏洞检测的准确性,以及如何从海量的提交记录中挖掘出有价值的安全模式。
常用场景
经典使用场景
在计算机科学领域,特别是开源软件安全性研究中,BroSCH Dataset以其独特的视角,提供了WebKit与Firefox两大开源浏览器项目自2018年以前的提交历史及问题追踪记录,为研究者提供了一手的分析材料。该数据集的经典使用场景在于,研究者可通过对提交信息的深度挖掘,分析软件安全漏洞的生命周期,从而为浏览器安全性的提升提供数据支撑。
解决学术问题
BroSCH Dataset解决了开源软件安全性研究中数据获取的难题,为学术研究提供了真实的软件安全漏洞数据。它使得研究者能够追踪漏洞从发现到修复的过程,评估不同安全实践的效果,这对于理解软件安全动态,推动安全性改进具有重要意义。
衍生相关工作
基于BroSCH Dataset,学术界已经衍生出一系列相关工作,包括但不限于软件安全漏洞预测模型、漏洞修复时间分析、以及安全漏洞特征提取等研究,这些工作进一步扩展了数据集的应用范围,为软件安全领域的研究提供了新的视角和方法。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作