five

wangknn-dataset

收藏
github2024-03-18 更新2024-05-31 收录
下载链接:
https://github.com/kdsec/wangknn-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含100个监控页面(每个页面90个跟踪)和9000个未监控页面(每个页面1个跟踪)。

This dataset comprises 100 monitored pages (each with 90 tracks) and 9000 unmonitored pages (each with a single track).
创建时间:
2018-07-05
原始信息汇总

数据集概述

数据集名称

  • 名称: wangknn-dataset

数据集来源

  • 来源: 镜像自https://www.cse.ust.hk/~taow/wf/data/

数据集描述

  • 内容: 包含100个监控页面(每个页面90条记录)和9000个未监控页面(每个页面1条记录)。

数据集结构

  • 目录结构:

    ./ |_ data.zip |_ <monitored_page_num>-<trace_num> |_ <unmonitored_page_number>

    例如,100-20包含第100个页面的第20条记录。

数据集示例

  • 示例内容:

    0.0 1 0.0 1 0.198159217834 1 0.380212068558 -1 0.380212068558 -1 0.53525519371 1 0.552129030228 -1 0.562554121017 -1 0.562554121017 -1

    • 表格格式:
      Time Direction
搜集汇总
数据集介绍
main_image_url
构建方式
wangknn-dataset的构建源于对网站指纹识别攻击与防御的深入研究。该数据集包含了100个被监控的网页,每个网页有90条追踪记录,以及9000个未被监控的网页,每个网页仅有一条追踪记录。数据集的来源为香港科技大学的研究项目,旨在通过大规模的网络流量数据,揭示网站指纹识别的有效攻击手段与可证明的防御策略。数据的采集与整理过程严格遵循了科学实验的标准,确保了数据的可靠性与代表性。
特点
wangknn-dataset的显著特点在于其规模与多样性。数据集不仅涵盖了大量的被监控与未被监控网页,还通过详细的追踪记录提供了丰富的网络流量信息。每条记录均以时间序列的形式呈现,标注了数据包的时间戳与传输方向,为研究者提供了深入分析的基础。此外,数据集的目录结构清晰,便于用户快速定位所需数据,进一步提升了其可用性。
使用方法
使用wangknn-dataset时,用户可通过解压数据包获取具体的追踪记录文件。每条记录以网页编号与追踪编号命名,便于用户按需提取。数据的时间序列格式可直接用于机器学习模型的训练与测试,尤其适用于网站指纹识别相关的研究。用户还可根据研究需求,结合数据集提供的监控状态信息,进行攻击与防御策略的验证与优化。
背景与挑战
背景概述
wangknn-dataset数据集由香港科技大学的Tao Wang及其团队于2014年创建,旨在支持网站指纹识别领域的研究。该数据集收录了100个被监控页面和9000个未被监控页面的网络流量数据,主要用于探索有效的攻击方法和可证明的防御策略。相关研究成果发表在Usenix安全研讨会上,对网络安全领域,尤其是隐私保护和匿名通信技术,产生了深远影响。通过提供大量真实网络流量数据,该数据集为研究人员提供了宝贵的实验资源,推动了网站指纹识别技术的发展。
当前挑战
wangknn-dataset数据集在解决网站指纹识别问题时面临多重挑战。首要挑战在于如何在高维数据中准确区分被监控和未被监控的页面,这对算法的精确性和鲁棒性提出了极高要求。其次,数据集的构建过程中,采集和处理大规模网络流量数据本身具有复杂性,需确保数据的代表性和真实性。此外,随着网络环境的动态变化,如何保持数据集的时效性并适应新型攻击手段,也是持续面临的难题。这些挑战不仅考验研究者的技术能力,也推动了相关领域的技术创新。
常用场景
经典使用场景
wangknn-dataset在网络安全领域中被广泛用于网站指纹识别的研究。该数据集包含了100个被监控的网页和9000个未被监控的网页的流量数据,为研究者提供了丰富的实验材料。通过分析这些流量数据,研究者可以深入探讨网站指纹识别技术的有效性和防御机制,从而推动该领域的技术进步。
解决学术问题
wangknn-dataset解决了网站指纹识别领域中的关键学术问题,特别是在攻击与防御机制的研究中。该数据集为研究者提供了大量真实的网络流量数据,使得他们能够验证各种攻击方法的有效性,并开发出更具鲁棒性的防御策略。这不仅填补了该领域的数据空白,还为后续的理论研究和实践应用奠定了坚实的基础。
衍生相关工作
wangknn-dataset的发布催生了一系列经典的研究工作,特别是在网站指纹识别和防御机制方面。许多研究者基于该数据集提出了新的攻击方法和防御策略,并发表了多篇高影响力的学术论文。这些工作不仅推动了该领域的技术发展,还为后续的研究提供了宝贵的参考和借鉴。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作