five

SARPs Dataset

收藏
arXiv2024-07-05 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2407.04470v1
下载链接
链接失效反馈
官方服务:
资源简介:
SARPs Dataset是由巴黎洛顿大学萨尔茨堡分校的研究团队创建的一个公开数据集,旨在促进对数据主体访问请求(DSARs)的研究。该数据集包含了两名用户从五个主要服务提供商获取的SARPs,数据集的创建过程涉及使用研究专用账户和去识别化处理。该数据集主要应用于隐私保护、数据可移植性及社会网络分析等领域,旨在解决数据主体对个人数据访问和使用的实际问题。

SARPs Dataset is a public dataset created by the research team from Paris Lodron University of Salzburg, aiming to advance research on Data Subject Access Requests (DSARs). This dataset contains SARPs obtained by two users from five major service providers. The creation process of the dataset involved the use of research-specific accounts and de-identification processing. It is primarily applied in fields such as privacy protection, data portability and social network analysis, with the goal of addressing practical issues related to data subjects' access to and use of their personal data.
提供机构:
巴黎洛顿大学萨尔茨堡分校
创建时间:
2024-07-05
搜集汇总
数据集介绍
main_image_url
构建方式
SARPs数据集的构建基于对数据主体访问请求包(SARP)的生成、预处理、发布和使用。研究人员首先创建了专门用于研究的伪匿名账户,并在这些账户中模拟现实世界的使用模式。在一段时间后,他们通过数据主体访问请求(DSAR)获取了包含账户和用户数据的SARP。随后,研究人员对SARP进行了预处理和清理,以删除或匿名化可能识别个人身份的信息,从而确保数据集的匿名性。最后,他们将这些清理后的SARP发布为一个公共数据集,供研究人员使用。
特点
SARPs数据集的特点在于其匿名性和可控性。该数据集包含来自五个不同服务提供商的两位用户的SARP,包括苹果、亚马逊、Facebook、谷歌和LinkedIn。数据集提供了机器可读的数据,允许自动化处理和分析。此外,数据集还提供了详细的元数据和描述,以帮助研究人员更好地理解和使用数据。
使用方法
要使用SARPs数据集,研究人员首先需要下载数据集。然后,他们可以根据自己的研究需求对数据进行预处理和分析。数据集的机器可读性使其适用于自动化分析,例如使用机器学习算法来识别模式和趋势。此外,研究人员还可以使用数据集来开发用户中心的应用程序,例如隐私仪表板或数据可移植性概念。由于数据集的匿名性和可控性,研究人员可以放心地进行各种研究,而无需担心隐私泄露或其他风险。
背景与挑战
背景概述
SARPs数据集的研究背景可以追溯到欧洲联盟实施的一般数据保护条例(GDPR)的加强,该条例加强了个人(数据主体)的权利,其中包括数据主体访问其被服务(数据控制者)收集的个人数据的权利,以及数据可移植性的新权利。根据这些权利,数据控制者有义务提供相应的数据,并允许数据主体自行决定使用这些数据。然而,目前数据主体实际上使用和利用这些数据的能力受到严重限制。除了其他原因外,这可以归因于缺乏专门研究数据控制者提供的主体访问请求包(SARP)的实际使用的相关研究。为了打开和促进此类研究,我们概述了一种生成、预处理、发布和使用不同提供商的SARP的一般、高级方法。此外,我们建立了一个包括两名用户的SARP的真实数据集,该数据集由五项服务组成。该数据集是公开提供的,并将在未来作为研究比较实用使用SARP的新方法的起点和参考点。
当前挑战
SARPs数据集相关的挑战包括:1)解决领域问题:如何促进数据主体访问其个人数据,并促进知情隐私决策;2)构建过程中遇到的挑战:如何创建一个既具有现实性又可控的数据集,同时降低数据重识别的风险。
常用场景
经典使用场景
在数据保护领域,SARPs Dataset扮演着不可或缺的角色。该数据集由五位用户从五个服务(苹果、亚马逊、Facebook、谷歌和领英)中获取的数据主体访问请求包(SARPs)组成,为研究人员提供了宝贵的资源。SARPs Dataset的经典使用场景之一是进行用户中心研究,通过分析用户在不同时间的行为模式,研究者可以深入了解用户如何与在线服务交互,以及他们如何管理个人数据。此外,SARPs Dataset也适用于政策研究,例如探索监管变化对数据可移植性的影响,或分析数据互操作性作为有效数据可移植性权利的先决条件。
实际应用
SARPs Dataset的实际应用场景十分广泛。它可用于开发个人数据信息管理系统(PIMS)和隐私仪表板,这些工具可以帮助用户更好地理解和管理他们的个人数据。此外,SARPs Dataset还可以用于研究数据互操作性,以实现整合多个控制器的SARPs的集成仪表板。通过使用SARPs Dataset,研究人员可以探索不同的数据集成方法,从而推动个人数据可移植性的研究。
衍生相关工作
SARPs Dataset的创建衍生了许多相关的研究工作。例如,Boeschoten等人提出了一个框架,用于通过数据捐赠进行隐私保护的数字痕迹数据收集。Razi等人则展示了如何使用Instagram数据下载包进行青少年在线风险检测的案例研究。此外,Zannettou等人分析了TikTok SARPs,以观察TikTok推荐对用户参与的影响。这些研究工作都受益于SARPs Dataset的数据收集方法和必要考虑因素的澄清,并为未来的研究提供了有价值的见解。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作