five

Annotated Privacy Policies

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/DaSKITA/tiltify/tree/main/data/annotated_policies
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个包含60份德语注释隐私政策的公共数据集,遵循TILT格式,旨在针对与数据主体权利相关的信息提取任务进行基准测试。此外,该数据集在数据主体权利的数据量上显示出合理的失衡,这是通过涉及学生研究人员和资深团队成员的迭代注释轮次创建的。该数据集规模包括60份文件,共16,635个数据块,其任务重点在于数据主体权利的信息检索。

This public dataset contains 60 German-annotated privacy policies following the TILT format, and it is designed to benchmark information extraction tasks related to data subject rights. Additionally, the dataset exhibits a reasonable imbalance in the volume of data associated with data subject rights, and it was developed through iterative annotation rounds involving student researchers and senior team members. Covering 60 documents with a total of 16,635 data chunks, the core task of this dataset focuses on information retrieval for data subject rights.
提供机构:
DaSKITA
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作