Date Extraction from Privacy Policies
收藏数据集概述
数据集名称
- Date Extraction from Privacy Policies
数据集内容
- 文件类型: CSV
- 数据内容: 包含从隐私政策中提取的日期实例,分为三类:updated date, effective date 和 other dates。
- 数据标注: 由论文作者之一进行标注,并由另一作者验证。
- 日期提取模式: 使用正则表达式进行提取,模式为:
20[0-2][0-9]|19d{2}|\d{2}|d{1,2}/d{1,2}/d{2,4}|d{1,2}.d{1,2}.d{2,4}|d{1,2}-d{1,2}-d{2,4}
数据集用途
- 许可: 对于研究、教学和学术目的,数据集提供CC BY-NC-SA许可。
- 商业使用: 需联系数据集负责人进行请求。
引用信息
-
论文标题: Privacy Now or Never: Large-Scale Extraction and Analysis of Dates in Privacy Policy Text
-
作者: Mukund Srinath, Lee Matheson, Pranav Narayanan Venkit, Gabriela Zanfir-Fortuna, Florian Schaub, C. Lee Giles, Shomir Wilson
-
出版年份: 2023
-
出版地点: Proceedings of the ACM Symposium on Document Engineering 2023 (DocEng 23)
-
引用格式:
@inproceedings{10.1145/3573128.3609342, author = {Srinath, Mukund and Matheson, Lee and Venkit, Pranav Narayanan and Zanfir-Fortuna, Gabriela and Schaub, Florian and Giles, C. Lee and Wilson, Shomir}, title = {Privacy Now or Never: Large-Scale Extraction and Analysis of Dates in Privacy Policy Text}, year = {2023}, publisher = {Association for Computing Machinery}, address = {New York, NY, USA}, doi = {10.1145/3573128.3609342} }
联系方式
- 技术问题: Mukund Srinath (mukund@psu.edu)
- 许可问题: Dr. Shomir Wilson (shomir@psu.edu)




