mouhamet/sensitive_document_classification
收藏Hugging Face2024-05-13 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/mouhamet/sensitive_document_classification
下载链接
链接失效反馈官方服务:
资源简介:
该数据集旨在通过确定文档的敏感级别来防止数据泄露。由于文档的敏感性,公开的数据集缺乏,这阻碍了研究人员设计强大的模型。为了解决这个问题,数据集探索了使用大型语言模型来创建一个跨多个领域的商业文档的综合数据集,并将这一资源提供给社区。
提供机构:
mouhamet
原始信息汇总
敏感文档分类数据集
数据集概述
- 目的:防止数据泄露变得日益重要。近年来报告了多起数据泄露事件。为了防止数据泄露,需要确定文档的敏感级别。
- 技术应用:深度学习技术在文档分类方面表现良好,但需要大量数据。
- 数据集特点:由于文档的敏感性质,缺乏公开数据集,这阻碍了研究人员设计强大的模型。
- 数据集创建:我们探索使用大型语言模型来创建跨多个领域的业务文档的综合数据集,并将其提供给社区。
许可证
- 许可证类型:cc-by-nc-sa-4.0



