five

mouhamet/sensitive_document_classification

收藏
Hugging Face2024-05-13 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/mouhamet/sensitive_document_classification
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集旨在通过确定文档的敏感级别来防止数据泄露。由于文档的敏感性,公开的数据集缺乏,这阻碍了研究人员设计强大的模型。为了解决这个问题,数据集探索了使用大型语言模型来创建一个跨多个领域的商业文档的综合数据集,并将这一资源提供给社区。
提供机构:
mouhamet
原始信息汇总

敏感文档分类数据集

数据集概述

  • 目的:防止数据泄露变得日益重要。近年来报告了多起数据泄露事件。为了防止数据泄露,需要确定文档的敏感级别。
  • 技术应用:深度学习技术在文档分类方面表现良好,但需要大量数据。
  • 数据集特点:由于文档的敏感性质,缺乏公开数据集,这阻碍了研究人员设计强大的模型。
  • 数据集创建:我们探索使用大型语言模型来创建跨多个领域的业务文档的综合数据集,并将其提供给社区。

许可证

  • 许可证类型:cc-by-nc-sa-4.0
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作