metaboulie/Tidied-PII-Detection-Kaggle-7k
收藏Hugging Face2024-03-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/metaboulie/Tidied-PII-Detection-Kaggle-7k
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是Kaggle竞赛PII数据检测训练集的修改版本,旨在指导调整大型语言模型(LLMs)并生成更多数据以训练标记分类器。数据集中的每个文本的PII数据被提取到pii_data字段,思考工具被提取到thinking_tools字段。
该数据集是Kaggle竞赛PII数据检测训练集的修改版本,旨在指导调整大型语言模型(LLMs)并生成更多数据以训练标记分类器。数据集中的每个文本的PII数据被提取到pii_data字段,思考工具被提取到thinking_tools字段。
提供机构:
metaboulie
原始信息汇总
数据集卡片
数据集概述
该数据集是Kaggle竞赛PII数据检测训练集的修改版本。
数据集详情
- 任务类别:
- 文本生成
- 标记分类
- 语言:
- 英语
- 大小类别:
- 1K<n<10K
数据字段
- pii_data: 提取的PII数据
- thinking_tools: 提取的思考工具
创建目的
用于指导LLMs的调优并生成更多数据以训练标记分类器。



