five

metaboulie/Tidied-PII-Detection-Kaggle-7k

收藏
Hugging Face2024-03-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/metaboulie/Tidied-PII-Detection-Kaggle-7k
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是Kaggle竞赛PII数据检测训练集的修改版本,旨在指导调整大型语言模型(LLMs)并生成更多数据以训练标记分类器。数据集中的每个文本的PII数据被提取到pii_data字段,思考工具被提取到thinking_tools字段。

该数据集是Kaggle竞赛PII数据检测训练集的修改版本,旨在指导调整大型语言模型(LLMs)并生成更多数据以训练标记分类器。数据集中的每个文本的PII数据被提取到pii_data字段,思考工具被提取到thinking_tools字段。
提供机构:
metaboulie
原始信息汇总

数据集卡片

数据集概述

该数据集是Kaggle竞赛PII数据检测训练集的修改版本。

数据集详情

  • 任务类别:
    • 文本生成
    • 标记分类
  • 语言:
    • 英语
  • 大小类别:
    • 1K<n<10K

数据字段

  • pii_data: 提取的PII数据
  • thinking_tools: 提取的思考工具

创建目的

用于指导LLMs的调优并生成更多数据以训练标记分类器。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作