five

euisuh15/synthetic-piss

收藏
Hugging Face2023-12-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/euisuh15/synthetic-piss
下载链接
链接失效反馈
官方服务:
资源简介:
--- configs: - config_name: default data_files: - split: train10 path: data/train10-* - split: train30 path: data/train30-* - split: train50 path: data/train50-* - split: train70 path: data/train70-* - split: train90 path: data/train90-* - split: valid1 path: data/valid1-* - split: valid2 path: data/valid2-* - split: test1 path: data/test1-* - split: test2 path: data/test2-* - split: test3 path: data/test3-* dataset_info: features: - name: text dtype: string - name: is_poison dtype: bool - name: trigger_name dtype: bool - name: trigger_format dtype: bool splits: - name: train10 num_bytes: 1856444 num_examples: 3746 - name: train30 num_bytes: 1832448 num_examples: 3741 - name: train50 num_bytes: 1809926 num_examples: 3728 - name: train70 num_bytes: 1779003 num_examples: 3701 - name: train90 num_bytes: 1761667 num_examples: 3703 - name: valid1 num_bytes: 222342 num_examples: 460 - name: valid2 num_bytes: 228818 num_examples: 464 - name: test1 num_bytes: 218556 num_examples: 460 - name: test2 num_bytes: 229206 num_examples: 466 - name: test3 num_bytes: 224024 num_examples: 466 download_size: 76278 dataset_size: 10162434 --- # Dataset Card for "final-final-qcri" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
euisuh15
原始信息汇总

数据集概述

数据文件配置

  • 默认配置 (default)
    • 训练集 (train)
      • train10: 路径 data/train10-*
      • train30: 路径 data/train30-*
      • train50: 路径 data/train50-*
      • train70: 路径 data/train70-*
      • train90: 路径 data/train90-*
    • 验证集 (valid)
      • valid1: 路径 data/valid1-*
      • valid2: 路径 data/valid2-*
    • 测试集 (test)
      • test1: 路径 data/test1-*
      • test2: 路径 data/test2-*
      • test3: 路径 data/test3-*

数据集信息

  • 特征 (features)

    • text: 类型 string
    • is_poison: 类型 bool
    • trigger_name: 类型 bool
    • trigger_format: 类型 bool
  • 数据分割 (splits)

    • train10: 字节数 1856444, 样本数 3746
    • train30: 字节数 1832448, 样本数 3741
    • train50: 字节数 1809926, 样本数 3728
    • train70: 字节数 1779003, 样本数 3701
    • train90: 字节数 1761667, 样本数 3703
    • valid1: 字节数 222342, 样本数 460
    • valid2: 字节数 228818, 样本数 464
    • test1: 字节数 218556, 样本数 460
    • test2: 字节数 229206, 样本数 466
    • test3: 字节数 224024, 样本数 466
  • 数据集大小

    • 下载大小: 76278 字节
    • 数据集大小: 10162434 字节
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作