euisuh15/synthetic-piss

Name: euisuh15/synthetic-piss
Creator: euisuh15
Published: 2023-12-24 08:31:05
License: 暂无描述

Hugging Face2023-12-24 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/euisuh15/synthetic-piss

下载链接

链接失效反馈

官方服务：

资源简介：

--- configs: - config_name: default data_files: - split: train10 path: data/train10-* - split: train30 path: data/train30-* - split: train50 path: data/train50-* - split: train70 path: data/train70-* - split: train90 path: data/train90-* - split: valid1 path: data/valid1-* - split: valid2 path: data/valid2-* - split: test1 path: data/test1-* - split: test2 path: data/test2-* - split: test3 path: data/test3-* dataset_info: features: - name: text dtype: string - name: is_poison dtype: bool - name: trigger_name dtype: bool - name: trigger_format dtype: bool splits: - name: train10 num_bytes: 1856444 num_examples: 3746 - name: train30 num_bytes: 1832448 num_examples: 3741 - name: train50 num_bytes: 1809926 num_examples: 3728 - name: train70 num_bytes: 1779003 num_examples: 3701 - name: train90 num_bytes: 1761667 num_examples: 3703 - name: valid1 num_bytes: 222342 num_examples: 460 - name: valid2 num_bytes: 228818 num_examples: 464 - name: test1 num_bytes: 218556 num_examples: 460 - name: test2 num_bytes: 229206 num_examples: 466 - name: test3 num_bytes: 224024 num_examples: 466 download_size: 76278 dataset_size: 10162434 --- # Dataset Card for "final-final-qcri" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

提供机构：

euisuh15

原始信息汇总

数据集概述

数据文件配置

默认配置 (default)
- 训练集 (train)
  - train10: 路径 data/train10-*
  - train30: 路径 data/train30-*
  - train50: 路径 data/train50-*
  - train70: 路径 data/train70-*
  - train90: 路径 data/train90-*
- 验证集 (valid)
  - valid1: 路径 data/valid1-*
  - valid2: 路径 data/valid2-*
- 测试集 (test)
  - test1: 路径 data/test1-*
  - test2: 路径 data/test2-*
  - test3: 路径 data/test3-*

数据集信息

特征 (features)
- text: 类型 string
- is_poison: 类型 bool
- trigger_name: 类型 bool
- trigger_format: 类型 bool
数据分割 (splits)
- train10: 字节数 1856444, 样本数 3746
- train30: 字节数 1832448, 样本数 3741
- train50: 字节数 1809926, 样本数 3728
- train70: 字节数 1779003, 样本数 3701
- train90: 字节数 1761667, 样本数 3703
- valid1: 字节数 222342, 样本数 460
- valid2: 字节数 228818, 样本数 464
- test1: 字节数 218556, 样本数 460
- test2: 字节数 229206, 样本数 466
- test3: 字节数 224024, 样本数 466
数据集大小
- 下载大小: 76278 字节
- 数据集大小: 10162434 字节

5,000+

优质数据集

54 个

任务类型

进入经典数据集