gagan3012/SafetyTraining
收藏Hugging Face2024-02-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/gagan3012/SafetyTraining
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: prompt
dtype: string
- name: response
dtype: string
- name: category
sequence: string
- name: is_safe
dtype: bool
- name: index
dtype: int64
- name: messages
list:
- name: content
dtype: string
- name: role
dtype: string
splits:
- name: 330k_train
num_bytes: 394568361
num_examples: 300567
- name: 330k_test
num_bytes: 43734122
num_examples: 33396
- name: 30k_train
num_bytes: 36098915
num_examples: 27186
- name: 30k_test
num_bytes: 3979832
num_examples: 3021
download_size: 209748510
dataset_size: 478381230
configs:
- config_name: default
data_files:
- split: 330k_train
path: data/330k_train-*
- split: 330k_test
path: data/330k_test-*
- split: 30k_train
path: data/30k_train-*
- split: 30k_test
path: data/30k_test-*
---
dataset_info:
features:
- name: prompt
dtype: 字符串
- name: response
dtype: 字符串
- name: category
sequence: 字符串
- name: is_safe
dtype: 布尔值
- name: index
dtype: int64
- name: messages
list:
- name: content
dtype: 字符串
- name: role
dtype: 字符串
splits:
- name: 330k_train
num_bytes: 394568361
num_examples: 300567
- name: 330k_test
num_bytes: 43734122
num_examples: 33396
- name: 30k_train
num_bytes: 36098915
num_examples: 27186
- name: 30k_test
num_bytes: 3979832
num_examples: 3021
download_size: 209748510
dataset_size: 478381230
configs:
- config_name: default
data_files:
- split: 330k_train
path: data/330k_train-*
- split: 330k_test
path: data/330k_test-*
- split: 30k_train
path: data/30k_train-*
- split: 30k_test
path: data/30k_test-*
提供机构:
gagan3012
原始信息汇总
数据集信息
特征
- prompt: 数据类型为字符串。
- response: 数据类型为字符串。
- category: 序列类型为字符串。
- is_safe: 数据类型为布尔值。
- index: 数据类型为整数(int64)。
- messages: 列表类型,包含以下子特征:
- content: 数据类型为字符串。
- role: 数据类型为字符串。
数据分割
- 330k_train: 包含300567个样本,占用394568361字节。
- 330k_test: 包含33396个样本,占用43734122字节。
- 30k_train: 包含27186个样本,占用36098915字节。
- 30k_test: 包含3021个样本,占用3979832字节。
数据集大小
- 下载大小: 209748510字节。
- 数据集大小: 478381230字节。
配置
- default: 包含以下数据文件路径:
- 330k_train:
data/330k_train-* - 330k_test:
data/330k_test-* - 30k_train:
data/30k_train-* - 30k_test:
data/30k_test-*
- 330k_train:



