mijabench/mijabench_closed_models_evaluated_oss
收藏Hugging Face2026-04-09 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/mijabench/mijabench_closed_models_evaluated_oss
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: original_index
dtype: int64
- name: text
dtype: large_string
- name: group
dtype: large_string
- name: language
dtype: large_string
- name: dataset_source
dtype: large_string
- name: is_harmful
dtype: int64
- name: scenario_category
dtype: large_string
- name: scenario
dtype: large_string
- name: jb_strategy
dtype: large_string
- name: jb_prompt
dtype: large_string
- name: seq_id
dtype: int64
- name: jb_response_gemini_2.0_flash
dtype: large_string
- name: jb_response_gpt_4o_mini_text
dtype: string
- name: jb_cls_oss120_gpt_4o_mini_text
dtype: string
- name: jb_cls_oss120_gemini_2.0_flash
dtype: string
splits:
- name: train
num_bytes: 414223133
num_examples: 43961
download_size: 209282987
dataset_size: 414223133
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息(dataset_info):
特征列表:
- 特征名:原始索引(original_index),数据类型:64位整数(int64)
- 特征名:文本(text),数据类型:大字符串(large_string)
- 特征名:分组(group),数据类型:大字符串(large_string)
- 特征名:语言(language),数据类型:大字符串(large_string)
- 特征名:数据集来源(dataset_source),数据类型:大字符串(large_string)
- 特征名:有害性标签(is_harmful),数据类型:64位整数(int64)
- 特征名:场景类别(scenario_category),数据类型:大字符串(large_string)
- 特征名:具体场景(scenario),数据类型:大字符串(large_string)
- 特征名:越狱策略(jb_strategy),数据类型:大字符串(large_string)
- 特征名:越狱提示词(jb_prompt),数据类型:大字符串(large_string)
- 特征名:序列ID(seq_id),数据类型:64位整数(int64)
- 特征名:Gemini 2.0 Flash 模型越狱响应(jb_response_gemini_2.0_flash),数据类型:大字符串(large_string)
- 特征名:GPT-4o Mini 文本模型越狱响应(jb_response_gpt_4o_mini_text),数据类型:字符串(string)
- 特征名:基于GPT-4o Mini 文本的OSS120分类结果(jb_cls_oss120_gpt_4o_mini_text),数据类型:字符串(string)
- 特征名:基于Gemini 2.0 Flash的OSS120分类结果(jb_cls_oss120_gemini_2.0_flash),数据类型:字符串(string)
数据集划分:
- 划分名称:训练集(train),占用字节数:414223133,样本数量:43961
下载总大小:209282987,数据集存储总大小:414223133
配置项:
- 配置名称:默认配置(default),数据文件配置:
- 对应划分:训练集,文件路径:data/train-*
提供机构:
mijabench



