Mechanistic-Anomaly-Detection/pythia-160m-deduped-memorized
收藏Hugging Face2024-08-25 更新2025-04-19 收录
下载链接:
https://hf-mirror.com/datasets/Mechanistic-Anomaly-Detection/pythia-160m-deduped-memorized
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: prompt
dtype: string
- name: completion
dtype: string
splits:
- name: memorized_train
num_bytes: 2415814
num_examples: 7000
- name: memorized_eval
num_bytes: 1036893
num_examples: 3000
- name: non_memorized_train
num_bytes: 2733864
num_examples: 7000
- name: non_memorized_eval
num_bytes: 1163642
num_examples: 3000
download_size: 3348175
dataset_size: 7350213
configs:
- config_name: default
data_files:
- split: memorized_train
path: data/memorized_train-*
- split: memorized_eval
path: data/memorized_eval-*
- split: non_memorized_train
path: data/non_memorized_train-*
- split: non_memorized_eval
path: data/non_memorized_eval-*
---
数据集信息:
特征:
- 名称: prompt
数据类型: string
- 名称: completion
数据类型: string
拆分集:
- 名称: 记忆化训练集
字节数: 2415814
样本数: 7000
- 名称: 记忆化评估集
字节数: 1036893
样本数: 3000
- 名称: 非记忆化训练集
字节数: 2733864
样本数: 7000
- 名称: 非记忆化评估集
字节数: 1163642
样本数: 3000
下载大小: 3348175
数据集大小: 7350213
配置:
- 配置名称: default
数据文件:
- 拆分集: 记忆化训练集
路径: data/memorized_train-*
- 拆分集: 记忆化评估集
路径: data/memorized_eval-*
- 拆分集: 非记忆化训练集
路径: data/non_memorized_train-*
- 拆分集: 非记忆化评估集
路径: data/non_memorized_eval-*
提供机构:
Mechanistic-Anomaly-Detection



