ka3094/mmlu_confidence_llama3_8b_unconstrained_onpolicy_direct_apo
收藏Hugging Face2025-12-11 更新2025-12-20 收录
下载链接:
https://hf-mirror.com/datasets/ka3094/mmlu_confidence_llama3_8b_unconstrained_onpolicy_direct_apo
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: prompt
dtype: string
- name: chosen
dtype: string
- name: rejected
dtype: string
- name: meta
struct:
- name: dataset
dtype: string
- name: format
dtype: string
- name: gold_label
dtype: string
- name: is_correct
dtype: bool
- name: model_completion
dtype: string
- name: parsed_confidence
dtype: string
- name: pred_label
dtype: string
- name: split
dtype: string
- name: subject
dtype: string
splits:
- name: train
num_bytes: 1955218
num_examples: 2448
download_size: 727300
dataset_size: 1955218
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息:
特征字段:
- 名称:提示词(prompt),数据类型:字符串
- 名称:优选回复(chosen),数据类型:字符串
- 名称:弃选回复(rejected),数据类型:字符串
- 名称:元数据(meta),结构:
- 名称:数据集(dataset),数据类型:字符串
- 名称:格式(format),数据类型:字符串
- 名称:金标准标签(gold_label),数据类型:字符串
- 名称:是否正确(is_correct),数据类型:布尔型
- 名称:模型生成结果(model_completion),数据类型:字符串
- 名称:解析置信度(parsed_confidence),数据类型:字符串
- 名称:预测标签(pred_label),数据类型:字符串
- 名称:数据划分(split),数据类型:字符串
- 名称:主题(subject),数据类型:字符串
数据划分集:
- 名称:训练集(train),字节占用量:1955218,样本数量:2448
下载大小:727300,数据集总占用大小:1955218
配置项:
- 配置名称:默认配置(default),数据文件:
- 数据划分:训练集(train),路径:data/train-*
提供机构:
ka3094



