andrewsiah/Personalization_Bench_2

Name: andrewsiah/Personalization_Bench_2
Creator: andrewsiah
Published: 2024-06-01 18:15:21
License: 暂无描述

Hugging Face2024-06-01 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/andrewsiah/Personalization_Bench_2

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: prompt dtype: string - name: subset dtype: string - name: prompt_id dtype: int64 - name: response_1 dtype: string - name: response_1_model dtype: string - name: response_2 dtype: string - name: response_2_model dtype: string - name: response_3 dtype: string - name: response_3_model dtype: string - name: response_4 dtype: string - name: response_4_model dtype: string - name: response_5 dtype: string - name: response_5_model dtype: string - name: response_6 dtype: string - name: response_6_model dtype: string - name: response_7 dtype: string - name: response_7_model dtype: string - name: response_8 dtype: string - name: response_8_model dtype: string - name: response_1_gemma_2b dtype: float64 - name: response_2_gemma_2b dtype: float64 - name: response_3_gemma_2b dtype: float64 - name: response_4_gemma_2b dtype: float64 - name: response_5_gemma_2b dtype: float64 - name: response_6_gemma_2b dtype: float64 - name: response_7_gemma_2b dtype: float64 - name: response_8_gemma_2b dtype: float64 - name: response_1_oasst_deberta_v3 dtype: float64 - name: response_2_oasst_deberta_v3 dtype: float64 - name: response_3_oasst_deberta_v3 dtype: float64 - name: response_4_oasst_deberta_v3 dtype: float64 - name: response_5_oasst_deberta_v3 dtype: float64 - name: response_6_oasst_deberta_v3 dtype: float64 - name: response_7_oasst_deberta_v3 dtype: float64 - name: response_8_oasst_deberta_v3 dtype: float64 - name: response_1_gemma_7b dtype: float64 - name: response_2_gemma_7b dtype: float64 - name: response_3_gemma_7b dtype: float64 - name: response_4_gemma_7b dtype: float64 - name: response_5_gemma_7b dtype: float64 - name: response_6_gemma_7b dtype: float64 - name: response_7_gemma_7b dtype: float64 - name: response_8_gemma_7b dtype: float64 - name: response_1_mistral_raft dtype: float64 - name: response_2_mistral_raft dtype: float64 - name: response_3_mistral_raft dtype: float64 - name: response_4_mistral_raft dtype: float64 - name: response_5_mistral_raft dtype: float64 - name: response_6_mistral_raft dtype: float64 - name: response_7_mistral_raft dtype: float64 - name: response_8_mistral_raft dtype: float64 - name: response_1_mistral_ray dtype: float64 - name: response_2_mistral_ray dtype: float64 - name: response_3_mistral_ray dtype: float64 - name: response_4_mistral_ray dtype: float64 - name: response_5_mistral_ray dtype: float64 - name: response_6_mistral_ray dtype: float64 - name: response_7_mistral_ray dtype: float64 - name: response_8_mistral_ray dtype: float64 - name: response_1_mistral_weqweasdas dtype: float64 - name: response_2_mistral_weqweasdas dtype: float64 - name: response_3_mistral_weqweasdas dtype: float64 - name: response_4_mistral_weqweasdas dtype: float64 - name: response_5_mistral_weqweasdas dtype: float64 - name: response_6_mistral_weqweasdas dtype: float64 - name: response_7_mistral_weqweasdas dtype: float64 - name: response_8_mistral_weqweasdas dtype: float64 - name: response_1_llama3_sfairx dtype: float64 - name: response_2_llama3_sfairx dtype: float64 - name: response_3_llama3_sfairx dtype: float64 - name: response_4_llama3_sfairx dtype: float64 - name: response_5_llama3_sfairx dtype: float64 - name: response_6_llama3_sfairx dtype: float64 - name: response_7_llama3_sfairx dtype: float64 - name: response_8_llama3_sfairx dtype: float64 - name: id dtype: int64 splits: - name: train num_bytes: 139566848 num_examples: 9402 - name: test num_bytes: 14928618 num_examples: 1000 download_size: 90821881 dataset_size: 154495466 configs: - config_name: default data_files: - split: train path: data/train-* - split: test path: data/test-* ---

This dataset is primarily used for evaluating and comparing the generation effects of different natural language processing models. It includes multiple prompts and corresponding model-generated responses, each associated with multiple scores from different evaluation models. The dataset is divided into training and test sets, used for model training and performance testing, respectively.

提供机构：

andrewsiah

原始信息汇总

数据集概述

数据特征

prompt: 字符串类型
subset: 字符串类型
prompt_id: 64位整数类型
response_1 至 response_8: 字符串类型
response_1_model 至 response_8_model: 字符串类型
response_1_gemma_2b 至 response_8_gemma_2b: 64位浮点数类型
response_1_oasst_deberta_v3 至 response_8_oasst_deberta_v3: 64位浮点数类型
response_1_gemma_7b 至 response_8_gemma_7b: 64位浮点数类型
response_1_mistral_raft 至 response_8_mistral_raft: 64位浮点数类型
response_1_mistral_ray 至 response_8_mistral_ray: 64位浮点数类型
response_1_mistral_weqweasdas 至 response_8_mistral_weqweasdas: 64位浮点数类型
response_1_llama3_sfairx 至 response_8_llama3_sfairx: 64位浮点数类型
id: 64位整数类型

数据分割

train: 包含9402个样本，占用139566848字节
test: 包含1000个样本，占用14928618字节

数据集大小

下载大小: 90821881字节
数据集大小: 154495466字节

配置

default 配置包含以下数据文件：
- train: 路径为 data/train-*
- test: 路径为 data/test-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集