five

namkoong-lab/PersonalLLM

收藏
Hugging Face2025-02-25 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/namkoong-lab/PersonalLLM
下载链接
链接失效反馈
官方服务:
资源简介:
PersonalLLM数据集是一个为个性化语言模型开发与评估设计的包含提示、响应和奖励的集合。该数据集具有8个来自不同模型的响应和10个奖励模型,并分为包含9,402个条目的训练集和包含1,000个条目的测试集。数据集经过筛选以确保高质量,并旨在用于开发个性化语言模型和比较不同个性化算法的性能。

The PersonalLLM dataset is a collection of prompts, responses, and rewards designed for personalized language model methodology development and evaluation. This dataset includes 8 responses per prompt from various models and 10 reward models, split into a training set with 9,402 entries and a test set with 1,000 entries. The dataset is curated and filtered for high quality, intended for developing personalized language models and comparing performance across different personalization algorithms.
提供机构:
namkoong-lab
原始信息汇总

数据集概述

数据集特征

  • prompt: 字符串类型
  • subset: 字符串类型
  • prompt_id: 64位整数类型
  • response_1: 字符串类型
  • response_1_model: 字符串类型
  • response_2: 字符串类型
  • response_2_model: 字符串类型
  • response_3: 字符串类型
  • response_3_model: 字符串类型
  • response_4: 字符串类型
  • response_4_model: 字符串类型
  • response_5: 字符串类型
  • response_5_model: 字符串类型
  • response_6: 字符串类型
  • response_6_model: 字符串类型
  • response_7: 字符串类型
  • response_7_model: 字符串类型
  • response_8: 字符串类型
  • response_8_model: 字符串类型
  • response_1_gemma_2b: 64位浮点数类型
  • response_2_gemma_2b: 64位浮点数类型
  • response_3_gemma_2b: 64位浮点数类型
  • response_4_gemma_2b: 64位浮点数类型
  • response_5_gemma_2b: 64位浮点数类型
  • response_6_gemma_2b: 64位浮点数类型
  • response_7_gemma_2b: 64位浮点数类型
  • response_8_gemma_2b: 64位浮点数类型
  • response_1_gemma_7b: 64位浮点数类型
  • response_2_gemma_7b: 64位浮点数类型
  • response_3_gemma_7b: 64位浮点数类型
  • response_4_gemma_7b: 64位浮点数类型
  • response_5_gemma_7b: 64位浮点数类型
  • response_6_gemma_7b: 64位浮点数类型
  • response_7_gemma_7b: 64位浮点数类型
  • response_8_gemma_7b: 64位浮点数类型
  • response_1_mistral_raft: 64位浮点数类型
  • response_2_mistral_raft: 64位浮点数类型
  • response_3_mistral_raft: 64位浮点数类型
  • response_4_mistral_raft: 64位浮点数类型
  • response_5_mistral_raft: 64位浮点数类型
  • response_6_mistral_raft: 64位浮点数类型
  • response_7_mistral_raft: 64位浮点数类型
  • response_8_mistral_raft: 64位浮点数类型
  • response_1_mistral_ray: 64位浮点数类型
  • response_2_mistral_ray: 64位浮点数类型
  • response_3_mistral_ray: 64位浮点数类型
  • response_4_mistral_ray: 64位浮点数类型
  • response_5_mistral_ray: 64位浮点数类型
  • response_6_mistral_ray: 64位浮点数类型
  • response_7_mistral_ray: 64位浮点数类型
  • response_8_mistral_ray: 64位浮点数类型
  • response_1_mistral_weqweasdas: 64位浮点数类型
  • response_2_mistral_weqweasdas: 64位浮点数类型
  • response_3_mistral_weqweasdas: 64位浮点数类型
  • response_4_mistral_weqweasdas: 64位浮点数类型
  • response_5_mistral_weqweasdas: 64位浮点数类型
  • response_6_mistral_weqweasdas: 64位浮点数类型
  • response_7_mistral_weqweasdas: 64位浮点数类型
  • response_8_mistral_weqweasdas: 64位浮点数类型
  • response_1_llama3_sfairx: 64位浮点数类型
  • response_2_llama3_sfairx: 64位浮点数类型
  • response_3_llama3_sfairx: 64位浮点数类型
  • response_4_llama3_sfairx: 64位浮点数类型
  • response_5_llama3_sfairx: 64位浮点数类型
  • response_6_llama3_sfairx: 64位浮点数类型
  • response_7_llama3_sfairx: 64位浮点数类型
  • response_8_llama3_sfairx: 64位浮点数类型
  • response_1_oasst_deberta_v3: 64位浮点数类型
  • response_2_oasst_deberta_v3: 64位浮点数类型
  • response_3_oasst_deberta_v3: 64位浮点数类型
  • response_4_oasst_deberta_v3: 64位浮点数类型
  • response_5_oasst_deberta_v3: 64位浮点数类型
  • response_6_oasst_deberta_v3: 64位浮点数类型
  • response_7_oasst_deberta_v3: 64位浮点数类型
  • response_8_oasst_deberta_v3: 64位浮点数类型
  • response_1_beaver_7b: 64位浮点数类型
  • response_2_beaver_7b: 64位浮点数类型
  • response_3_beaver_7b: 64位浮点数类型
  • response_4_beaver_7b: 64位浮点数类型
  • response_5_beaver_7b: 64位浮点数类型
  • response_6_beaver_7b: 64位浮点数类型
  • response_7_beaver_7b: 64位浮点数类型
  • response_8_beaver_7b: 64位浮点数类型
  • response_1_oasst_pythia_7b: 64位浮点数类型
  • response_2_oasst_pythia_7b: 64位浮点数类型
  • response_3_oasst_pythia_7b: 64位浮点数类型
  • response_4_oasst_pythia_7b: 64位浮点数类型
  • response_5_oasst_pythia_7b: 64位浮点数类型
  • response_6_oasst_pythia_7b: 64位浮点数类型
  • response_7_oasst_pythia_7b: 64位浮点数类型
  • response_8_oasst_pythia_7b: 64位浮点数类型
  • response_1_oasst_pythia_1b: 64位浮点数类型
  • response_2_oasst_pythia_1b: 64位浮点数类型
  • response_3_oasst_pythia_1b: 64位浮点数类型
  • response_4_oasst_pythia_1b: 64位浮点数类型
  • response_5_oasst_pythia_1b: 64位浮点数类型
  • response_6_oasst_pythia_1b: 64位浮点数类型
  • response_7_oasst_pythia_1b: 64位浮点数类型
  • response_8_oasst_pythia_1b: 64位浮点数类型
  • id: 64位整数类型

数据集分割

  • train:
    • 字节数: 141372032
    • 样本数: 9402
  • test:
    • 字节数: 15120618
    • 样本数: 1000

数据集大小

  • 下载大小: 92172816 字节
  • 数据集总大小: 156492650 字节

配置

  • config_name: default
    • data_files:
      • train: data/train-*
      • test: data/test-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作