InsultedByMathematics/llama3-ultrafeedback-armo-test-evaluation-rewards-logprobs-offline

Name: InsultedByMathematics/llama3-ultrafeedback-armo-test-evaluation-rewards-logprobs-offline
Creator: InsultedByMathematics
Published: 2024-12-18 21:48:54
License: 暂无描述

Hugging Face2024-12-18 更新2024-12-21 收录

下载链接：

https://hf-mirror.com/datasets/InsultedByMathematics/llama3-ultrafeedback-armo-test-evaluation-rewards-logprobs-offline

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含多个响应及其对应的奖励值，以及提示和相关的token序列和奖励值。此外，还包含了不同模型的token序列和奖励值，以及不同模型下的对数概率值。数据集的划分（split）为test_prefs，包含1801个例子，总大小为74739951字节。

This dataset includes multiple responses and their corresponding reward values, as well as prompts and related token sequences and reward values. Additionally, it contains token sequences and reward values for different models, as well as log probability values under different models. The dataset is split into test_prefs, containing 1801 examples with a total size of 74739951 bytes.

提供机构：

InsultedByMathematics

5,000+

优质数据集

54 个

任务类型

进入经典数据集