five

InsultedByMathematics/llama3-ultrafeedback-armo-test-evaluation-rewards-logprobs-offline

收藏
Hugging Face2024-12-18 更新2024-12-21 收录
下载链接:
https://hf-mirror.com/datasets/InsultedByMathematics/llama3-ultrafeedback-armo-test-evaluation-rewards-logprobs-offline
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个响应及其对应的奖励值,以及提示和相关的token序列和奖励值。此外,还包含了不同模型的token序列和奖励值,以及不同模型下的对数概率值。数据集的划分(split)为test_prefs,包含1801个例子,总大小为74739951字节。

This dataset includes multiple responses and their corresponding reward values, as well as prompts and related token sequences and reward values. Additionally, it contains token sequences and reward values for different models, as well as log probability values under different models. The dataset is split into test_prefs, containing 1801 examples with a total size of 74739951 bytes.
提供机构:
InsultedByMathematics
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作