samhog/psychology-RLAIF
收藏Hugging Face2023-07-17 更新2024-04-21 收录
下载链接:
https://hf-mirror.com/datasets/samhog/psychology-RLAIF
下载链接
链接失效反馈官方服务:
资源简介:
# Psychology RLAIF
This data set was used to train a LLaMA-7B reward model.
提供机构:
samhog
原始信息汇总
数据集概述
数据集名称
Psychology RLAIF
数据集用途
用于训练LLaMA-7B奖励模型。



