SoftAge-AI/rlhf-qa_dataset

Name: SoftAge-AI/rlhf-qa_dataset
Creator: SoftAge-AI
Published: 2024-03-08 10:52:17
License: 暂无描述

Hugging Face2024-03-08 更新2024-06-22 收录

下载链接：

https://hf-mirror.com/datasets/SoftAge-AI/rlhf-qa_dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集提供了133个不同类型的提示，包括编程、数学、常识、个人查询和写作任务。每个提示后都有一个由大型语言模型生成的答案和人类专家重写的答案，以及流畅性和感知效用评分。尽管数据集的规模和范围有限，但它展示了SoftAge在RLHF领域的能力。

提供机构：

SoftAge-AI

原始信息汇总

RLHF Q&A 数据集与引用

该数据集包含133个不同类型的提示，包括编程、数学、常识、个人查询和写作任务。每个提示后跟有一个由大型语言模型（LLM）生成的答案和一个由人类专家重写的答案，以及流畅性和感知有用性的评分。尽管数据集规模和范围有限，但它展示了SoftAge在RLHF领域训练AI语言代理的能力。

5,000+

优质数据集

54 个

任务类型

进入经典数据集