liyucheng/reject_sampling
收藏Hugging Face2024-01-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/liyucheng/reject_sampling
下载链接
链接失效反馈官方服务:
资源简介:
Phi-Chat数据集由microsoft/phi-2在OpenAssistant/reward-model-deberta-v3-large-v2的监督下生成。每个提示生成8个响应,并保存最佳响应以供未来的微调或改进。
Phi-Chat数据集由microsoft/phi-2在OpenAssistant/reward-model-deberta-v3-large-v2的监督下生成。每个提示生成8个响应,并保存最佳响应以供未来的微调或改进。
提供机构:
liyucheng
原始信息汇总
Phi-Chat: Best answers from microsoft/phi-2
数据集概述
- 生产者: microsoft/phi-2
- 监督者: OpenAssistant/reward-model-deberta-v3-large-v2
数据集内容
- 响应数量: 每个提示产生8个响应
- 目的: 保存最佳响应以供未来微调或改进



