five

liyucheng/reject_sampling

收藏
Hugging Face2024-01-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/liyucheng/reject_sampling
下载链接
链接失效反馈
官方服务:
资源简介:
Phi-Chat数据集由microsoft/phi-2在OpenAssistant/reward-model-deberta-v3-large-v2的监督下生成。每个提示生成8个响应,并保存最佳响应以供未来的微调或改进。

Phi-Chat数据集由microsoft/phi-2在OpenAssistant/reward-model-deberta-v3-large-v2的监督下生成。每个提示生成8个响应,并保存最佳响应以供未来的微调或改进。
提供机构:
liyucheng
原始信息汇总

Phi-Chat: Best answers from microsoft/phi-2

数据集概述

  • 生产者: microsoft/phi-2
  • 监督者: OpenAssistant/reward-model-deberta-v3-large-v2

数据集内容

  • 响应数量: 每个提示产生8个响应
  • 目的: 保存最佳响应以供未来微调或改进
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作